/
Текст
Общая теория
оптимальных
алгоритмов
ACM Monogtaph Series
Published under the auspices of the
Association for Computing Machinery Inc.
Editor: Thomas A. Standish, University of California at Irvine
A General Theory
of Optimal Algorithms
Joe Fred TRAUB
Departments of Computer Science
and Mathematics
Columbia University-
New York- New York
Henryk WOZNIAKOWSKI
Institute of Informatics
University of Warsaw
Warsaw, Poland
1980
ACADEMIC PRESS
A Subsidiary of Harcourt Brace Jovanovich, Publishers
New York London Toronto Sydney San Francisco
Дж. Трауб
X. Вожьняковскии
Общая
теория
оптимальных
алгоритмов
Перевод с английского
А.Г. Сухарева
лод редакцией
Н.С. Бахвалова
Москва-Мир
1983
ББК 22.12
Т65
УДК 681.142.2
Трауб Дж., Вожьняковский X.
Общая теория оптимальных алгоритмов: Пер. с англ.— М.:
Мир, 1983.—382 с, ил.
Монография по общей теории оптимальных методов решения
задач, написанная американским и польским математиками.
Отражает современное состояние этой новой быстро развивающейся
области науки. Формулируется много открытых проблем.
Аннотированная библиография содержит свыше 300 наименований.
Для специалистов по вычислительной математике,
математическому обеспечению ЭВМ. Доступна аспирантам и студентам
университетов.
Редакция литературы по математическим наукам
by Academic
^30_83} ц { @ т^ by Academic Press> Inc>
U4i(uij—&} (g Перевод на русский язык, «Мир», 1983
ОТ РЕДАКТОРА ПЕРЕВОДА
И ПЕРЕВОДЧИКА
Предлагаемая вниманию читателя книга базируется на
исследованиях различных авторов по определению эффективности
вычислительных алгоритмов и построению оптимальных
алгоритмов, которые проводились в последние три десятилетия. Развитие
данного направления было инициировано основополагающими
работами А. Н. Колмогорова, С. М. Никольского, А. Сарда, Дж. Ки-
фера конца сороковых—начала пятидесятых годов, а уже в конце
пятидесятых годов появилась первая монография, в которой, для
одной из задач, систематически изучались оптимальные
алгоритмы решения (Витушкин А. Г. Оценка сложности задач
табулирования.—М.: Физматгиз, 1959).
Важный вклад в теорию оптимальных алгоритмов внесли
авторы настоящей книги. В частности, следует отметить вышедшую
в 1964 г. монографию Дж. Трауба об оптимальных
итерационных методах решения уравнений и систем уравнений (см.
литературу к части С).
Настоящая книга несколько неоднородна по способу подачи
материала. Часть ее посвящена систематическому изложению
общих результатов (известных и новых) по проблеме оптимизации.
Другие раздельГ, написанные конспективно, предлагают обзор
(известных) результатов специального характера. Такая
организация материала удобна для читателя и позволяет достаточно
полно отразить современное состояние теории.
Внимание читателя должны привлечь многочисленные гипотезы
и формулировки открытых проблем. Большую пользу изучающим
предмет и специалистам принесет обширная аннотированная
библиография, содержащая свыше 300 наименований.
Для чтения книги достаточно знакомства с университетскими
курсами линейной алгебры и анализа.
При переводе исправлены некоторые (но не все) неточности и
опечатки, а в некоторых местах текст оригинала дополнен
разъясняющими замечаниями. Во всех неочевидных случаях эти
исправления и разъяснения либо согласованы с авторами, либо ими
самими и предложены. Пользуемся случаем выразить авторам
глубокую признательность за их внимание к русскому изданию.
Н. С. Бахвалов
А. Г. Сухарев
ПРЕДИСЛОВИЕ
К РУССКОМУ ИЗДАНИЮ
Для большинства задач приходиться довольствоваться
приближенными решениями, и, значит, надо уметь существовать в
условиях неопределенности решения. Это относится к задачам
из таких разных областей, как математика, информатика,
физика, биология, техника, статистика, теория принятия решений.
Наша цель — заложить фундамент общей теории, изучающей
оптимальную информацию и оптимальные алгоритмы для любых
задач, решаемых приближенно.
Этой новой теории мы собираемся посвятить целую серию
монографий. В данной монографии, открывающей серию, изучается
«модель наихудшего случая» в предположении, что неопределенность
измеряется при помощи нормы. Такое предположение пригодно
для «непрерывных» задач.
Во второй монографии (Information, uncertainty, complexity.—
Addison-Wesley, 1983) мы показываем, как можно измерять
неопределенность, не пользуясь ни нормой, ни метрикой. Такой
способ позволяет построить единую теорию, охватывающую как
непрерывные, так и дискретные задачи. Кроме того, во второй
монографии рассматривается случай приближенной информации.
Информация может быть неточной по многим причинам, среди них:
ошибки ЭВМ, ошибки при передаче информации, ограничения на
представление чисел в ЭВМ и арифметику, обман со стороны
противника, ограничения на точность измерений.
В первых двух монографиях разбирается почти исключительно
модель наихудшего случая. В третьей, к исследованиям по
проблематике которой мы сейчас приступаем, будут изучены различные
вероятностные модели. В будущем мы уделим внимание также
асимптотическим моделям, поскольку асимптотические методы
широко используются на практике.
Мы надеемся, что в результате наших усилий появится новая
наука — наука об оптимальном решении задач с неопределенностью.
Посколько неопределенность решения обычно измеряют параметром
е, мы недавно решили назвать эту науку теорией е-сложности.
В заключение нам хочется выразить большое удовлетворение
фактом появления русского перевода нашей книги.
Беркли, Калифорния Дж. Ф. Трауб
июнь № X. Вожьняковский
Памеле Мак-Кордакк и
Гражине Вожьняковской
Верим в их оптимальность,
хотя наши исследования
еще не завершены.
ПРЕДИСЛОВИЕ
Цель этой монографии—дать остов общей теории, изучающей
оптимальные алгоритмы для задач, которые решаются
приближенно. Ради общности изложение ведется в абстрактной
постановке, но представлено много приложений к практическим задачам
и даны примеры, поясняющие введенные понятия и основные
теоремы.
Теория, которая здесь излагается, имеет своими истоками
исследования во многих областях. Решающее воздействие на ее
формирование оказали вопросы, понятия и результаты из теории
сложности, анализа алгоритмов, прикладной математики и
численного анализа, математической теории аппроксимации (в
особенности ее разделов, посвященных /г-поперечникам по Гельфанду
и по Колмогорову), прикладной теории аппроксимации (в
особенности теории сплайнов), а также предшествовавшие работы по
оптимальным алгоритмам. Но многие вопросы, которые мы ставим
(см. обзор содержания книги), являются новыми. У нас своя
точка зрения на алгоритмы и сложность, и, поскольку новые
понятия и вопросы требуют и новой терминологии, нам
приходится просить читателя о снисходительности в этом
отношении.
Учитывая, что наши читатели могут иметь различную
подготовку и различные интересы, мы предлагаем восемь вариантов
прочтения книги (см. раздел «Рекомендации по чтению книги»).
Эта монография знаменует слияние двух направлений
исследований. Одно из них, влючающее исследования по оптимальным
алгоритмам для таких задач, как поиск максимума, интегрирование
и аппроксимация, берет начало в работах Кифера, Сарда и
Никольского, выполненных на рубеже сороковых—пятидесятых годов.
И сами эти исследователи-основоположники и их последователи
занимались, как правило (за совсем немногими серьезными
исключениями), весьма специальными задачами. Вопрос о сложности
полученного оптимального алгоритма рассматривался лишь изредка.
Начало второму направлению положил в 1961 г. Трауб в связи
с изучением задачи решений нелинейных уравнений (см. часть С,
где изложена история предмета и дана обширная аннотированная
библиография).
Предисловие
В двух своих довольно больших по объему отчетах, изданных
Университетом Карнеги—Меллона в 1977 и 1978 гг. (General
Theory of Optimal Error Algorithms and Analytic Complexity,
Parts A and В), мы показали, что оба направления можно
объединить в рамках единой общей схемы. Данная монография
включает в себя в расширенном и усовершенствованном виде материал
этих двух отчетов.
Чаще всего в длинных монографиях подытоживают
достижения в какой-либо области. Эту же монографию надо
рассматривать как отчет в ходе работы. Мы излагаем основания научной
дисциплины, находящейся в состоянии быстрого изменения. Вот
почему мы то и дело высказываем гипотезы, формулируем
открытые проблемы, описываем требующие изучения альтернативные
модели. Еще больше вопросов, о которых мы решили не
упоминать.
Мы хотим выразить свою признательность многим. Б. Каце-
вич и Г. В. Васильковский были нашими соавторами по ряду
разделов книги, как это указано в оглавлении. Кроме того, они
тщательно прочитали всю рукопись и предложили ряд улучшений.
X. Т. Кунг и К. Сикорский проверили отдельные места рукописи,
а А. Г. Сухарев предоставил в наше распоряжение ценные ссылки
на работы советских авторов. А. Бояньчик, А. Келбасиньский и
А. Вершульц высказали полезные замечания по первоначальному
варианту рукописи. Д. Джозефсон, непревзойденная машинистка,
напечатала всю рукопись и всегда была терпима к нашим
бесконечным просьбам внести «еще только одно» изменение.
Неоценимую помощь при правке корректур и подготовке указателей
оказал нам Н. К. Брассфилд.
Значительная часть наших исследований была выполнена
в прекрасной научной атмосфере факультета вычислительной
математики Университета Карнеги—Меллона и Института
информатики при Варшавском университете. Наш долг—отметить
гостеприимство Калифорнийского университета в Беркли, где мы
провели 1978/79 учебный год, завершая исследования и
подготавливая рукопись. Мы признательны М. Блуму и Р. Карпу за
организацию этого визита и за стимулирующие беседы. Наконец,
нам приятно поблагодарить Национальный научный фонд (Grant
MCS-7823676) и Управление военно-морских исследований
(Contract № 00014-76-С-037), поддержкой которых мы пользовались.
РЕКОМЕНДАЦИИ ПО ЧТЕНИЮ КНИГИ
Читателям с разными интересами мы рекомендуем разные
разделы книги. Чтобы получить некоторое представление о
материале, всем читателям, думается, следует ознакомиться с
предисловием, обзором содержания и введениями к чч. А—С и
к каждой из 10 глав ч. А. Дальнейшие рекомендации таковы:
Исследователям, интересующимся открытыми проблемами.
Наша теория предлагает много новых проблем. Гипотезы, вопросы
и открытые проблемы рассеяны по всей книге. См., в частности,
ч. А, гл. 6, § 7; гл. 8, §§ 3 и 7; гл. 10, §§ 2 и 5; ч. В, § 10.
Исследователям, интересующимся литературой по истории
предмета. Библиографические ссылки и исторический материал
можно найти во многих местах. Часть С целиком отведена под
исторический очерк и аннотированную библиографию. Кроме того,
в конце книги отдельно приводится литература к чч. А—С. См.
также ч. А, гл. 1, § 2; гл. 4, § 1; гл. 6, §§ 3—6; гл. 8, § 1;
ч. В, § 2.
Специалистам по вычислительной математике (теоретикам),
интересующимся- алгоритмами и сложностью, но не специально
аналитической сложностью. Часть А, гл. 1, §§ 2, 3; гл, 5, 9, 10;
ч. В, §§ 2, 8, 11.
Математикам. Материал, наиболее интересный с чисто
математической точки зрения, представлен в ч. А, гл. 2 и 7; ч. В,
§§4-7.
Специалистам по математической теории аппроксимации. Часть
А, гл. 2, § 6; гл. 3, § 5; гл. 7, § 4.
Специалистам по прикладной теории аппроксимации. Часть А,
гл. 4 и 6; ч. С.
Специалистам по численному анализу и прикладной
математике. Часть А, гл. 3, 4, 6, 8—10; ч. С.
Специалистам по естественным наукам и инженерам.
Соответствующие параграфы глав, посвященных приложениям (ч. А, гл.
6 и 8), в зависимости от индивидуальных интересов.
Как это ни парадоксально звучит,
все точные науки проникнуты идеей
аппроксимации.
Б. Рассел
ОБЗОР СОДЕРЖАНИЯ КНИГИ
В данной книге представлены математические основания общей
теории оптимальных алгоритмов для задач, которые решаются
приближенно. Эта теория называется теорией аналитической
вычислительной сложности. Предмет этой области науки
обсуждается подробнее в § 4 гл. 1 ч. А.
В настоящем обзоре мы вынуждены использовать без
определений такие термины, как задача, информация, оптимальный
алгоритм. В основном тексте они будут определены строго и в
большой общности.
Мы ставим вопросы нового типа и отвечаем, по крайней мере
частично, на многие из них. Некоторые из этих вопросов
перечислены в конце данного обзора. Из-за богатства проблем в
изучаемой области нам пришлось оставить многие из них открытыми,
но мы надеемся, что они будут решены в ближайшем будущем.
Наша тематика охватывает как вопросы, представляющие
интерес только для математиков и специалистов по вычислительной
математике, так и вопросы, имеющие и практическое значение.
Приведем два примера.
Сложность задачи—это мера истинной, «внутренней» трудности
получения ее решения, как бы там это решение ни было получено
на самом деле. Мы определяем ее (см. ч. А, гл. 1, §§ 3 и 4)
как сложность «оптимального по сложности» алгоритма решения
задачи. (Сложность задачи можно определить лишь по отношению
к данной модели вычислений и данному классу «допустимых»
информационных операторов; здесь мы пока отвлекаемся от этого.)
Нахождение сложности задачи—трудная и глубокая проблема;
она полностью решена лишь для очень немногих задач. Когда
сложность некоторого числа задач найдена, хотя бы приблизительно,
их можно расположить иерархически в соответствии с их
трудностью. Несколько таких неполных иерархий задач представлено
в гл. 9, ч. А. Нам кажется, что определение сложности задач
и построение иерархий задач должно стать одной из
центральных проблем вычислительной математики и математики
вообще.
Что касается практических применений нашей работы, то одно
из ещ—рационализация синтеза алгоритмов. По традиции ал-
Обзор содержания книги 11
горитмы строят, основываясь на критериях, пригодных лишь для
данного конкретного случая. Мы покажем, что алгоритмы,
полученные на основе обычно используемых критериев, могут не иметь
никакого отношения к оптимальным (см. ч. А, гл. 6, замечание
4.1) и что применение алгоритмов, основанных на обычно
используемой информации, может повлечь сколь угодно большие
издержки по сравнению со случаем, когда применяются
оптимальные алгоритмы, использующие оптимальную информацию (см. ч.
А, гл. 6, § 6).
Центральный вопрос в вычислительной математике—выбор
наилучшего алгоритма для решения задачи. Выбор наилучшего
алгоритма является многокритериальной оптимизационной задачей,
среди критериев которой—сложность по времени, сложность по
емкости (по объему занимаемой памяти), простота программной
реализации, устойчивость. В этой монографии мы имеем дело
только со сложностью по времени, хотя, изменив в модели
вычислений набор простейших операций, можно было бы легко
получить заключения относительно сложности по емкости. В
последующих работах мы собираемся изучить вопрос о взаимодействии
различных критериев для ряда важных задач, но сначала нужно
понять, как осуществляется оптимизация по такому существенному
критерию, как сложность по времени.
Исследование, необходимое для того, чтобы охарактеризовать
и построить оптимальный алгоритм (оптимальный в каком-либо
из смыслов, употребляемых в настоящей книге) для данной
конкретной задачи, может оказаться трудной математической
проблемой и во всяком случае может потребовать значительных
усилий. Их допустимо, однако, отнести к затратам
предварительного этапа.
Мы не очертили пока рассматриваемую в этой монографии
область. Более точное ее описание придется отложить до § 4 гл.
1 ч. А, где вводятся соответствующие понятия, а пока ограничимся
следующими замечаниями.
Задачи решают приближенно либо из-за невозможности
получить точное решение с конечной сложностью, либо исходя из
соображений повышения эффективности вычислительных затрат.
К первому классу относится «большинство» задач математики,
науки и техники (много примеров читатель найдет в гл. 6 и 8
ч. А). Наиболее известными исключениями являются
комбинаторные и некоторые алгебраические задачи. Примерами задач из
этого второго класса могут служить задача решения больших
линейных систем с разреженными матрицами и ряд трудных
(например, NP-полных) комбинаторных оптимизационных задач.
На самом деле наша модель охватывает алгебраическую сложность
как частный случай (см. по этому поводу примеры 3.2, 3.3 и
§ 4 гл. 1 ч. А).
12 Обзор содержания книги
Общность и сила нашей теории проистекают из того, что
центральная роль отведена информации. Применение принципа
соперничества, основанного на рассмотрении используемой алгоритмом
информации, дает весьма общие теоремы об оценках сложности
снизу. Помимо того что понятие информации приводит к большой
общности, оно в то же время позволяет достичь замечательной
простоты. В многочисленных ранних работах оптимальные
алгоритмы получали при различных специальных предположениях о
классе алгоритмов и классе элементов задачи. Предположения эти
зачастую непроверяемы. Наши результаты зависят лишь от
используемой информации и некоторых вполне поддающихся
проверке свойств заданного класса элементов задачи. Они не
зависят от структуры алгоритма—только от используемой
алгоритмом информации.
В нашей теории применяются две математические модели;
для удобства мы именуем их а и {$. Ниже мы ограничимся
изложением содержания ч. А; по поводу ч. В см. введение к этой
части.
В модели а основные понятия оптимальности—понятия
оптимального по точности алгоритма и оптимальной
информации—определяются независимо от модели вычислений. Модель
Р состоит из модели а и понятий, относящихся к вычислениям;
основное понятие оптимальности здесь—«оптимальный по
сложности алгоритм» решения задачи. Модели а уделено значительное
место по целому ряду причин. Используя эту модель, часто
удается получить отрицательные результаты. Эти результаты
тем более сильны, что не зависят от модели вычислений. Далее,
для отыскания оптимального по точности алгоритма можно
привлечь существующие мощные математические методы. В самом
деле, прежде чем получать хорошие оценки для оптимального
по сложности алгоритма, нужно построить оптимальный по
точности алгоритм, использующий оптимальную
информацию.
Мы уже упоминали о трудности определения сложности задачи.
Почти всегда приходится довольствоваться ее оценками сверху
и снизу. Это и не удивительно.. Даже в теории алгебраической
сложности, которая включается в нашу постановку как частный
случай, сложность задачи редко когда известна точно. Однако
часто известны весьма хорошие оценки сложности задачи.
Например, если оптимальным по точности является линейный алгоритм,
то оценки всегда очень хорошие (см. ч. А, гл. 5 и 6) Примеры
весьма точных оценок сложности для случая, когда линейного
оптимального алгоритма не существует, можно найти в гл. 8 ч. А
и § 8 ч. В.
Перечислим 20 общих вопросов, подвергнутых изучению в
данной книге. На все эти 20 вопросов даны полные или частич-
Обзор содержания книга
ные ответы, за исключением двух вопросов, относительно ответов
на которые мы можем высказать лишь гипотезы.
1. Какова оценка снизу погрешности произвольного алгоритма
решения данной задачи, использующего данную информацию?
2. Существует ли в общем случае алгоритм, погрешность
которого сколь угодно близка к этой нижней оценке?
3. Когда информация достаточна для решения задачи с
заданной точностью?
4. Какова оптимальная информация для решения данной
задачи?
5. Каково минимальное число линейных функционалов,
достаточное для решения задачи с заданной точностью?
6. Всегда ли существует оптимальный по точности линейный
алгоритм для решения линейной задачи? Если нет, всегда ли
существует линейный алгоритм, погрешность которого отличается
от оптимальной не более чем на постоянный множитель?
Каково значение этой константы, если рассмотрение ведется в
гильбертовом пространстве?
7. Пусть задана конкретная задача. Как охарактеризовать и
построить оптимальный алгоритм ее решения?
8. Каковы точные оценки сверху и снизу сложности данной
задачи?
9. Можно ли установить, что одна задача по своей природе
сложнее другой?
10. Существуют ли линейные задачи произвольной сложности?
В частности, существуют ли сколь угодно сложные линейные
задачи?
11. Что можно сказать в общем случае о зависимости
сложности от регулярности класса «элементов задачи»?
12. Обеспечивают ли адаптивные алгоритмы лучшие по
сравнению с неадаптивными результаты при решении линейных
задач?
13. Обеспечивают ли адаптивные алгоритмы лучшие по
сравнению с неадаптивными результаты при решении нелинейных
задач?
14. Каковы возможности линейных информационных
операторов?
15. Каковы возможности нелинейных информационных
операторов?
16. Какова погрешность наилучшего алгоритма, использующего
оптимальную адаптивную линейную информацию для вычисления
нуля нелинейной скалярной функции?
17. Какова погрешность наилучшего алгоритма,
использующего оптимальную адаптивную линейную информацию для поиска
максимума унимодальной функции (обобщенная задача Кифера)?
14 Обзор содержания книги
Последние три вопроса касаются итеративной информации и
итерационных алгоритмов:
18. Каков максимальный порядок алгоритма, использующего
данную информацию?
19. Каков класс всех задач, которые могут быть решены
итеративно с использованием линейной информации?
20. Каково минимальное число линейных функционалов,
достаточное для итеративного решения нелинейных уравнений в
пространстве размерности N?
Пара слов о структуре книги. Она разбита на три части.
В частях А и В рассматриваются соответственно модели с общей
и итеративной информациями. Часть С состоит из краткого
исторического очерка и аннотированной библиографии, содержащей
свыше 300 наименований.
Завершим этот обзор описанием нашей системы ссылок внутри
книги. В пределах каждого параграфа—своя нумерация теорем,
уравнений, замечаний и пр. При ссылках на материал данной
главы ее номер не указывается. При ссылках на материал
данной части, но другой главы указывается глава, при ссылках на
материал другой части—часть и глава.
Часть А
Модель с общей
информацией
ВВЕДЕНИЕ
Центральное место в нашей теории оптимальных алгоритмов
занимает понятие информации. Данная часть книги посвящена
изучению «общей информации», а в части В рассматривается
«итеративная информация».
Мы развиваем теорию оптимальных алгоритмов, использующих
заданную информацию или оптимально выбранную информацию.
Представляют интерес два типа оптимальных
алгоритмов—«оптимальные по точности» и «оптимальные по сложности». В гл. 6
развитая теория применяется к широкому кругу линейных задач,
а в гл. 8—к некоторым нелинейным задачам.
Значительная доля данной части (гл. 2—6) посвящена теории
линейных задач при использовании линейной информации и
приложениям этой теории. Такой акцент сделан в силу ряда причин.
1. В линейной теории нами получены весьма сильные
результаты. В некоторых случаях они позволяют полностью ответить
на все поставленные вопросы.
2. Во многих важных приложениях речь идет именно о
линейных задачах и линейной информации.
3. В случае общей информации класс нелинейной информации
оказывается слишком сильным (см. гл. 7).
Опишем в самых общих чертах содержание данной части (более
подробные сведения можно найти во введении к каждой главе).
Глава 1. Дается формальное определение основных понятий.
С помощью принципа соперничества выводятся точные оценки
снизу для погрешности алгоритма. Описывается используемая
модель вычислений. Вводятся основные понятия оптимального
по точности алгоритма и оптимального по сложности алгоритма.
16 Ч. Л, введение
Обсуждается предмет теории аналитической сложности и этой
книги.
Глава 2. В гл. 2—6 рассматриваются линейные задачи и
линейная информация. В гл. 2 развивается общая теория линейной
информации. Варьируя информационный оператор, мы ищем
оптимальную для решения данной задачи информацию. Для случая
гильбертова пространства дается полное решение задачи об
оптимальной информации. Изучается адаптивная информация и
доказывается удивительный результат, что для линейных задач
адаптивная информация не сильнее неадаптивной. Устанавливаются
связи между гельфандовскими n-поперечниками и я-ми
минимальными диаметрами.
Глава 3. Изучаются линейные алгоритмы для линейных задач;
такие алгоритмы должны отличаться невысокой сложностью по
времени и по емкости. Для произвольной задачи с линейным
оптимальным по точности алгоритмом указаны весьма точные оценки
сложности снизу и сверху. Специально построенный пример
демонстрирует существование линейной задачи, для которой нет
линейного оптимального по точности алгоритма; для «естественно»
возникающих задач такие примеры неизвестны. С привлечением теоремы
Смоляка доказывается, что алгоритмы, оптимальные в смысле
Сарда и Никольского, являются оптимальными по точности.
Устанавливаются связи между оптимальными линейными алгоритмами
и линейными я-поперечниками по Колмогорову.
Глава 4. Вообще говоря, наш анализ ориентирован на
рассмотрение наихудшего элемента задачи / из заданного класса 80.
В данной же главе мы изучаем алгоритмы, для которых локальная
погрешность почти минимальна для каждого f из 30. Алгоритм,
обладающий этим свойством, имеет малое «отклонение».
Существуют ли линейные алгоритмы с малым отклонением, которые
оптимальны или близки к оптимальным по точности алгоритмам?
Мы вводим сплайновые алгоритмы и показываем, что они
позволяют дать ответ на этот вопрос.
Глава 5. В этой главе наша модель вычислений
конкретизируется для линейного случая. Показано, что существуют
линейные задачи произвольной сложности. Это означает существование
сколь угодно трудных линейных задач и отсутствие «пробелов»
в множестве значений функции сложности.
Глава 6. Здесь мы применяем свою теорию для решения
разнообразных линейных задач, в том числе задач аппроксимации
линейного функционала, интерполяции, интегрирования,
аппроксимации и решения линейных уравнений с частными
производными. Получены результаты для различных пространств элементов
/. Введение 17
задачи. Найдены оптимальные по точности алгоритмы, алгоритмы,
близкие к оптимальным по сложности, оптимальные
информационные операторы, а также очень хорошие оценки сложности задач
для многих приложений. В некоторых случаях наши новые
алгоритмы быстрее обычно используемых в неограниченное число раз.
Глава 7. Развивается теория нелинейной информации.
Показывается, что при изучении общей информации рассмотрение полного
класса нелинейной информации бессодержательно, так как этот
класс оказывается слишком сильным. Устанавливаются
взаимосвязи между л-поперечниками по Колмогорову и погрешностями
и-мерных алгоритмов, а также между е-энтропией и кардиналь-.
ностью информационных операторов с радиусом информации,
меньшим 8.
Глава 8. Общая теория применяется к решению некоторых
нелинейных задач. Показано, что адаптивная линейная
информация экспоненциально лучше неадаптивной линейной информации
для нелинейных задач, рассматриваемых в этой главе.
Доказывается, что для поиска максимума унимодальной функции
«информация Кифера» неоптимальна в классе адаптивной линейной
информации, основанной на вычислении значений п линейных
функционалов. Выдвигается гипотеза о величине погрешности
оптимального алгоритма, использующего оптимальную линейную
информацию.
Глава 9. Одна из центральных проблем теории аналитической
сложности—установление истинной сложности задачи. Дается
неполное описание иерархии задач, рассмотренных в гл. 6 и 8.
Глава 10. Предыдущие главы посвящены модели аналитической
сложности для наихудшего случая. В данной главе вкратце
обсуждаются четыре другие модели: среднего случая, с относительной
погрешностью, с возмущениями и асимптотическая.
Глава 1
ОСНОВНЫЕ ПОНЯТИЯ
1. ВВЕДЕНИЕ
В этой главе даются формальные определения основных
понятий, используемых в части А. Главными из них являются
понятия оператора решения (или задачи) S, информационного
оператора (или информации) 91 и алгоритма ф.
\8_ Ч. А, гл. L Основные понятия
То что мы концентрируем внимание на используемой
алгоритмом информации, позволяет существенно упростить теорию
оптимальных алгоритмов. Такой подход приводит к мощному
принципу соперничества, с помощью которого мы получаем оценку
снизу для сложности любого алгоритма отыскания решения за-
дачи S, использующего информацию 9{. Показано, что наилучшей
возможной оценкой снизу является радиус информации r{p{, S).
Задачу S нельзя решить с точностью е, если г(Шу S)^e. Этот
отрицательный результат в принципе не зависит от
рассматриваемой модели вычислений.
Как уже упоминалось в обзоре содержания книги, мы будем
иметь дело с двумя моделями аи^. Приведенный выше
отрицательный результат будет получен для модели а. Для той же
модели а вводится понятие «оптимального по точности алгоритма»
как алгоритма с погрешностью, минимальной среди погрешностей
всех алгоритмов решения задачи S, использующих информацию $1.
Помимо того, введены понятия центрального алгоритма и
интерполяционного алгоритма. Центральный алгоритм всегда оптимален
по точности. Он обладает даже некоторым более сильным
свойством оптимальности (см. замечание 2.2 и гл. 4). Погрешность
интерполяционного алгоритма превосходит погрешность
оптимального по точности алгоритма не более чем в два раза. Центральные
и интерполяционные алгоритмы полезны как на практике, так
и в общей теории; по поводу теоретических аспектов см. гл. 3
и 4, по поводу приложений — гл. 6 и 8.
Чтобы обсуждать понятие сложности, необходимо иметь
модель вычислений. Наша модель включает в себя набор простейших
операций и понятия допустимого информационного оператора и
допустимого алгоритма. Для модели р вводится понятие
«оптимального по сложности алгоритма» как алгоритма, сложность
которого минимальна среди сложностей всех алгоритмов решения
задачи S с ошибкой, меньшей е, использующих информацию Ш.
Вообще говоря, сложность оптимального по точности алгоритма
не обязательно близка к сложности оптимального по сложности
алгоритма (см. замечание 3.2). Однако для определенных классов
алгоритмов, например для линейных алгоритмов (см. гл. 5 и 6),
и для определенных нелинейных задач (см. гл. 8) между двумя
типами оптимальности существует тесная связь.
Наша постановка обладает общностью, позволяющей охватить
как частные случаи теории сложности алгебраических и
комбинаторных задач. По этому поводу обратите внимание на примеры
3.2 и 3.6 и на предваряющее их обсуждение, а также на § 4,
где приводится другой пример того, как теория алгебраической
сложности укладывается в нашу постановку.
Дадим краткий обзор результатов главы. В § 2 вводятся
основные понятия, такие как элемент задачи, оператор решения,
^ 2. Диаметр и радиус общей информации 19
информационный оператор, е-приближение, радиус и диаметр
информации, алгоритм, интерполяционный алгоритм,
центральный алгоритм и оптимальный по точности алгоритм. Принцип
соперничества приводит (теорема 2.1) к заключению, что радиус
информации 91 для задачи S служит оценкой снизу для ошибки
любого алгоритма решения S при использовании информации ffi.
Далее, найти е-приближение для всех элементов задачи можно
тогда и только тогда, когда радиус информации меньше е.
В § 3 представлена наша модель вычислений.
Основополагающими являются здесь понятия простейших операций, допустимых
информационных операторов и допустимых алгоритмов. Вводится
понятие оптимального по сложности алгоритма; замечание 3.2
иллюстрирует разницу между понятиями оптимального по
точности и оптимального по сложности алгоритмов. В обсуждении
и примерах в конце параграфа рассмотрена взаимосвязь с теорией
алгебраической сложности.
Введенные в § 2 и 3 понятия позволяют нам в заключительном
параграфе определить предмет теории аналитической сложности.
2. ДИАМЕТР И РАДИУС ОБЩЕЙ ИНФОРМАЦИИ
Пусть 30—множество в линейном пространстве 3t над полем
вещественных или комплексных чисел. Рассмотрим линейный или
нелинейный оператор
B.1) S:30-+3%,
где 32—нормированное линейное пространство над полем
вещественных или комплексных чисел (см. рис. 1). Пусть задано число
в>0. Наша задача состоит в отыскании е-приближения x~x(f)y
Х?%2> к a S(/)
B.2) [*—a[|<e для всех f?30.
Будем называть S оператором решения, f—элементом задачи и
a—элементом решения. Мы будем часто говорить об операторе S
и его области определения Эо как о задаче S.
Для отыскания е-приближения нам надо что-то знать об
элементах задачи. Пусть
B.3) $1: Ак-*3з
— информационный оператор (не обязательно линейный); здесь
30 с Дк с 319 а Э3—некоторое заданное пространство. Элемент
$l(f) называется информацией об /. Для большинства задач
оператор Ш не является взаимно-однозначным и информация Ш (/)
не определяет однозначно элемент решения а = 5(/). Таким
образом, может существовать много различных элементов задачи
f% с одной и той же информацией.
20
Ч. А, гл. 1. Основные понятий
v(f:T\
U(f) ;
Рис. 1
Пусть f€30. Рассмотрим
B.4) V (f) - {f: 9Z (/) = Ш (/) и / € 30}
— прообраз в Эо элемента y = $l{f):V(f) = $l~1 (y)(K0. Заметим,
что V(f) непусто, поскольку f?V(f) для каждого f€$Q. Далее,
введем
B.5) ?/(/)
— множество всех решений S(f), отвечающих элементам задачи f
с той же информацией, что и у /: U (f) = S(?H''1(y)r\^o)- Зная
лишь 9?(/), нельзя сказать, какой именно элемент, а = 5(/) или
a = S(f) (f€V(/)), на самом деле аппроксимируется. Этот принцип
соперничества схематически иллюстрируется рис. 1.
Как мы увидим, существенную роль играют диаметр и радиус
множества U (/). Эти понятия определяются следующим образом.
Напомним, что для всякого множества Л с32 число
B.6) сНат(Л)= sup fa,— аг\
называется диаметром А, а число
B.7) radD)=inf sup Ца—aj
а 6 32 at € A
— радиусомА. Грубо говоря, гас!(Л) — это радиус минимального
шара, содержащего Л. Если существует с(с32, такое что
B.8)
то с называется центром А. Заметим, что элемент с может не
принадлежать А и определяется не обязательно однозначно.
ОПРЕДЕЛЕНИЕ 2.1. Диаметром информации ЭТ для задачи S
назовем величину d(9t, S), задаваемую формулой
B.9) d(9i,S) = supdiam((/(/)) /=sup sup ||Stf)-
2. Диаметр и радиус общей информации 21
Радиусом информации 91 для задачи S назовем величину /-(9i, S),
задаваемую формулой
B.10) г(Щ, S) = sup rad(t/ (/))(= sup inf sup [a—S(?)||Л. ¦
^3 V 3 37'/ У
Очевидно, что
B.11) r(9i, S)<d(9?, S)<2r(SR, S).
Для многих 31и5 вычислить диаметр d(9t, S) намного легче,
чем радиус г(ЭТ, S).
Замечание 2.1. Предположим, что для каждого /€-30
существует c = c(f)?32, такое что множество U = U(f) симметрично
относительно с9 т.е. из h+c?U следует—h+cf?U. Тогда с —
центр U и
B.12) d(% S) = 2r(% S).
В самом деле, предположим, что sup |]a—a|)<sup||c—и\\ для
некоторого ag32. Выберем такое x?U, что ||a—w(|<(|c—jc||
Vu?U. Пусть x = c + h. Тогда с—Л^^/ и
что невозможно. Таким образом, с является центром U.
Без потери общности можно считать, что rad (U) < + оо. Пусть
h = u—с, где u?U, \]с—u[\^vad(U)—б для б > 0. Положим
ux = c-\-h, и2 = с—Л. Тогда u^U и \иг — м2|| = 2||с—и||^
^ 2 (rad (U) — б). Это доказывает, что diam (U) = 2 rad ((/), откуда
и следует B.12).
Пример задачи S и информационного оператора 91, для
которых d($l, S)< 2r(9{, S), можно найти у Миккелли и Ривлина
[77, с. 9.]|
Покажем, что радиус г (9?, S) служит оценкой снизу для
погрешности любого алгоритма отыскания a=sS(f). Под
алгоритмом мы понимаем всякий оператор (р: 9t(<30)—*32 (рис. 2).
(См. также определение допустимого алгоритма в § 3.) Пусть
Ф C1, S)—класс всех алгоритмов. Поскольку ф Ci (/)) = ф (Ш (/))
для всех f?V(f), алгоритм ф должен аппроксимировать любой
элемент множества U (J) (см. рис. 2).
ОПРЕДЕЛЕНИЕ 2.2. Погрешностью алгоритма ф назовем
величину е(ф), задаваемую формулой
B.13) е(Ф) = sugflф(Ш(f))S{fI1 .
22
Ч. Л у гл. 1. Основные понятия
Рис. 2
Заметим, что B.13) можно переписать так:
= sup sup
f 37K(/
-S G)|| = sup sup
/6 Зо
B.14)
Интуитивно очевидно, что радиус rER, S) служит оценкой снизу
для погрешности любого алгоритма. Формальное доказательство
доставляет
Теорема 2.1. Для любого алгоритма ф€Ф(?1> S)
B.15) eD>)>rCt,S).l
Доказательство. Пусть /?30. Тогда, в силу B.7) и B.14),
rad([/(/))< sup
Следовательно, г (Щ9 S) = sup/€ 3o r ad ((/(/))< е (ф). |
Этот результат обобщает теорему 4 из работы Миккелли и
Ривлина [77], где 5 и 9? предполагаются линейными.
Определим теперь «интерполяционные алгоритмы» и покажем,
что их погрешность превосходит г(9{, 5) не более чем в 2 раза.
ОПРЕДЕЛЕНИЕ 2.3. Алгоритм Ф1€Ф(Э1,5) называется
интерполяционным алгоритмом1) для задачи S при использовании
информации 91 (кратко, интерполяционным алгоритмом для S
при 90, если
B.16) Ф* (9? (/)) = <$(/)
для некоторого f?V(f).§
Это означает, что по информации 91 (/) отыскивается некоторый
элемент задачи / с той же информацией, что и /, f^V(f), и в ка-
1> В оригинале interpolatory algorithm.— Прим, перев.
2. Диаметр и радиус общей информации 23
честве приближения к a = S(f) берется a = S(/). На практике
выбирают/, которое «проще» /. Заметим, что Ф1 (9f (/)) € ^ (/)•
В некоторых случаях добавляется правило, как выбрать
единственное f. Примеры интерполяционных алгоритмов известны для
таких задач, как нелинейные уравнения, аппроксимация,
интерполяция и интегрирование.
Теорема 2.2. Для любого интерполяционного алгоритма
B.17) e(q>l)
Доказательство. Для произвольного f€$0 имеем
поскольку f?V(f). Взяв верхнюю грань по /, получим B.17). |
Нас интересуют «оптимальные по точности» алгоритмы,
которые определяются следующим образом.
ОПРЕДЕЛЕНИЕ 2.4. Оптимальной погрешностью назовем
величину e($l,S), задаваемую формулой
B.18) e($tt,SH inf *(Ф)«
ф€Ф (Ш, S)
Будем говорить, что срое?Ф(!ЭТ, S) есть оптимальный по
точности алгоритм^ для задачи S при информации 9? (или просто
оптимальный по точности алгоритм), если
B.19) e(q>o*) = e(%S)A
Сопоставляя теоремы 2.1 и 2.2, мы видим, что любой
интерполяционный алгоритм близок к оптимальному по точности.
Следствие 2.1. Для всякого интерполяционного алгоритма
Ф^Э?, S) имеем, полагая 0/0=1,
B.20)
Докажем теперь, что оптимальная погрешность e(SR, S) равна
радиусу г (97, S).
Теорема 2.3. Справедливо равенство
B.21) e($l,S) = r(%S).§
*> Б оригинале optimal error algorithm. Отсюда индекс ое.— Прим. перев.
24 Ч. Л, гл. 1. Основные понятия
Доказательство. Пусть задано произвольное б > 0. Определим
алгоритм фб следующим образом. Положим
B.22) Ф
где ||с6(/)—а |К rad ((/(/)) +б для всех а ? ?/(/). Таким образом,
c6(f)—почти что центр множества (/(/). Имеем
= sup sup \\a—c6 (/) 1 < sup rad (U (/)) + б = г (ЭТ, S) + б.
Так как б произвольно, то е(9?, S)</*C1, S). Но из теоремы 2.1
мы знаем, что e($l, S)^ г(Ш, 5), откуда и следует B.21). |
У Миккелли и Ривлина [77] сходный результат получен для
линейных $1 и S. Теорема 2.3 показывает целесообразность
использования центра c(f) (если он существует) в качестве
аппроксимации элемента a = S(/). Предположим, что при любом f?30
в U (f) существует центр.
ОПРЕДЕЛЕНИЕ 2.5. Алгоритмх) фс€Ф(9?, S) называется
центральным алгоритмом для задачи S при использовании
информации Ш (кратко, центральным алгоритмом для 5 при 90, если
B.23) Фс(ЗД) = с(/),
где c{f)—центр U(f).
Теорема 2.4. Центральные алгоритмы оптимальны по
точности, т. е.
B.24) *(<Pc) = /-№S).l
Доказательство. Имеем
Н5ир sup ||a-c(/)|] =
Как мы увидим в гл. 3 и 4, интерполяционный алгоритм
может оказаться оптимальным по точности.
Замечание 2,2. Центральные алгоритмы фс обладают даже
более сильным свойством, чем оптимальность; а именно, они
обеспечивают наилучшее возможное приближение к S(f) для
каждого /?30. Точнее, рассмотрим для ф^Ф^, S) и /?30
локальную погрешность
lev if)
*> Ниже индекс с—от английского central.— Прим, перев.
2. Диаметр и радиус общей информации 25
При фиксированном / нам нужно минимизировать е (ср, /). Ясно, что
inf e(9,/) =
<реФ(Я, S)
Итак, центральные алгоритмы минимизируют локальную
погрешность для каждого элемента задачи. |
Напомним, что мы хотим найти е-приближение к a — S(f)
для всех /?30, т. е. найти такое x(f), что [*(/)—а||< е. Из
теоремы 2.3 вытекает
Следствие 2.2. Отыскать е-приближение к а = 5(/) возможно
при всех /?30, если и только если
B.25) r(8t,S)<e. I
Подчеркнем, что информационный оператор Щ должен быть
определен так, чтобы 5{(/) было «вычислимым» для каждого
/€30. Это исключает из рассмотрения многие операторы как
«недопустимые» в качестве информационных. Пусть, например,
Я (/) = /, т.е. 51—тождественный оператор /. Тогда, поскольку
/ взаимно-однозначен, r(/, S) = 0 для любого оператора
решения S. Однако оператор 5J(/) = / вычислим в том и только том
случае, когда / можно представить конечномерным вектором,
т. е. когда Зх—конечномерное пространство. Рассмотрим другой
пример: 5t(/) = S(/). В этом случае r(S, 5) = 0, но для
большинства задач S(f) не является вычислимым и Ш = 5 не является
допустимым информационным оператором. Точное описание нашей
модели вычислений содержится в § 3 и гл. 5. Примеры
вычислимых операторов* приводятся в гл. 6 и 8.
ПРИМЕР 2.1. Для иллюстрации введенных понятий
рассмотрим следующую задачу. Пусть 31 = Си[0, 1] (класс п раз
непрерывно дифференцируемых функций одной переменной),
д^1, и пусть &2 = С°[0, 1]. Положим
B.26) S (/) = /;
иными словами, S — /. Заметим, что задача B.26)—это задача
аппроксимации. Пусть
и max (^(ol < ll.
Рассмотрим информационный оператор 5t, задаваемый равенством
B.27) »(/)~[/(<i). /(<.), ..../('«И
для некоторых попарно различных точек ?/?[0, 1]. Это означает,
что мы хотим аппроксимировать / из 80, зная лишь значения /
26 Ч. А, гл. 1. Основные понятия
в п точках. Пусть со(/) = H7=i (t — *,-)• Тогда f?V(f) влечет
где g есть я-я разделенная разность функции f—f и ||g||
= max Iff @ К 2. Легко показать, что d(% S) = 2r(9'i, 5) и
B.28) г C1, 5) -1|со || > 2/4".
Более того, для информации ЭД в форме B.27) с точками
/г,
являющимися нулями многочлена Чебышёва 7^ B^ — 1), в B.28)
имеет место равенство.
Если 8>2/4*, то отыскание е-приближения к а = 5(/) = / для
всех /?<30 при использовании информационного оператора 0i
с ^=/* возможно. Для 8^2/4" информационный оператор $1
в форме B.27) не дает достаточной информации для отыскания
е-приближения ни при каком выборе точек t{. I
Замечание 2.3. Отыскание точных элементов решения
формально соответствует случаю 8 = 0. В этом случае нет нужды
предполагать пространство Зг линейным, а пространство -32—
нормированным линейным. Легко проверить, что точное решение
можно найти, если и только если множество U (/) состоит ровно
из одного элемента для каждого /€3
Завершим этот параграф некоторыми историческими
замечаниями. В части С читатель может найти (в аннотированной
библиографии) относящиеся к затронутым вопросам работы, а также
краткую историю теории аналитической сложности с
прокомментированными ссылками на такие пионерские работы, как статьи
Сарда [49], Никольского [50], Кифера [53], Голомба и Вайн-
бергера [59], Трауба [61, 64].
Здесь мы ограничимся неполным перечнем статей, в которых
представленные, в данном параграфе идеи были в явном (или
чаще в неявном) виде применены к решению той или иной
конкретной задачи или класса задач.
Общие линейные задачи (чаще всего аппроксимации линейных
функционалов) рассматривали многие авторы, среди них: Алберг
и Нильсон Э. [66], Бабушка и Соболев [65], Бахвалов [68, 70, 71а],
Вайнбергер [61,72], Виноград [76], Голомб и Вайнбергер [59],
Гребенников [78], Гребенников и Морозов [77], Гэл и Миккелли
[78], Иванов [75, 77], Кнауфф и Кресс [74, 76], Ларкин [70],
Мангасарян и Шумейкер [73], Марчук и Осипенко [75], Мейерз
и Сард [50а, Ь], 'Мелкмэн и Миккелли [77], Менге [67], Мик-
2. Диаметр и радиус общей информации 27
келли [75], Миккелли и Пинкус [77], Миккелли и Ривлин [77],
Мэнсфилд [71, 72], Нильсон Г. [73], Осипенко [76], Райнш [74],
Райе [73,76], Риттер [70], Рихтер-Дин [71Ь], Сард [49,67,73],
Смоляк [65], Шёнберг [64а], Шульц [74].
Некоторые из представленных здесь идей использовались
также для нелинейных задач. Решением нелинейных уравнений
занимались: Айхьхорн [68], Бут [67, 69], Гросс и Джонсон С. [59],
Зонневенд [77], Кифер [57], Майстровский [72], Миккелли и
Мирэнкер [75], Сухарев [76], Тодд [76], Черноусько [68], Яфиль
[77]. Поиск максимума для некоторого класса унимодальных
функций рассматривался Кифером [53], работа которого
послужила толчком для исследований в данной области. Среди его
последователей: Адамский, Корытовский и Митковский [77],
Айхьхорн [68], Афанасьев [74], Афанасьев и Новиков [77], Бимер
и Уайлд [69, 70, 71], Ганшин [76, 77], Гэл [72], Данилин [7V
Джонсон С. [56], Жилинскас [75], Зализняк и Лигун [78=
Зонневенд [77], Иванов [72а], Карп и Мирэнкер [68], Кифер [57=
Кролак [66,j68], Кролак и Купер Л. [63], Кузовкин и Тихо-
. 72, 75], Тарасова [78],
Уайлд"[64], Файн [66]," Черноусько [70а, Ь], Эвриэл и Уайлд [66],
миров [67], Левин А. Ю. [65], Моцкус [72], Ньюмэн [65], Пияв-
ский [72], Стронгин [78], Сухарев [71,72,75], Тарасова [78],
Юдин и Немировский [76а, Ь, 77].
В задаче решения нелинейных уравнений информационные
операторы обычно зависят от текущего приближения к решению,
9{ = 9?(/, х). Теория таких информационных операторов (которые
называются итеративными информационными операторами)
развивается в части В. Оптимальные итеративные решения
скалярных или абстрактных нелинейных уравнений рассматривали:
Брент, Виноград и Вулф [73], Вожьняковский [72, 74—76],
Кацевич [75, 76а, Ь], Кунг [76], Кунг и Трауб [74, 76], Меерс-
ман [76а, Ь],Трауб [61, 64], Трауб и Вожьняковский [76а].
См. также статьи Вершульца [77а, Ь], где рассматриваются
«дискретизующие» информационные операторы и изучается
максимальный порядок численного интегрирования и
дифференцирования.
Большинство этих статей явно или неявно основывается на
принципе соперничества. Принцип этот состоит в том, что если
найти элемент задачи / с той же информацией, что /, то
погрешность любого алгоритма можно оценить снизу половиной
расстояния между S(f) и S(f). На общетеоретическую важность
принципа соперничества указали Виноград [76] и
Вожьняковский [75]. Виноград [76] предложил очень общий метод «обмана»
и продемонстрировал его роль на ряде задач. Некоторые из
этих идей ранее использовались в работе Брента, Винограда и
Вулфа [73], где для некоторого специального информационного
28 Ч. Л, гл. 1. Основные понятия
оператора установлена оптимальность нестационарных
одноточечных итераций с памятью. Вожьняковский [75] ввел
существенное понятие порядка информации, которое основано в первую
очередь на принципе соперничества. Понятие порядка
информации было использовано рядом авторов для установления
оптимальности различных стационарных итераций для решения
нелинейных уравнений.
3. СЛОЖНОСТЬ ОБЩЕЙ ИНФОРМАЦИИ
Опишем нашу модель вычислений, состоящую из набора
простейших операций, допустимых информационных операторов
и допустимых алгоритмов. В дальнейшем мы будем попеременно
использовать слова «стоимость», «затраты» и «сложность». Из
контекста будет ясно, имеется в виду сложность алгоритма или
сложность задачи.
Модель вычислений
(i) Предположим, что вычисления производятся на машине
с произвольным доступом к памяти (см. Ахо, Хопкрофт и Ульман
[74, гл. 1]). Пусть р—простейшая операция. Примерами
простейших операций являются арифметические операции,
вычисление квадратного корня, вычисление интеграла. Пусть сотр (р)
обозначает сложность р\ величина сотр (р) должна быть
конечной. Предположим, что Р—заданный набор простейших
операций. Выбор Р и сотр(/?), р?Р, произволен и может зависеть
от конкретной задачи.
(И) Пусть 91-г-информационный оператор. Будем говорить,
что 9Z—допустимый по отношению к Р информационный
оператор, если существует программа, которая вычисляет 9i(/) для
всех f €30, используя конечное число простейших операций из Р.
Пусть сотр (9? (/)) обозначает информационную сложность
вычисления 9?(/). Мы предполагаем, что если 91(/) требует
выполнения простейших операций ри р2, ..., pkf то сотр (91 (/))=
=S*Bi сотр (/>,).
(iii) Пусть ф—алгоритм, использующий допустимую
информацию 9?. Для вычисления ф (91 (/)) мы
(a) вычисляем # =
(b) вычисляем ф(#).
Сложность вычисления у задана в пункте (и). Будем говорить,
что ф — допустимый по отношению к Р алгоритму если
существует программа, которая вычисляет ф (у) для всех # = 9i(/),
f3 используя конечное число простейших операций из Р.
3. Сложность общей информации 29
Предположим, что вычисление ф (у) требует выполнения
простейших операций ql9 q2t ...>qj. Величину comp (ф(у))=2/=icomp (</,)
назовем комбинаторной сложностью вычисления ()|
Замечание 3.1. Пусть 91—допустимый информационный
оператор. Это значит, что 97(f) можно вычислить, исходя из набора
простейших операций Р. Часто существует много различных
алгоритмов для вычисления 97(/), и оптимальное вычисление
97(/) можно рассматривать как подзадачу. Однако мы
предполагаем, что алгоритм вычисления 91 (f) (возможно, не
оптимальный) определяется «пользователем». |
ПРИМЕР 3.1. Предположим, мы хотим приближенно
вычислить S(/) = ] lf(t)dt, где /—абсолютно непрерывная скалярная
функция и ^ о (Г (t)Jdt ^ 1. Определим два набора простейших
операций: Pj = {вычисление интеграла} и Р2 = {арифметические
операции, вычисление значения функции}. Заметим, что
информационный оператор 9?(/) = S(/) допустим по отношению к Рг и
недопустим по отношению к Р2. Конечно, r(S> S) = 0. Однако
S—простейшая операция только в Р1т Примером допустимого
информационного оператора для Р2 является 91 (f) = [f{t1),
/(*2)> • • •> f(tn)] Для равноотстоящих /,g [0, 1]. В § 4 гл. 6 будет
показано, что r($l, S) = O(l/n). |
Мы доказали в § 2, что условие г(ШУ S)<e необходимо й
достаточно для того, чтобы можно было найти е-приближение
к a = S(f). Если г (Ш, 5)^8, то информационный оператор Ш не
дает достаточной информации для решения задачи. Скажем, что
задача S с информационным оператором $1 является г-неразре-
шимой, если г C1, S) ^ 8. Если оператор 97 допустим, г (97, S) < г
и существует допустимый алгоритм ф, такой что е(ф)< е, то
задача 5 с информационным оператором 9J называется г-разре-
шимой по отношению к Р.
Предположим, что г(97, 5)< 8 для некоторого допустимого 9?
и класс Ф(е) всех допустимых алгоритмов, для которых е(ф) < е,
непуст. Мы хотим оценить снизу и сверху сложность отыскания
е-аппроксимации при использовании произвольного ф€Ф(е).
Поскольку набор простейших операций фиксирован,
зависимость сложности от Р не указывается. Пусть ф€Ф(е). Тогда
сложность алгоритма ф определяется равенством
C.1) comp (Ф) = sup (comp (97 (/)) + comp (Ф C1 (/)))).
Введем понятия оптимального по сложности алгоритма
(определение 3.1) и сложности задачи (определение 3.2).
30 Ч. А, гл. 1. Основные понятия
ОПРЕДЕЛЕНИЕ 3.1. Величина comp (% S, е), задаваемая
формулой
Iinf comp (ф), если г ($1, S)< г и Ф (е)=0,
ф€Ф(8)
¦foo в противном случае,
называется г-сложностью задачи S при использовании
информации $1 (кратко, г-сложностью S при 9?).
Будем называть срос ? Ф (е) оптимальным по сложности
алгоритмом1* для задачи S при использовании информации $1 (кратко,
оптимальным по сложности алгоритмом для 5 при Ш), если
C.3) comp (фос) = comp (ЭТ, 5, е). |
Замечание 3.2. Подчеркнем разницу между оптимальным по
точности и оптимальными по сложности алгоритмами.
Оптимальный по точности алгоритм минимизирует погрешность, но не
обязательно сложность, поскольку его комбинаторная сложность
может быть большой. В качестве примера рассмотрим решение
системы линейных уравнений Лх = Ь, где А — невырожденная
гсхя-матрица, а Ь — пх 1 -вектор. Тогда /=[Л, Ь] и
Заметим, что в нашей постановке решение системы линейных
уравнений является нелинейной задачей, так как S—нелинейный
оператор решения.
Каждый точный для этой задачи алгоритм ф использует
информационный оператор $l(f) = t и является оптимальным по
точности, ибо е (ф) = /- (9i, S) = 0. Таким образом, все классические
численные алгоритмы, такие как метод исключения Гаусса,
методы ортогонализации Хаусхолдера или Грама—Шмидта,
оптимальны по точности. Они, однако, не являются оптимальными
по сложности алгоритмами (по крайней мере для больших п)у
так как их комбинаторные сложности пропорциональны я3.
Установлено, что 8-сложность этой задачи при Ш (/) = / самое большее
пропорциональна пр, где наилучшее известное значение р,
найденное Паном [78], равно приблизительно 2.792>. Истинное
значение 8-сложности до сих пор неизвестно.
Может также случиться, что оптимальный по точности
алгоритм не является допустимым, а потому и Оптимальным по
сложности. Для примера положим
о = [1. 2],
Х) В оригинале optimal complexity algorithm. Отсюда индекс ос.-^ Прим.
перев.
2) См. подстрочное примечание на стр. 33. — Прим. перев;
S. Сложность общей информации 31
и пусть набором простейших операций Р служит набор из четы*
рех арифметических операций { + , —, #, /}. Заметим, что
оператор 91 допустим и r(9Z, S) = 0. Единственный оптимальный по
точности алгоритм Ф (9^ (/)) = ]/"/ не является, однако,
допустимым, так как операция извлечения квадратного корня не
принадлежит к Я.
С другой стороны, существует алгоритм, который допустим
и обладает погрешностью, меньшей е; а именно, положим
где k= Г log log (l/e)/log A/A/^2— 1)) П . Таким образом, хк
получается итерацией по методу Ньютона — Херона. Определим
алгоритм формулой
Ф
Легко проверить, что е(ф)<е. Алгоритм <р допустим, и если
положить стоимость каждой арифметической операции равной
единице, то его комбинаторная сложность равна 3/г. Таким
образом, 6-сложность этой задачи при $1 (/)==/ не превосходит 3k.
Истинное значение е-сложности неизвестно. |
Назовем величину
C.4) сотр (Щ = sup comp (91 (/))
информационной сложностью Л. Предположим, что комбинаторная
сложность каждого алгоритма ф?Ф(е) для 5R(/), таких что
сотр (§)?(/)) = сотр Ш9 ограничена снизу величиной т(Ш). Точнее,
пусть
C.5) m(9l)= inf sup comp (cp(SR (/))).
ф€Ф(е) /: comp (91 (/))=comp (%l)
Вообще говоря, т(Ш) зависит от числа «независимых частей»
информации 9?; см. гл. 2 (§ 2) и 5, где вводится понятие
«кардинальности» информации $1 и показывается, как кардинальность Ш
влияет на комбинаторную сложность алгоритма ф. Как мы
увидим в гл. 3, для некоторых линейных задач можно найти
оптимальные по точности алгоритмы с комбинаторной сложностью,
пропорциональной кардинальности 5R.
Из C.4) и C.5) вытекает, что
C.6) сотр C1, S,
Далее, если существует
сотр(ф(ЭТ(/))) <^ сотр (Щ дл
C.7) compER, S, e) ^ comp (ф)с* comp ER),
Далее, если существует алгоритм ф?Ф(е), такой что
сотр(ф(ЭТ(/))) <^ сотр (Щ для всех /€#0> то
32 Ч. А, ел. 1. Основные понятия
т.е. ф, по существу,—оптимальный по сложности алгоритм
для S при 9L Соотношения C.6) и C.7) объясняют наш интерес
к сотр(ЭТ).
Предположим, что е стремится к нулю. Тогда если г (ЭТ, S) > О,
то фиксированная информация 9? оказывается слабой для задачи S
при достаточно малых е. Однако во многих случаях можно
выбрать допустимый информационный оператор $1 = 9J (е) так, чтобы
r(9i(e), S) < е, и решить нашу задачу, используя информацию
Stt(e).
Пусть Т—класс допустимых информационных операторов.
Положим
C.8) г(Т, S)
Если г (^Р, S) = 0, то мы можем решить задачу 5 для любого е,
выбирая подходящий информационный оператор из Т. Если
г(Т, S)>0, то класс 4я не дает достаточной информации для
решения задачи 5 при e^rfY, S).
ОПРЕДЕЛЕНИЕ 3.2. Назовем г-сложностью задачи S в классе
W (кратко, г-сложностью S б Т) величину сотр (?, S, е),
задаваемую формулой
C.9) сотрРР, 5, е)= infcompER, S, г).
9* Ч?
Далее мы будем иногда говорить об е-сложности задачи 5 в классе V
просто как о сложности задачи.
Назовем срос оптимальным по сложности алгоритмом для
задачи S в классе W (кратко, оптимальным по сложности
алгоритмом для S в Т), если
C.10) . сотр(фос) = сотр (Y, S, г). |
Замечание 3.3. Отметим, что, хотя мы склонны думать о
сложности задачи как об ее внутреннем свойстве, сложность эта
определяется по отношению к модели вычислений и классу
информационных операторов. |
Заметим, что сотр(^, 5, г)—невозрастающая функция от е.
Из C.2) следует, что если в </-(?, 5), то compDf, S, е) = + оо.
Как мы покажем в гл. 5, comp (XF, 5, е) может быть по существу
произвольной невозрастающей функцией от е.
Наша постановка достаточно общая, чтобы охватывать й
такие задачи, в которых информационные операторы не играют
никакой роли. Примерами служат комбинаторные задачи и
некоторые задачи линейной алгебры, такие как перемножение
матриц или прямое решение линейных систем. Информационным
оператором в таких задачах является тождественный оператор
$lf = fy где / принадлежит конечномерному пространству. Далее,
3. Сложность общей информации 33
сотр(/) = 0, так как вычисление 9с'(/) = / ничего не стоит.
Заметим, что г(/, 5) = 0 для любой задачи S, потому что
оператор $1=1 осуществляет взаимно-однозначное соответствие. Таким
образом, можно положить ? = {/}. Как правило, требуется найти
точное решение a = S(/); следовательно, в = 0. Сложность задается
равенством
comp(/, S, 0)= inf сотр(ф(/)).
Следовательно, в теории сложности алгебраических и
комбинаторных задач ищется алгоритм, который находит a = S(f) и
обладает минимальной комбинаторной сложностью.
ПРИМЕР 3.2. Перемножение матриц. Положим f = [A, В],
где А и В—матрицы размера пхп. Тогда задачу перемножения
матриц можно сформулировать как S(f) = A*B. Пусть $l(f) =
= /=[Л, В]. Это значит, что все элементы матриц А и В
известны и ищется алгоритм минимальной комбинаторной
сложности, вычисляющий матрицу #(/) = Л*?. Если стоимость каждой
арифметической операции принять равной единице, то
с1д?<согпр(/, S, 0)<<yip
для некоторых положительных констант сг и с2\ наилучшее
известное р, согласно Пану [78], равно приблизительно 2.794
Истинное значение comp(/, S, 0) неизвестно. |
ПРИМЕР 3.3. Сортировка. Пусть f = [fu /2, ..., /„], ft?D,
где D—некоторое упорядоченное множество. Положим
' 5(Л = [Лч> fiE, .... ftnl
где Ut ^A2^.. *^//B» а Ч» • • ¦> *"п—перестановка чисел 1, ..., п.
Тогда задачу сортировки можно сформулировать как a = S(f).
Пусть 9? (/)==/ и е = 0. (Как было отмечено в замечании 2.3,
в случае е = 0 нет нужды предполагать пространства линейными
или нормированными.) Мы ищем алгоритм, который находит 5 (f)
с минимальными затратами, причем затратами считается число
сравнений. Сложность удовлетворяет соотношению
comp(/, S, 0) = (nlog2n)(l+
В последнее время возник интерес к отысканию е*приближе-
ний для решений алгебраических и комбинаторных задач. Для
Х) Сейчас наилучшее известное значение р в задачах перемножения матриц
и отыскания решения системы линейных уравнений (см. замечание 3.2) равно
приблизительно 2.4955 (Coppersmith D., Winograd S.On the asymptotic
complexity of matrix multiplication. — IBM T. J. Watson Research Center Rep.»
1981).— Прим. авторов к русскому изданию.
34 Ч. Ау гл. 1. Основные понятия
некоторых задач сложность comp(/, S, е) при положительных е
значительно меньше, чем comp(/, S, 0). Примеры можно найти
у Гэри и Д. Джонсона [76].
ПРИМЕР 3.4. Нуль многочлена. Положим / = [а0, а19 ..., а„],
где а?-—коэффициенты многочлена п-й степени Р(х). Пусть Р(а) = 0,
a = S(f). Для алгоритмов, в которых требуется знание всех ah
$11 (/) = /. С другой стороны, существуют итерационные алгоритмы,
в которых предполагается лишь возможность вычислить Р и Р'
в любой точке, и ЭД2(/) = [*, Р(х), Р'(х)].Щ
4. ПРЕДМЕТ ТЕОРИИ АНАЛИТИЧЕСКОЙ
ВЫЧИСЛИТЕЛЬНОЙ СЛОЖНОСТИ
Мы достигли момента, когда можно описать точнее предмет
теории аналитической сложности (см., в частности, определение
4.3 и последующие замечания).
Зафиксируем набор простейших операций Р и класс
допустимых информационных операторов 4я.
ОПРЕДЕЛЕНИЕ 4.1. Будем говорить, что задача S есть
задача конечной сложности в W (или просто задача конечной
сложности), если существует допустимый алгоритм, использующий
оператор Ш из "ЧУ и решающий ее точно (е = 0) с конечной
сложностью. Задача S есть задача бесконечной сложности в *? (или
просто задача бесконечной сложности), если она не является
задачей конечной сложности. |
Замечание 4.1. Является ли та или иная задача задачей
конечной или бесконечной сложности, можно определить только по
отношению к заданным Р и ? (см. пример из замечания 3.2,
относящийся к квадратному корню). |
При «разумном» наборе простейших операций «большинство»
задач математики, науки и техники—задачи бесконечной
сложности. Основные исключения—комбинаторные и некоторые
алгебраические задачи.
Хотя задачи конечной сложности можно, по определению,
решить с конечными затратами, эти затраты могут быть очень
большими. Поэтому может оказаться предпочтительным с точки
зрения уменьшения сложности решать такие задачи приближенно.
Важными примерами служат приближенное решение NP-пол-
ных задач и итеративное решение больших линейных систем
с разреженными матрицами.
Так как затраты на вычисления могут быть только конечными,
сами вычисления состоят в приближенном решении задач беско-
4. Предмет теории аналитической вычислительной сложности 35
нечной сложности и точном или приближенном решении задач
конечной сложности.
Удобно различать два типа информационных операторов.
ОПРЕДЕЛЕНИЕ 4.2. Если информационный оператор $1
взаимно-однозначен (инъективен) на 30, то мы говорим, что он
полон (на 30). В противном случае будем говорить, что 9{
неполон (на 30). |
Алгоритмы для задач бесконечной сложности часто, но не
всегда используют неполную информацию. Иногда используют
неполную информацию алгоритмы приближенного решения задач
конечной сложности. В случае полноты Щ наш принцип
соперничества (см. § 2) тривиален (в отношении радиуса информации).
ПРИМЕР 4.1. Как и в замечании 3.2, положим S(/) =
(/) ^
30 = [1, 21, Ш (/) = /. Пусть набор простейших операций таков:
{ , —, *, /). Тогда S—задача бесконечной сложности.
Определим допустимый алгоритм
Этот алгоритм использует полную информацию. |
Рассмотрим произвольный допустимый алгоритм ф,
использующий информацию y = gi(f). Как было отмечено в § 3, для
вычисления ф МЫ
(a) вычисляем y =
(b) вычисляем (
Стоимость вычисления у (у) для наихудшего у называется
комбинаторной сложностью алгоритма ф.
Заметим, что задачу минимизации комбинаторной сложности
можно всегда рассматривать как задачу конечной сложности
с полной информацией. Таким образом, эта задача алгебраической
сложности в нашей постановке—всегда вспомогательная задача.
Интересные результаты по алгебраической сложности, берущие
начало в теории аналитической сложности, можно найти у Брента
и Кунга [78, § 6] и Трояна [79]. В примерах 3.2 и 3.3 и в
обсуждении, предшествующем примеру 3.2, мы уже отмечали, что
в нашу постановку можно формально включить теорию
алгебраической сложности. Задача минимизации комбинаторной сложности
дает нетривиальный пример того, как алгебраическая сложность
укладывается в рамки этой постановки.
Теперь мы подготовлены к тому, чтобы точно определить наш
предмет.
ОПРЕДЕЛЕНИЕ 4,3. Теория аналитической вычислительной
сложности занимается изучением оптимальных алгоритмов для
2*
36 4. Ay гл. 1. Основные понятия
задач, решаемых приближенно. В качестве вспомогательных в
теории аналитической сложности может потребоваться решение
задач алгебраической сложности. Информационные операторы
часто являются неполными. |
Замечание 4.2. Примерами оптимальных алгоритмов служат
оптимальные по точности и оптимальные по сложности алгоритмы,
рассматриваемые в настоящей части, а также алгоритмы
максимального порядка и минимального индекса сложности,
рассматриваемые в части В. |
Замечание 4.3. Сложность оптимального по сложности
алгоритма в заданном классе информационных операторов есть
сложность задачи (см. определение 3.2 и замечание 3.3). Сложность
задачи—один из основных предметов обсуждения в теории
аналитической сложности. |
Замечание 4.4. Определение оптимального алгоритма зависит
от модели. Среди моделей, представляющих интерес,—модели
наихудшего случая, среднего случая и асимптотическая модель
(см. гл. 10). В этой книге изучается модель наихудшего случая.
Таким образом, под сложностью задачи мы подразумеваем
«сложность задачи в наихудшем случае». |
Эта монография посвящена в первую очередь задачам
бесконечной сложности. Вопросы, касающиеся приближенного решения
задач конечной сложности, мы рассчитываем обсудить в
последующей публикации.
В заключение укажем на некоторые взаимосвязи между
определениями 4.1 и 4.2:
Замечание 4.5. Если S—задача конечной сложности в Т, то
существует оператор Ш ? Т, такой что U (/) состоит из одной-
единственной точки для всех f?30. Если вдобавок оператор S
взаимно-однозначен то 9? полон.
Если S—задача бесконечной сложности в 4я, то имеет место
один из двух случаев:
(i) Для каждого Щ^^? существует /?30, такое что ?/(/)
содержит более одной точки. Каждый оператор $1 из Ч; неполон.
(и) Существует оператор ЭТ?ЧГ> такой что U (f) состоит из
одной-единственной точки для всех /?30, а е(ср)>0 для всех
допустимых ср (пример такой ситуации см. в замечании 3.2).
Тогда если оператор S взаимно-однозначен, то 91 полон. |
/. Введение 37
Глава 2
ТЕОРИЯ ЛИНЕЙНОЙ ИНФОРМАЦИИ
1. ВВЕДЕНИЕ
В последующих пяти главах предполагается, что оператор
решения 5 и информационный оператор 9i оба линейны.
Многие важные задачи линейны и потому охватываются
теорией, излагаемой в этой главе. Примерами могут служить
интегрирование, интерполяция, аппроксимация и линейные
дифференциальные уравнения с частными производными (см. гл. 6).
Заметим, однако, что решение линейных алгебраических
уравнений не является линейной задачей.
Линейность Ш—не столь сильное предположение, как может
показаться (см. гл. 7).
В гл. 1 задача определялась заданием оператора решения S
и набора элементов задачи 30. В этой главе мы добавляем сюда
еще некоторый линейный «ограничивающий» оператор (оператор
ограничений) Г, с помощью которого множество элементов задачи
/ ограничивается до множества 30. Чаще всего налагается какое-
нибудь условие регулярности. Важность Т в нашей работе трудно
переоценить. Много примеров использования Т будет приведено
в гл. 6 при описании приложений.
Мы вводим понятие кардинальности Ш (обозначаемой через
card(9f))—меры «количества информации», содержащейся в Ш.
Величину card(§R) можно представить себе как число линейно-
независимых линейных функционалов, задающих оператор 9L
Варьируя Щ, мы ищем наиболее «подходящий» для решения
задачи информационный оператор. Точнее, ищется оператор 9{,
минимизирующий диаметр информации на множестве всех
информационных операторов кардинальности, не превосходящей п.
Это наилучшее $1 мы называем я-й оптимальной информацией.
Для случая гильбертова пространства дано полное решение
проблемы оптимальной информации.
Возвращаясь к общему случаю, мы доказываем, что
существуют такие линейные задачи, что ни при каком е, сколь бы велико
оно ни было, и ни при каком конечном числе линейных
функционалов построить е-приближение невозможно. Этот
отрицательный результат не зависит от используемой модели вычислений.
В §§ 2—6 рассматривается неадаптивная информация,
состоящая из п независимо заданных линейных функционалов. В § 7
мы изучаем адаптивную информацию, характеризующуюся тем,
что ранее вычисленные функционалы можно использовать при
определении следующего функционала. Адаптивная информация
широко применяется на практике; как известно, она сильнее не-
38 Ч. А, гл. 2. Теория линейной информации
адаптивной информации для некоторых нелинейных задач. Мы
докажем тот удивительный факт, что адаптивная информация не
сильнее неадаптивной для линейных задач.
В различных местах данной монографии мы демонстрируем
связи между понятиями теории аппроксимации и теории
аналитической сложности. Это позволяет нам использовать глубокие
результаты из теории аппроксимации, и, наоборот, для решения
задач чистой теории аппроксимации можно использовать теорию
аналитической сложности. В § 6 устанавливаются связи между
n-поперечниками по Гельфанду и n-ми минимальными диаметрами.
Дадим краткий обзор основных результатов главы. В § 2
определяется кардинальность card (Ш) линейного информационного
оператора и показывается (лемма 2.2), что информационные
операторы конечной кардинальности, равной п; можно
представить п линейно-независимыми линейными функционалами. В § 3
рассматриваются задачи, определенные линейным оператором
решения S и линейным оператором ограничений Т. Мы
определяем индекс ind(S, T) и доказываем (теорема 3.2), что если
card (Ш) < ind E, Т), то нельзя найти е-приближение к решению
ни для какого е, даже сколь угодно большого. В частности,
если ind(S, Г) = оо, то задачу нельзя решить ни при каком
информационном операторе конечной кардинальности.
В следующем параграфе мы исследуем вопрос, какая
информация наиболее пригодна для решения данной задачи. Диаметр
d(n> S, Т) наилучшей информации кардинальности не выше п
мы называем n-м минимальным диаметром информации. Теорема 4.1
показывает, что d(n, S, Т) полностью определяется оператором
ST. Задача е-неразрешима, если d E, T)=\\mn _> «> d (n, S, T)> 2e,
и обладает свойством сходимости, если d(S, T) = 0. Доказывается
(лемма 4.5), что d(S, T) может быть любым числом.
В § 5 показано, что в случае гильбертова пространства задача
(S, Т) обладает свойством сходимости в том и только том случае,
когда оператор ST компактен. Задача о наилучшей
информации кардинальности п для гильбертова пространства решена
полностью (теорема 5.3).
В § 6 исследуются связи между n-ми минимальными
диаметрами и п-поперечниками по Гельфанду (теорема 6.1). Полученные
результаты используются для отыскания оптимальных или
близких к оптимальным информационных операторов.
В заключительном параграфе мы вводим понятие адаптивной
линейной информации и доказываем (теорема 7.1), что для
линейных задач адаптивная информация не сильнее неадаптивной.
2. Кардинальность линейной информации 39
2. КАРДИНАЛЬНОСТЬ ЛИНЕЙНОЙ ИНФОРМАЦИИ
Пусть Ш: З^ —>*33— линейный информационный оператор
(предполагается, что 33—линейное пространство), и пусть кег(9?)=
= {/: 9?(/) = 0} — ядро 9L В § 3 мы докажем, что зависимость
диаметра информации от оператора 9? сводится к зависимости
от его ядра. Это наводит на мысль, что не следует различать
два информационных оператора с одним и тем же ядром.
Пусть 9^: Э^ —*33 и 9?2: Эх —> 3i—два линейных
информационных оператора; здесь 33—линейное пространство, не
обязательно совпадающее с Э3.
ОПРЕДЕЛЕНИЕ 2.1. Будем говорить, что % содержится
в $12 (запись: Э^сгЗ^), если ker!DJ2ckerШг. Будем говорить, что
оператор $lt эквивалентен $12 (запись: ЙхХ^г)» если кЗ?
кЭТ
Заметим, что „X"—отношение эквивалентности.
Мы хотим показать, что включение ЭТхС:9?2 можно
характеризовать с помощью ранга некоторой матрицы. Сначала кратко
напомним некоторые факты, относящиеся к линейным
пространствам (см., например, книгу Эдвардса [65]). Пусть А—линейное
подпространство пространства 3^. Тогда в 32 существует такое
линейное подпространство Л1, что
B.1) З^ЛфЛ!.
Вообще говоря, Л1 определено не однозначно. Однако если
3>! — гильбертово пространство и А замкнуто, то существует
единственное Л1, ортогональное к Л и такое, что выполняется B.1).
В любом случае Л1 изоморфно фактор-пространству SjA и
df
-B.2) codim Л = dim Л-L == dim $JA.
Пространство Л1 называется алгебраическим дополнением к А
в пространстве Зх.
Пусть L19 La, ..., Lm—линейно-независимые линейные
функционалы. Обозначим через
B.3) % = [Llf L2, ..., LJ
оператор 3t —> (О, задаваемый формулой % (/)^[^i (/), L2 (/), ...
..., Lm(/)]*, где t обозначает транспонирование вектора.
Лемма 2.1. Пусть SR,=»[Llf L2, ..., Ln}{ и^2 = [1я+1, Ln+2y ..•
..., Ьп+к]{ — информационные операторы.
40 Ч. А, гл. 2. Теория линейной информации _
(i) 9^с:9?2, если и только если k^n и существует nxk-
матрица М, такая что
где rankM обозначает ранг матрицы М.
(и) Пусть k = n. Тогда 9tic9J2f если и только если Шг X 9?2. I
Доказательство, (i) Предположим, что ker 9?2c:ker 91Х. Пусть
S1-ker9J2e(ker9i2)i и (кегЭ72I = Нп(^, ?2, ..., у, где
Ln+/ (?,) = Ьф lin (g1? ?2, ..., Ik)— линейная оболочка элементов
?i, It, ..., Б*и б/у—символ Кронекера. Тогда /=/, + 2?=i Ln+i(f) h>
где /0€ker9f2 и /€3х. Поскольку /ogker^, получаем
B.4) Ly(/)= S Lw+/(/)Ly(y, для /=1, 2, .... п.
Отсюда ЭТ^ЛШ, cM = (L;.p. Пусть (ker Эг,I^ Ип(%, 4t. •••
..., tiJ, где Ly (x\i) = б/у. Положим в B.4) / = г],- для /=1,2, ..., п.
Тогда
1 = М[ШШШ, 9с2(г]2), ..., SM4J],
где / — единичная /г х n-матрица. Следовательно, rank M = n.
В одну сторону все доказано. Обратно, предположим, что
9ix = ЛШ2. Тогда из А € ker 9J2 следует Шг (А) = МШ2 (А) = 0, откуда
%Щ2
(ii) Пусть Э^сЭц. На основании первой части леммы 9?х =
=ЛШ2> где nx/г-матрица М невырожденна. Тогда 9f2 == 7И"9ix,
откуда 9{2c97i и 91, X 9f2* Обратное утверждение тривиально. |
Покажем теперь, что любой информационный оператор 9i с
конечным n = codimker9{ можно представить с помощью п
линейно-независимых линейных функционалов.
Лемма 2.2. Пусть 91—информационный оператор и л=
s=codimker 9i <+ оо. Тогда существуют такие
линейно-независимые линейные функционалы Llt L2, ..., Ln, что
9tX9tx, где %^[Llt L2t ..., LJ*. I
Доказательство. Пусть (ker9JI==lin(^1, ga, ..., gj. Каждый
элемент / может быть единственным образом представлен в
виде / = /оН-2?»1 Li(f)h> гДе /O€ker97, a Lu L2, ...,
?„—линейно-независимые линейные функционалы. Поскольку ker91=
= {/: L, (/) = 0, t=l, 2, ..., n} = ker9^, мы заключаем, что
Лемма 2.2 утверждает, что информационный оператор с
конечным п=* codim ker Ш эквивалентен информационному
оператору, заданному п линейно-независимыми линейными
функционалами. Отметим, что для вычисления 9^(/) надо вычислить
2. Кардинальность линейной информации 41
значения п линейных функционалов. Это приводит к следующему
определению кардинальности 91.
ОПРЕДЕЛЕНИЕ 2.2. Назовем кардинальностью информации
91 величину card(9i), задаваемую формулой
B.5) card (9l) = codimker$l( = dim Ш^)). I
Мы докажем в § 3, что если кардинальность информации
недостаточно велика, то диаметр информации бесконечен и задачу
с такой информацией решить нельзя.
Для иллюстрации понятия кардинальности приведем два
примера.
ПРИМЕР 2.1. Пусть 9? = [Lf, L2, ..., Ln]. Из проведенного
рассмотрения легко выводится, что card (9'{) s^ я и card (9J) = я
в том и только том случае, когда Llf L2, ..., Ln линейно-
независимы. |
ПРИМЕР 2.2. Пусть /: D с О —^ Ст—некоторая k раз
дифференцируемая функция и
9? (/)=/<*>(*) для x?D.
Заметим, что /(*) = [/,(*), /,(*), •••. /•(*)]*. гДе //• О-^С1-
скалярныефункции. Ясно, что fl& (х) можно представить^т k~~ j
линейно-независимыми функционалами вида L (/) = dkfldx\* ...
... д*?«, где х=[х19 х2, ..., xmf и /
Отсюда
Пусть 9i(/) = [/W, /'W» •••> /(B"X)W] (такая информация
называется стандартной). Тогда
Полученные равенства показывают зависимость кардинальности
от размерности пространства О. |
В завершение этого параграфа обратим внимание на наличие
взаимно-однозначного соответствия между информационными
операторами и подпространствами пространства 3^.
Пусть 9J—информационный оператор с card(9?) = n. Тогда
А(Ш) — кегШ имеет коразмерность, равную п. Кроме того, из
9^1 X 9?2 следует А ($11) = А (ЭТ8). Покажем теперь, что верно ц
обратное,
42 Ч. Л, гл. 2. Теория линейной информации
Лемма 2.3. Пусть А—произвольное линейное
подпространство в Sj, для которого сосПтЛ=я. Тогда существует
единственный (с точностью до эквивалентности) информационный
оператор $1 с card (Ш) = п, такой что А = кетЩ. |
Доказательство. Пусть Зх-=Лф Л-1, где A± = lin(t1$ ?я, . ..,!„).
Тогда f = fo + IiUiLi(f)th где /0?Л и МБу) = 6/у. Положим
Sl-[Llf L2, ..., LJ*.
Поскольку Ll9 L2, ..., Ln линейно-независимы, то card (9?) = я и
кег9! = Л. Чтобы доказать единственность, достаточно заметить,
что если Л = кег9?1 = кегЭТ2, то ^Х^. I
3. ИНДЕКС ЛИНЕЙНОЙ ЗАДАЧИ
В этом параграфе мы рассмотрим линейные информационные
операторы для элемента решения а = 5(/), где S:
Sx—*32—линейный оператор. Предположим, что 30 определяется равенством
(ЗЛ) ЗоН/№ »7711<П>
где Т: 3i-^S4=iT (Эх)— некоторый линейный оператор, а 34 —
нормированное линейное пространство над полем вещественных
или комплексных чисел. Будем называть Т ограничивающим
оператором или оператором ограничений. Таким образом, мы
хотим для всех /, таких что |)Г/||^1, найти е-приближение к
решению a = S(f).
Чтобы подчеркнуть зависимость от Г, заменим во всех
основных определениях S на E, Г). К примеру, будем говорить о
задаче (S, Г), диаметре d(-Hl, 5, Т) и т. д.; здесь Ш—линейный
информационный оператор.
Выбор ограничения ||Т/||^1, а не ограничения ЦТУЦ^с с
положительной константой с, не приводит ни к какой потере
общности. В самом деле, пусть Т1 = с~1Т. Тогда неравенство
II 7\/II ^ 1 эквивалентно неравенству ||Г/||^с. Как легко заметить,
, S, T)=cd(% 5, 7\) и все оценки сложности линейны по с.
Покажем теперь, что зависимость d(% 5, Т) от 91 сводится
к зависимости от одного только ядра Щ.
Лемма 3.1. Справедливо равенство
C.2) d(% S, Г) = 2 sup |SA||f
ft€ V @)
где V@) = ker9?n30 (см- B-4) из гл- 1)- ¦
Доказательство. Положим c = 2supA6y<o)||SA||. Пусть /€-Э0 и
f?V(f). Тогда /г = 2(/—fl€ker9t и ||77г||<1. Отсюда
3. Индекс линейной задачи43
Взяв верхнюю грань по / и /, получим d(9l, S, Т)^с. Докажем
обратное неравенство. Пусть h?V@), и пусть / = А и f= — А.
Тогда f?V(f) = V(O) и
21 ShI = ||Sj-Sfl^d(% S, Г).
Итак, c<d(9J, S, Т1), что и завершает доказательство. |
Из леммы 3.1 немедленно вытекает следующее утверждение.
Следствие 3.1. Если Э^сЭТ,, то d(9?a, S, r)<d(9tlf 5, Г).
Если %ХШ2У то d(SR,, S, T) = d(mu 5, Г). I
Замечание 3.1. При доказательстве леммы 3.1 и следствия
3.1 мы использовали лишь два свойства множества 80, а именно
то, что оно выпукло (т. е. /, g€30=s>*/ + (l —0g€30 We[0, 1])
и уравновешенно (т. е. симметрично относительно нуля:
/3/?8). В самом деле, легко видеть, что
S) = 2 sup ||SA I,
ft € ker 91 f) 30
,, S) и г@11э 5)<r(^2, S),
= d(9l2, 5) и r(^, S) = r(9i2, S)
для любых линейных операторов S и 91 и для любого
выпуклого уравновешенного множества 30. См. гл. 7, где эта задача
рассмотрена в общем нелинейном случае. |
В § 2 гл. 1 мы показали, что радиус г(Ш, S, Т) оказывается
равным неустранимой ошибке информации Ш и задачи E, Т).
В силу леммы 3.1,
с/2<г(ЭТ, S, Т)
где с = 2 sup/* е у (О) || S (ft) fl. Укажем теперь случай, когда
г(Жу S, Г) = с/2.
Лемма 3.2. Если для любого /?30 существует Л0
такое что Tho = Tft то
r{%S, T)= sup ||S(A)[|. I
hev @)
Доказательство. Пусть a?S(f—h0). Тогда для всякого /
К(/), А € ker Я, имеем |]a-Sf|| = ||Sz||, где z =
. Поскольку Tho = Tf, то
Используя соотношение B.10) гл. 1 и лемму 3.1, получаем
г($1, 5, Г)< sup sup (a-S/K SUP \}Sz\\ = ±d(dl, 5, Г).
fe30 JeV(f) ге\/(о) ^
Обратно, г(ЭТ, S, T)^2-1d($ttS,T) для любых 91, 5 и Т. |
44 Ч. Ау гл. 2. Теория линейной информации
Установим, когда диаметр d(9l,5, Т) равен бесконечности
(конечно, из d(9l, 5, Г) = +оо следует, что г (91, S, 7) = +оо).
Начнем со следующей теоремы.
Теорема 3.1. Если кег 91 (] кег Т <? кег 5, то d (91, S, Т) = + оо. |
Доказательство. Пусть ft € кег ЭТ П кег Т и Л (? кег 5. Тогда
T(c/i) = 0, Sft(cft) = O для любой константы с. Далее, JS(cft)| =
=|с|||S/i||—* + oo при |с|—*+°°. На основании леммы 3.1
заключаем, что d(dl S, Г) = +оо. |
Теорема 3.1 утверждает, что для конечности d(9l, S, Г) яе-
обходимо, чтобы ker linker Г содержалось в kerS. Докажем, что
из условия кег Щ П кег Г с кег S следует, что кардинальность $1
не меньше «индекса задачи». Пусть
,3 о) кег7 = (кегГ П kerSH4 (Г, S),
1 }
где Л(Т,5)—алгебраическое дополнение к подпространству
кег Т Г) ker S в пространстве кег Г, а элементы Ц9 ...,5л*
образуют базис в Л (Г, 5), я* = п*(Г,5Х +
ОПРЕДЕЛЕНИЕ 3.1. Будем называть величину indE, T) =
= dim Л (T,S) индексом задачи (S, Г). Иногда мы будем
обозначать ind E, Т) через Аг*. |
Заметим, что если величина dim(kerrr) kerS) конечна, то
ind (S, Т) = dim (ker 71)—dim (ker T П ker 5).
Мы готовы теперь доказать основное утверждение этого
параграфа.
Теорема 3.2. Если card (91) < ind E, Г), то d(9i, S, Г)= + оо. |
Доказательство. Покажем, что кег 91П кег Гс^кег S. Рассмотрим
f = ^HL1cil*i€A(TiS). Мы хотим найти такой ненулевой вектор
(с19 с2У ..., сп*)> что /g ker 9L Из леммы 2.2 следует существование
информационного оператора 9l1 = [LiiL2y...>Lm]i, такого что
ker 91г = ker 91, где т == card (Ш) < ind E, Т). Поэтому / б кег 91,
если и только если Ly (f) = 2?=i c/^v (?*)= ° для / — 1» 2, ..., m.
Мы получили однородную систему из m уравнений с п*
неизвестными. Поскольку m < п*, существует ненулевой вектор (с1?
с2»---,^*)> являющийся решением системы. Таким образом,
Оф[?А (Т, S)flker9f. Это означает, что ненулевой элемент/
принадлежит ker Sinker T1, но не принадлежит kerS. Итак,
d(9l, S, Г) = +оо по теореме 3.1. |
Теорема 3.2 утверждает, что ни один информационный
оператор кардинальности, меньшей чем индекс задачи E, Т), не дает
3. Индекс линейной задачи 45
информации, достаточной для решения задачи. Для случая
indE, T)==+oo мы получаем такое следствие.
Следствие 3.2. Если indE, Т) = +оо, то задачу (S, Т) нельзя
решить ни при каком информационном операторе конечной
кардинальности. |
Проиллюстрируем предыдущие результаты для некоторых
операторов ограничений 7\ Начнем с 7 = 0.
Лемма 3.3 (случай отсутствия ограничений). Пусть 7 = 0.
Тогда
(i) d (Ш, 5, 0) равняется либо нулю, либо бесконечности;
точнее, ker Я <? kerS^d($R,S,0)=+oo^e^
(ii) ind E, 0) = dim (kerSI конечен, если и только если S —
конечномерный оператор, т. е. dimS^j) < + оо. |
Доказательство. Так как 7 = 0, то 3^ = 3! и ker7 = 3x. Если
9?кег7 = кег9{(?кег5, то d(§l, S, 0) = +°° по теореме 3.1.
Если kerSRckerS, то Sh = 0 для всех h?V(O) = ker$lczkeTS.
На основании леммы 3.1 заключаем, что d(9l, S,0) = 0. Этим
доказано (i).
Из C.3) вытекает, что Л (O,S) = (kerS)J-Hind(S, 0)==dim(ker5)-L.
Хорошо известно, что размерность dim(kerS)-1- конечна тогда и
только тогда, когда S — конечномерный оператор. Этим
доказано (ii). |
В качестве второй иллюстрации рассмотрим оператор T = Dk,
k^O, т. е. Tf—zfik) для скалярных функций /. Если оператор S
взаимно-однозначен, то
и ind (S, Dk) = dim (ker T) = k. Чтобы гарантировать, что card (Щ^
^ ind (S, Dk) и ker Ы П ker T = ker 5 == {0[, необходимо поэтому
вычислять k линейных функционалов.
Замечание 3.2. Покажем, что с точностью до одной чисто
технической подробности, предположение о том, что 30 задаетсй
некоторым оператором ограничений, и предположение, что 30 —
выпуклое уравновешенное поглощающее множество, эквивалентны.
Напомним, что множество называется поглощающим, если для
любого /?$! существует такая положительная константа с, что
/е0
Для доказательства эквивалентности предположим сначала,
что Зо^/бЗ^ ||77(^1} задано оператором ограничений Т.
Тогда, очевидно, 30 — выпуклое уравновешенное поглощающее
множество.
46 Ч. Л, гл. 2. Теория линейной информации
Обратно, пусть 30—выпуклое уравновешенное поглощающее
множество. Покажем, что существуют нормированное линейное
пространство 34 и линейный оператор Т: Зх —*34, такие что
C.4) 30с=Э0сЭ0,
где ЗоН^^: ||Г/|< 1}, 30 = {/: Ц77К1}. Для доказательства
C.4) рассмотрим функционал Минковского q: 3X —*> R,
отвечающий множеству 30. Напомним, что он определяется
формулой
0, с>0\.
Известно (см., например, Вилански [78]), что q—полунорма и
C.5)
Пусть
Если /, g?A, то для любых констант сх и с2 имеем
отсюда следует, что cJ + c2g?A. Итак, А—линейное
подпространство в 31в Пусть 3! = ЛфЛ^. Тогда / = /i + /2, где /Л
/2g Л-1-. Положим
и ||/2|| =
Если <7(/2) = О, то /2бЛ, а поэтому /2 = 0; следовательно, q
является нормой в 34. Таким образом, р4—нормированное
линейное пространство. Определим линейный оператор Т формулой
Поскольку lfil=*q(ft) = q(f)9 имеем
Поэтому из C.5) вытекает C.4).
Заметим, что Эо может не совпадать ни с 30, ни с 30.
Очевидно, однако, что операторы решения S = S|37~h 5"=5|jo имеют
один и тот же радиус и диаметр информации^ т. е.
г (SR, S) - г (% S) = г (SR, 5), d («Я, 5) = d («R, S) = d (91, S) VSR.
Это показывает, что задачи S, S и S отличаются друг от друга
несущественно. |
4. Оптимальные линейные информационные операторы 47
4. ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ
ИНФОРМАЦИОННЫЕ ОПЕРАТОРЫ
До конца этой главы будем предполагать, что п*= ind(S, T)<
< + оо. Мы построим информационный оператор 91* с card(9Z*)=
= ind(S, Г), такой что ker 9J* П ker TakerS. Напомним, что
подпространство A (T,S) определяется соотношением C.3) и А(Т, S)=
=lin (К, Г., • • •, Гп*). Пусть Зх - А (Т, S)®A (Г, S)i, где ДG\ S)J-=
= (ker7nkerS)©(kerr)J.. Тогда / = 2?-iL?tf)E? + /i. где /Х6
4(rS)L L*(|;) S
Лемма 4.1. Пусть
D.1) «• = [L;,L;
Тогда ker9{*nkerrc=kerS. I
Доказательство. Пусть /€кегГ. Тогда / = /0 + 2?-iL (Л2Л
где /oeker7nkerS. Если к тому же /?ker9i*, то Lj(f) = O при
/=1, 2, ...,л* и / = /0?kS |
Чтобы упростить дальнейшие рассуждения и гарантировать,
что kerSJnkerTcrkerS, будем рассматривать на протяжении этого
параграфа только такие информационные операторы, для которых
5ft*c=9I (Это означает, что ker9?ckerSR* и kerЩ П kerТсkerШ*{]
nkerTckerS, в силу леммы 4.1.)
Покажем, что диаметр d(9l, S, Т) можно вычислять с помощью
обратного к Т оператора Т, определяемого следующим
образом (Ту вообще говоря, не является взаимно-однозначным).
Напомним, что 34 = 7C!). Пусть
D.2) 31 = ker7©(ker71)J-.
Таким образом, всякий элемент /€^i представим в виде f=f1+f29
где /xgkerT, а /2€(кегГ)-к Определим линейный оператор 71:
34 —*3lf положив
D.3) Г-12 = /2 для z = 7/.
Проверим, что Т определен корректно. Пусть z — Tf = Tg, где
/,g€3i. ТаккакГ(/~gr) = 0,To/-g = (/3-^) + (/2-g2Nkerr,
откуда /2 = ^2- Это показывает, что Т~гг не зависит от выбора
конкретного элемента в прообразе г. Следовательно, Г
определен корректно. Заметим, что оператор Т'1 зависит от
конкретного выбора (kerT)-L в D.2).
В качестве примера отметим, что в случае Т~0 мы имеем
34 = {0} и О-^О,
48 Ч. А, гл. 2. Теория линейной информации
Пусть К: 34 —^2—линейный оператор и В — некоторое
линейное подпространство в $4. Введем обозначение
D.4) \\К\\В= sup \\Kz\\.
\)z\\<i,zeB
Теперь может быть доказана
Лемма 4.2. Пусть 9?*с:9{. Тогда
D.5)
Доказательство. В лемме 3Л утверждается, что d(9?, S, 7")=*
= 2sup||ShI, где 91/i = 0 и |O7i||< 1. Пусть h = /h + /i2, в
соответствии с D.2). Так как h? ker9Jcker 91* = A G\ S)J-, то из C.3)
следует, что hx ? ker T (] ker 5. Поэтому Sh = Sh2 и Th = Thu.
Пусть z = Th?T(ker9T). Тогда T'xz^h2 и ST^z^Sh^ откуда
и вытекает D.5). |
Лемма 4.2 утверждает, что диаметр d(9J, S, 71) равен
удвоенной норме линейного оператора /C = S71~1 в некотором линейном
подпространстве В = Г(кег9?). Это подводит нас к следующей
проблеме. Для фиксированного целого п найти наиболее
пригодный для решения задачи информационный оператор Ш с card (91)^ л,
т. е. оператор, минимизирующий d(SR, S,T) на множестве всех
информационных операторов кардинальности не более п. Как мы
покажем, это эквивалентно нахождению линейного
подпространства В с codimB^n—п*, которое минимизирует \\К\\в на
множестве всех линейных подпространств коразмерности не более
п—п*.
Чтобы формализовать поставленную проблему, обозначим
через хРп класс всех линейных информационных операторов 91, таких
что 9f*cz97 и card(9l)</z, где rc>ind(S, Г).
ОПРЕДЕЛЕНИЕ 4.1. Будем говорить, что d(nt 5, Т)—есть
n-Pi минимальный диаметр информации, если
( inf d(9l, 5, Г) при n>indE, Г),
D.6) d(n, 5, Г) = < *€*„
V 1 +оо при n<indE, Г).
Будем называть п-й оптимальной информацией оператор 9^»
удовлетворяющий условиям
D.7) d(n, S, T) = d(m«,S, П WSVn- ¦
Мы положили d(n, S, Г)= -f сх> при п < ind(S, T), так как
d(n, S, Т)=+сх) для любого 97 кардинальности, меньшей чем
ind (S, Т). В § 6 изучаются взаимосвязи между d(n, S, Т) и п-
поперечниками по Гельфанду. Проиллюстрируем определение 4.1
следующим примером.
4. Оптимальные линейные информационные операторы 49
ПРИМЕР 4.1. Пусть dim-Sj =+оо и T=J—тождественный
оператор. Для заданной положительной константы с положим
S = cl. Тогда
D.8) d(n,clt /) = 2c V/i.
В самом деле, пусть ЭТе^. Тогда кегЖф{0\ и d($tt S, Г) =
= 2[|с/|]ker«и === 2с Заметим, что ф(ЭД(/) = 0 — оптимальный по
точности алгоритм, так как е(у) = с = 2-1 d(9l, 5, Т) = г (Ш, S, Т).
Это означает, что, независимо от количества вычисляемых
линейных функционалов, наилучшей аппроксимацией решения
уравнения S/ = c/, 1/1^1, будет нуль пространства 31в (Заметим, что
близкие вопросы рассматривал Шульц [74].)
В то же время для тождественного информационного
оператора 5R(/) = / мы получаем кег9? = {0} и d(l,cl, /) = 0.
Отметим, что card(/)=+оо. Это показывает, что d(n, S, Т) как
функция от п может быть разрывной на бесконечности. |
Из примера 4.1 вытекает такое
Следствие 4.1. Для каждого (сколь угодно большого) 8
существует линейная задача (S, Т) конечного индекса, для которой
ни при каком конечном числе линейных функционалов построение
е-аппроксимации невозможно. |
Покажем, что п-й минимальный диаметр и п-я оптимальная
информация полностью определяются оператором K = ST~1.
Назовем величину
D.9) b(m,K) = 2 inf \\K\\B
m-й минимальной нормой линейного оператора /С.
Предположим, что существует последовательность {Вт\,
удовлетворяющая условиям
D.10) b(m,/
Пусть 34 = B^©Bii
D.11) g
где go?Bm и Bm = \in(v)Umy т|2§ л, ....^ J при k = k(m) =
= codimBOT^/n. Подпространство Вт будем называть т-м
минимальным подпространством линейного оператора К»
Напомним, что Lx*, L2*, ..., L** задают Щ* (см. C.3) и D.1)).
Положим по определению
D.12) Лп = [Ll9 L2, .. ., Ln*, Llt n-n*T, ..., Lk{n_n*)t n^n*T] .
готоэы доказать основной результат этого параграфа.
50 Ч. Л, гл. 2. Теория линейной информации
Теорема 4.1. Информация ЩпУ определенная равенством D.12),
является п-й оптимальной информацией, и
№a, S, T) = d{n, 5, T) = b(n—n*9 К),
Для доказательства теоремы 4.1 нам потребуются две леммы.
Лемма 4.3. Пусть В — произвольное линейное подпространство
в 34 с codim B = k < + oo. Тогда существует единственная
(с точностью до эквивалентности) информация 97, для которой
(i) 97* с: 97,
(И) Т (ker 97) = В,
(iii) card (97) = ? + "*• |
Доказательство. Пусть 34 = В ф /3-L, а Б1 = Пп (%, т]2, ..., г\к).
Для каждого g?34 имеем g=g() + 2?-i^/te)Tl/. гДе ?о€? и
/^ (г^) = б,.у. Положим
D.14) m = [Ll,Ll ...,Ln.,LiT, L2T, ...%LhT]*.
Тогда ker^ = {/: Ц(/) = 0, Ly(T/) = 0, r = 1, 2, ...,«*,/= 1,
..., fe}cker 9i*, чем доказано (i). Пусть /г ? ker 97. Тогда L/(T'/i)=0
при /= 1, 2, ..., k и Th?B. Следовательно, Г(кег97)с=В. Пусть
теперь g—произвольный элемент из В, т. е. L/(g") = 0 приг = 1,
2, ...,?. Поскольку g€?4i т0 существует /б^, для которого
g=Tf. Рассмотрим разложение/=^ + /2» rAe/i € ker 7\ а/2 б (kerT)-L
(см. D.2)). Имеем g=Tf = Tf2. Из того что ЦЦш) = 0 при f=l,
2, ..., п* и L/(T/2) = 0 при t= 1, 2, ..., /г, вытекает, что
/2?ker97 и g = 7/2g:T(ker9l). Отсюда Г(кёг9с) = В, чем
доказано (и).
Для установления равенства card (97) = k -f д* покажем, что
Lt, ..., L^*, LXT, ..., LfeT линейно-независимы (см. пример 2.1).
Допустим, что
Положим / = ?*, где gjt Ц, ..., ?** образуют базис Л (Т, S)
(см. C.3)). Тогда Т?- =0 и LJ (^) = б/у.. Следовательно, с( = 0 при
i = l, 2, ..., п*. Пусть теперь r\i = Tfi и / = /,-. Поскольку
L/{Tfi) = L/D\i)=*bij9 мы видим, что d, = 0 при « = 1, 2, ...,&.
Этим доказано равенство card (Ш) = /? + п*.
Наконец докажем единственность 97. Предположим, что некий
информационный оператор 97, = [L1, L2, . .., Lk+n*]{удовлетворяет
условиям (i) — (iii). Включение ker 97j cz ker 9i* означает, что
ft? ker 97, влечет Ц (h) = 0 для /=1,2, ...,n*. Далее, Г (ker 9^=5
означав, что h^kerdl, влечет 7/ig/?, т. е. ^G/0 = 0, /=1, 2,
..., /2. Таким образом, h?ker$l и ker 97^ с ker 97. Так как
4. Оптимальные линейные информационные операторы 51
card (910 = card (97), то на основании леммы 2.1 мы заключаем,
что д^жШ. |
Ввиду единственности 97 будем писать 91 = 9?(Т, В). Заметим,
что оператор 97„, определенный посредством D.12), равен 97„ (Г,
Вп_п*), где Вп_п* является (п — п*)-м минимальным
подпространством для ЛГ.
Лемма 4.4. Пусть card (9?) = п и 97*с91. Тогда codim T (ker 97) <
<п—п*. |
Доказательство. Пусть Б = Г (ker 97) и & = codim В. По лемме 4.3
оператор 971 = 971G\ В) обладает свойствами 97*с97х и card (97!)=
=k + n*. Повторяя часть доказательства леммы 4.3, легко
показать, что ker 97 с: ker 9{х. В силу леммы 2.1, 971 = Л197, где
(k -\- п*) х /г-матрица М имеет ранг k-{~n*. Это возможно, только
если k^.n—п*. |
Доказательство теоремы 4.1. Согласно лемме 4.3,
Пусть 97—произвольный информационный оператор из
В силу леммы 4.4, codim T (ker 97) ^ п—п* и
Этим доказано, что 97„ есть n-я оптимальная информация и
d(% S, T) = d(n, S, Г) = &(л-л*, /С).|
Если d(n, S, T)^ 2s, то отыскать е-аппроксимацию
невозможно ни при каком информационном операторе 97 с card (97) ^д.
В этом случае следует попробовать увеличить /г; может быть,
найдется такое т> /г, что d(m, S, Т) < 2е. Этим объясняется наш
интерес к зависимости п-ro оптимального диаметра d(n, S, Т)
от д. Заметим, что d(n, S, Т)—невозрастающая функция от п.
ОПРЕДЕЛЕНИЕ 4.2. Величину d(S, Г), задаваемую
формулой
D.15) d(St Г)= lim d(n, S, Г),
/г ->- с»
назовем диаметром погрешности задачи в классе информации
конечной кардинальности. Будем говорить, что задача E, Т)
сильно неразрешима, если d(S, Т) = +<х>; г-не разрешима, если
d(S, Г)^2е>0; обладает свойством сходимости, если
dE, T) = 0. |
Покажем, что диаметр погрешности задачи d(S, T) может
быть любым числом. Отсюда следует, что для любого е
существуют е-неразрешимые линейные задачи.
52 Ч. А> гл. 2. Теория линейной информации
Лемма 4.5, Пусть б?[0, +оо]. Тогда существует линейная
задача E, 7"), для которой
D.16) d(S, Г) = 6.|
Доказательство. Пусть б = + <х>. Положим Т = О, и пусть
оператор S взаимно-однозначен. В силу леммы 3.3, для
бесконечномерного 3j имеем ind E, 0) = + оо. Далее, d(n, S, 0) = + °°
по теореме 3.2 для любого конечного п и dE, Т)= + оо = 8.
Пусть теперь б?[0, +оо). Пример 4.1 дает d(n, F/2)/, /) = б
для любого п. Итак, dE, Т) = б. |
В следующем параграфе мы выясним, когда задача (S, Т)
обладает свойством сходимости и как найти я-ю минимальную
информацию.
5. сходимость и минимальные
ПОДПРОСТРАНСТВА ДЛЯ СЛУЧАЯ
ГИЛЬБЕРТОВА ПРОСТРАНСТВА
В этом параграфе мы устанавливаем взаимосвязи между
диаметром погрешности задачи d(S, T) и оператором K = ST~i:
Теорема 5.1. Пусть \Кп\—произвольная последовательность
конечномерных линейных операторов Кп: 34 -*32, dim (Kn C4))<
< + оо. Тогда
E.1) d(S9 r)<2inf||/C-/CJ|.|
Доказательство. Положим Вр = ker /Сл, где р = р (п) =
= codim ker Kn = dim (/(„ C4)) < + оо. По лемме 4.3 существует
единственный информационный оператор 9^+п* = Э1р+„»(Т, В^),
для которого Ш*аШр+п* и card (9ip+A2*) = /? -|-лг*. Из леммы 4.2
вытекает, что d(9ip+rt*, 5, Г) = 2||/С||в,. Так как Kg={K—Kn)g
для любого g?B имеем ||/(?|К||а —/СЯ||Ы|. Следовательно,
|/С1вя<||/С-/Ся||. Наконец,
d(S, Г
откуда и следует E.1). I
Из теоремы 5.1 вытекает, что если К можно равномерно
аппроксимировать последовательностью \Кп} (\imn\\K—/С„|| = 0),
то задача (S, Т) обладает свойством сходимости. В случае
гильбертова пространства 32 это имеет место тогда и только тогда,
когда оператор К компактен.
Покажем теперь, что иногда можно оценить d(S> T) снизу
величиной 2p"Mnfw||/C—Кп\ при надлежаще выбранных р и {Кп\.
С этой целью определим р = рC4} следующим образом. Пусть
5. Сходимость для случая гильбертова пространства 53
Л —произвольное замкнутое подпространство в 34 конечной
коразмерности. Предположим, что существует такое алгебраическое
дополнение Л1 к Л, dim Л-1 < + °°, что для каждого g = gi"\-gi9
gi^A, g2?AA'i имеет место неравенство
E.2) IftKPlfifll-
Заметим, что если 34—гильбертово пространство, то в качестве Л-1-
можно взять ортогональное дополнение к Л и ||gi|l = K||gl|2 —ll&ll2!
откуда рC4)=1. Положим Pg = g+ Vgg34. Тогда Р—непрерыв-
ный проектор, и E.2) показывает, что ||Р||^р. Итак,
существование конечного р означает, что норма каждого непрерывного
проектора, образ которого имеет конечную коразмерность,
ограничена величиной р.
Теперь может быть доказана
Теорема 5.2. Пусть оператор К непрерывен и р = р C4) конечно.
Тогда существует такая последовательность конечномерных
непрерывных линейных операторов {Кп}, что
E.3) 2ml\\K-Kn\\^pd(S9 Т).Щ
Доказательство. Пусть {Щп}—такая последовательность
информационных операторов, что card (Щп)^п и inlnd(Wn, S, Т)=*
=*d(S, Т). В силу лемм 4.2 и 4.4, rf@1ЯЭ S, Т) = 2\\К\\вп,
Вп~Т (ker$ln) и codim Bn^n—я*. Поскольку оператор К не-
прерывен^ то || /С |) в^ = [1 /С ||я„ • Пусть 34-В„0В^. Тогда g = gl+gt9
где g1?Bn, g2?Bk и ||ft|Kp||g||, так как codimВп^п—п*.
Положим
Ясно, что Кп—непрерывный линейный оператор из 34 в $й и
B^<n — n* <-{- оо. Кроме того,
Этим доказано, что \\К—Кп\\<р\\К\\вп *=*pd($tnJ 5, Г)/2 и
2lt\KKl<d{ST)
Из теорем 5.1 и 5.2 вытекает такое следствие.
Следствие 5.1. Пусть К: Э4 —>Зд—непрерывный оператор,
причем 32 и 84—гильбертовы пространства. Тогда задача (S, Т)
обладает свойством сходимости в том и только в том случае,
когда К компактен. |
Следствие 5.1. дает необходимое и достаточное условие для
того, чтобы задача (S, Т) обладала свойстом сходимости.
Заметьте, что во многих случаях оператор K^ST'1 не является
54 Ч. Л, гл. 2. Теория линейной информации
компактным. Например, он не компактен, если S = T = I, а $4
бесконечномерно.
Покажем, как находить минимальные подпространства для К
в предположении, что К компактен и /СC4)с34, для случая
гильбертова пространства Э4. Пусть /С* —сопряженный к К
оператор. Рассмотрим самосопряженный компактный оператор
df
@.4) /\1 = /\*Л: ч>4—^^4*
Запишем 34 = ker/C10(ker/C1I, где ортогональное дополнение
(ker/CJ1 натянуто на собственные векторы оператора Кх т. е.
E.5) (ker/C1I = lin(^1, ga, ..., у, r^ + оо, /С1^. = Х/|/;
здесь %1 > 0 и А,!^^^---» (lh Sy) = S/y. Если г конечно, то
формально полагаем Я,. = 0 и ?/ = 0 при i^r + l. В силу
компактности /Ci, lim^^O. Каждый элемент /^34_может быть
единственным способом разложен в сумму f = i
где /о 6 кег Кг. Положим
E.6) Вп^
и определим информационный оператор равенством
E.7) Шп (/) = [Ц (/),..., L,% (/), (Г/, EJ (Г/, ^_п*)]1,
где Li, ...,L^* заданы соотношением D.1). Теперь мы готовы
доказать следующий результат.
Теорема 5.3. Пусть Э4 — гильбертово пространство, а К ==
= ST —компактный оператор, для которого /С C4)с34.
Информационный оператор Шп> определенный формулой E.7), является
п-й оптимальной информацией, а подпространство Вп_п*,
определенное формулой E.6), служит (п—я*)-м линейным
подпространством оператора /С, и
E.8) d($in, 5, T) = d(n, S, T) = b(n-n*y K) = 2V%^Z.§
Доказательство. Покажем сначала, что Bk является k-м
минимальным подпространством, k = n—n*. Пусть f?Bk. Тогда
/ / 2 tf Е)Б f к/С im* (KfKf) (KJ /)
рр
= /о + 2Г-*+1 tf. Е,)Б/. где f0 б кег/С, и
2 ^llir T
/ /о + 2Г*+1 tf. Е,)/ f0 , im (ff) (J, /)
=2r-ft+il(/. S/)l2^i<^+illir TaK как эта оиенка точна, мы
заключаем, что ||К\\Bk =V~K+i- Пусть теперь В —произвольное
линейное подпространство с сосНтВ^й. Тогда З^ВфВ1 и
В1 = Нп(т]1, г]2, ...,r)J, где m = codimB<fe. Далее, / = /0 +
+ HT-iLjlf) Y)i при некоторых линейных функционалах Lb L2, ...
..., Lm и fo?B. Поэтому /€В, если и только если L, (/) = 0при
i=l, 2, ...,т. Пусть / = 2?-11с^/- Система уравнений L/ (/) = 0,
? = 1,2, ...,т, эквивалентна уравнению Мс = 0, где М =
6. Связь с п-поперечниками по Гельфанду 55
= (?/ (?/))—матрица размера тх(Л + 1), а 0 = ^, с2, . ..J
Так как т<&+1, то у последнего уравнения всегда существует
ненулевое решение с, и ненулевой вектор / = 2?-ic/?i пРинаД"
лежит В. Далее,
откуда IKIb^VK+i — WI^ ¦ Этим доказано, что Bk есть fe-e
минимальное подпространство и Ь(п—я*, К) = 2у%п-п*+1.
Заметим, что fl^ = lin(?1, g2, ..., У и /,/Л(/)==(/, h) для
*=1, 2, ..., k (см. D.11)). Таким образом, информационный
оператор Шп, определенный равенством E.7), идентичен
оператору D.12). На основании теоремы 4.1 заключаем, что Шп есть
п-я оптимальная информация и
п, S, T) = d(n,S, T) = b(n-n\ *)
Оператор Шп дает наилучшую возможную в классе л?а
информацию о задаче (S, Т). Заметим, что вычисление (Т/, ?,-) означает
вычисление i-й компоненты Tf в разложении по собственным
векторам оператора /d.
6. СВЯЗЬ С Я-ПОПЕРЕЧНИКАМИ ПО ГЕЛЬФАНДУ
Это первый из ряда параграфов, в которых показывается, что
для нахождения или оценки основных величин теории
аналитической сложности могут оказаться полезными результаты теории
аппроксимации. В данном параграфе мы устанавливаем
взаимосвязи между я-ми минимальными диаметрами и я-поперечниками
по Гельфанду. В § 5 гл. 3 мы покажем, что минимальные ошибки
линейных алгоритмов связаны с линейными n-поперечниками по
Колмогорову. Наконец, в § 4 гл. 7 будут установлены
взаимосвязи между n-поперечниками по Колмогорову и минимальными
ошибками я-мерных алгоритмов, а также между кардинальностью
линейных информационных операторов радиуса меньше е и е-эн-
тропией области значений оператора решения.
Эти взаимосвязи интересны с математической точки зрения.
Кроме того, они представляют немалый практический интерес,
так как многие глубокие или труднодоказываемые результаты
теории аппроксимации можно использовать для установления
оптимальности информационных операторов и/или оптимальности
алгоритмов. И наоборот, результаты по оптимальности
информационных операторов и алгоритмов могут быть иногда полезными
для решения чисто аппроксимационных задач.
Начнем с изучения взаимосвязей между /г-ми минимальными
диаметрами и n-поперечниками по Гельфанду. В §§ 3—5 пред-
56 Ч. А, гл. 2. Теория линейной информации
полагалось, что область определения <Э0 линейного оператора
решения S задается в виде C.1) при помощи некоторого
оператора ограничений Т (см замечание 3.2). Здесь мы заменим
предположение C.1) предположением, что 30 —уравновешенное
выпуклое подмножество в 31# Тогда, как было отмечено в замечании 3.1,
F.1) d(% S) = 2 sup (|Sft||
для произвольного линейного информационного оператора $1.
Нам надо обобщить понятие п-го минимального диаметра и
л-й оптимальной информации, введенное в D.6). В § 4 мы
определили ЛРп как класс всех линейных информационных операторов Щ,
для которых ЭТ*с91 и card (9?)^ я, где n^indE, Т). Будем
теперь считать, что у?п—это более широкий класс всех линейных
информационных операторов с card (Ш) ^ п.
ОПРЕДЕЛЕНИЕ 6.1. Назовем п-м минимальным диаметром
информации величину d(n) = d(n, S, 30), задаваемую формулой
F.2) d(n) = inf d(9l, S)(=*2 inf sup I
Будем говорить, что $tf есть п-я оптимальная информация, если
F.3) d(n)
Заметим, что если 30 задано в форме C.1) и Ш* содержится
в каждом информационном операторе, то определение 6.1
совпадает с определением 4.1 и d(n) = d(n9 S, Г).
Покажем, что существует тесная взаимосвязь между л-ми
минимальными диаметрами d (n) и д-поперечниками по Гель ранду,
определяемыми следующим образом. Пусть X — уравновешенное
множество в нормированном линейном пространстве 32. Величина
F.4) dn(X, 32) = inf sup ||*1,
A* xeXf\An
где Ап—подпространство в 82 с codim^")^n, называется п-
поперечником множества X по Гельфанду. Ясно, что Ап—{х?$2:
/^.(x) = 0, t=l, 2, ..., п} при некоторых линейных
функционалах R{9 i?2, ..., Rn. Поэтому, грубо говоря, д-поперечник по
Гельфанду—это максимальная норма элемента л: из X,
удовлетворяющего п должным образом выбранным ограничениям (см.
Тихомиров [65]). Пусть
F.5) d» = d
есть n-поперечник по Гельфанду области значений в 32 оператора
решения. Чтобы установить взаимосвязи между d(n) и d",
поступим следующим образом. Пусть 3X = ker S©(kerSI, т. е. для
Каждого / из 3j существует единственное разложение / = Д •+-/а>
6. Связь с п-поперечниками по Гельфанду 57
где /jgkerS, a /^kerS1-. Допустим на время, что 30 —
поглощающее множество, и положим
F.6) <7 = <7E, Эо)= inf sup с.
Заметим, что величина q (при фиксированном kerS1) определена
корректно. Далее, эта величина либо бесконечна, либо не
превосходит единицы. Действительно, если kerS-Lc:^, то, очевидно,
q= + оо. Покажем, что если kerS1 с? 30, то q ^ 1. Предположим,
что /2?kerS-L, /2$30 н sup{c: с/2€30}> 1. Тогда существует
такая константа с, с>1, что cf2?$0. Так как 80 — выпуклое
множество, то—с/2€30 и [/с — A — t)c]f2?%0 V/ ?[0, 1]. Полагая
tf = (l -f с)/Bс), получаем /2G30, что невозможно.
В качестве примера отметим, что q=l, если kerS1^^ и
/?30=>/2 G30. Последнее предположение выполняется, например,
если оператор S взаимно-однозначен или если Зг — гильбертово
пространство, kerS1—ортогональное дополнение к (замкнутому)
ядру оператора 5, а 30 — единичный шар в 3?t.
Мы готовы теперь доказать теорему, показывающую, что
поведение последовательности п-х минимальных диаметров {d(n)\
по существу совпадает с поведением последовательности
«-поперечников по Гельфанду {dn\.
Теорема 6.1. Пусть S: Зх —*32—линейный оператор. Если 30
уравновешенно и выпукло, то
F7) d(n)<^2dn "in.
Если, кроме того, 30—поглощающее множество, то
F.8) q < 1 => d {n) > 2qdn V/г,
F.9) 9==+°° и
F.10) q=+oo и
Доказательство. Докажем сначала, что d(n)^.2dn. Пусть
А—линейное подпространство в 32 с codim Л =*& ^я Тогда
Л— {х?%2: Ri(x) = 0, t=sl, 2, ..., &} при некоторых линейно-
независимых линейных функционалах Rl9 /?2, ..., /?л.
Определим информационный оператор Ш формулой SJ^f/^S, R2S,
..., RkSY. Тогда кЭТ {/35/^}5к90ЛВ1)
id(SR, S)=- sup ||S/i||< sup ||jc|.
После взятия нижней грани по А получаем 2~1d(ri)^.dtl.
Докажем теперь F.8). Если q — О, то F.8) тривиально.
Предположим, что 0 < q <; 1, и выберем б g @, ?). Пусть 9? == [Lu
L2, . ¦., LJ1 — произвольный информационный оператор. Положим
Ri(x)^L{(ft)t /=1, 2, ..., /г,
58Ч. Л у гл. 2. Теория линейной информации
где x = Sf + x2, SfSSiSJ, x^S(S^9 а / = /2 + /2 /^
/agkerS1. (Линейный функционал Ri определен корректно, ибо
если x = Sg + y2, то Sf = Sg и f—g?kerS, а значит, f2 = g2.)
Пусть А = {х?%2: Ri(x) = Oi /=1,2, . .., п\. Тогда codim Л
F.11) dn^ sup ||
<sup{|SA2J: ( f(
i=l, 2, ..., л}.
Поскольку Sh2?SC0), найдется /?30, для которого Sf = Sh2.
Отсюда f2 = h2. Из F.6) следует, что существует константа с =-
= c(h2)^Q — 5 > 0, такая что ^/г2€30. Поэтому, в силу F.11),
(^2) = 0, 1=1, 2, ..., п\
Так как б произвольно, то й(Ш, S)^2qdn. После взятия инфи-
мума по Ш получаем d(ri)^2qdn.
Пусть теперь q— -f-oo и dim32<ft. \Ъ F.4) с Л" = {0}
следует, что d" = 0, а из F.7)—что d(n) = 0. Пусть dim32>ft.
Тогда существуют линейно-независимые элементы Sfl9 5/2, ...,
Sfn+li где /f. gkerS-L. Очевидно fu f2, ..., /л+1 также линейно-
независимы. Пусть SR = [Z.x, L2, ..., ?„]* — произвольный
информационный оператор. Положим f = ^l=i ctfh где cl9 c2, ..., ся+1—
ненулевое решение системы п линейных однородных уравнений
Lj (/) = l^i CiLjift) = 0эу=1,2 п. Ясно, что f € кегЭ? П кег5-^.
Так как ^=+оо, то кег5хс:Э0, откуда с/^30 для всех с и
|/|| | |||S/||||Э
^ 0, у /0
| = |c |||S/||—> + °° при |с|—> + оо. Это доказывает, что
( S) = +oo для каждого 97. Следовательно, d{ri)~ +°°, и на
основании F.7) мы заключаем, что d"=+°°.l
Следующий пример показывает, что неравенство в F.7) может
быть строгим.
ПРИМЕР 6.1. Пусть ?ч-К3 и 30 = {/ = [/!, /а. /в]'"- |/il<l,
/| l//l^K а. Пу
у ч 0 {/ [/!, /а /в] |/il<,
I/2—/i|^a» l/з—/il^aK гДе а — некоторая константа. Пусть,
далее, S/ = [0, /lf /3]' и 31 = SC1)-{[0, /„ /з]1: /,€R, f-2, 3}
с нормой из 1то. Тогда кег5 = {[/ъ 0, 0]: /Х€К} и kerS-L=^32.
Очевидно, что /€^=>|/2 |<а +1 и |/3К^+1, откуда легко
получаем, что
Чтобы найти 1-поперечник по Гельфанду, заметим, что
6. Связь с п-поперечниками по Гельфанду 59
где L—линейный функционал, a SC0) = {[(), /2, /,]*: 3fu |Л|< 1,
для которого |/2-/i|<^ |/з—/i|<a}. Из того что L([0, /2,
/]*) / + / при некоторых константах с2 и с3, вытекает, что
M, |/,|): [0, /2, /,
Чтобы найти d(l), заметим, что кардинальность
информационного оператора 91 (/) =/2 +/3—/i равна единице и алгоритм
EИ(/)) = [О, 91(/), 9? (/)]* удовлетворяет оценке
Итак, d(l)<d@l, S)<2e(9)<2a. На основании F.8)
заключаем, что d(l)X2a/(fl + l))(a+l) = 2a, откуда
Заметим, что 2dVd(l) = (a-b \)la может быть сколько угодно
большим при малых а. Конечно, d(n) = dn = 0 Vn^2. |
Замечание 6.1. Для случая ^=1 теорема 6.1 утверждает, что
Этим устанавливается «двусторонняя» связь между теорией
аппроксимации и теорией аналитической сложности. Это значит,
что если dn известно из теории аппроксимации, то мы знаем d(n)f
и, наоборот, если d(n) известно из теории аналитической
сложности, то мы знаем dn. I
Теорема 6.1 позволяет находить оптимальные или близкие
к оптимальным информационные операторы. Напомним читателю,
что Ап называется я-м экстремальным подпространством для
X = SC0) в смысле Гельфанда, если
F.12) sup
Иными словами, если нижняя грань в F.4) достигается на Ап,
то Ап есть /г-е экстремальное подпространство. Пусть Ап =
= {хб32: /?/W = 0, i=l, 2, ..., k\, где Rl9 R%, ..., /?Л_
линейно-независимые линейные функционалы и A = codim An
Рассмотрим информационный оператор
F.13) 91 = [/^5, /?2S, ..., /?Л5]Ч
Из доказательства теоремы 6.1 вытекает, что
d(SR, 5)<2d«<d(^)/G.
Тем самым мы получаем такое
60 4. i4, гл. 2. Теория линейной информации
Следствие 6.1. В условиях теоремы 6.1 при q=l
информационный оператор F.13) является n-й оптимальной
информацией и
Результаты, относящиеся к поперечникам по Гельфанду и
экстремальным подпространствам для множеств, представляющих
практический интерес, можно найти в целом ряде работ (см.
среди прочих работы Миккелли и Пинкуса [77] и Тихомирова
[69, 76]). Используя следствие 6.1, можно установить
оптимальность информационных операторов для многих операторов
решения (см. гл. 6, где результаты данного параграфа применены
к решению нескольких линейных задач).
Если S—конечномерный линейный оператор, & = dimSC1),
то d(n) = dn = 0 при n^k. Однако в большинстве таких случаев
n-е оптимальные информационные операторы не являются допус-
of(()dt для гладких
скалярных функций /, мы обычно можем вычислять только
значения / и ее производных. Хотя теорема 6.1 и кажется непри<-
менимой, мы продемонстрируем, как ее можно использовать в
таких задачах.
Пусть XF = XF(S) — класс допустимых для линейного оператора
решениях информационных операторов кардинальности не выше п.
Нас интересует отыскание оптимальной информации $1° в Y,
т. е. информации, удовлетворяющей условию
F.14) d(№9 S) = inf d(% 5),
Заметим, что если Ч не совпадает с классом всех
информационных операторов кардинальности не выше я, то 91°—не
обязательно п-и оптимальный информационный оператор в смысле
определения 6.1.
Предположим, что существует такой линейный оператор S±:
3o—*36j где 36—нормированное линейное пространство, что
F.15) inf d (91, 5)= inf d (91, St).
Смысл условия F.15) состоит в том, что Sx может быть
бесконечномерным оператором (даже если оператор S конечномерен),
и /г-поперечник по Гельфанду множества St C0) дает оценку
снизу для d(9t, S).
Пусть Ап = {х?%ь: /?,•(*) = 0, i= 1, 2, ..., k\ — некоторое
п-е экстремальное подпространство для Sx C0) в смысле Гель-
фанда; здесь /?,, /?2, ..., Rk—линейно-независимые линейные
функционалы и & = codim An^n. Рассмотрим информационный
6. Связь с п-попе речниками по Гельфанду 61
оператор
F.16) 9t° = [RxSi9 R2Sb ..., RkSxy.
Пусть <7i = <7 (Sf) 30) определено равенством F.6), и пусть
df = dll(S1C0), Si^)) есть n-поперечник по Гельфанду. Если
^7Х == 1, то дЬ по следствию 6.1 является п-ы оптимальным
информационным оператором для задачи 5Х. Из теоремы 6.1
вытекает
Следствие 6.2. Пусть 30—уравновешенное выпуклое
поглощающее множество. Если выполняется условие F.15), то
F.17) inf d{% S)>2qld1.
Если <7i=l и оператор Щ°, определенный формулой F.16),
принадлежит классу 4я, то $1°—оптимальный информационный
оператор в W и
F.18)
Следствие 6.2 утверждает, что оптимальную информацию из
класса W для задачи S удается иногда найти как n-й
оптимальный информационный оператор для задачи 5j. Проиллюстрируем
следствие 6.2 следующим примером.
ПРИМЕР 6.2. Покажем, как оптимальный информационный
оператор для задачи интегрирования можно получить, решая
соответствующую, аппроксимационную задачу.
Пусть Зх—линейное пространство абсолютно непрерывных
скалярных функций /: [—1, l]—*-Rc|//||eo< + oo, и пусть Эо =
= {/: функция / абсолютно непрерывна и I/'L^l}. Рассмотрим
оператор интегрирования
1
5/=S f(x)dx
-1
c32 = IR. Так как S—линейный функционал, то dim S (Эх) = 1
и d(n)=*dn = 0 V/z^l. Пусть ЧГ—класс информационных
операторов вида
с попарно различными точками х,?[—1, 1], хг < х2 < ...
Заметим, что
F.19) d(% S) = 2supj [ h(x)dx
62 Ч. А, гл. 2. Теория линейной информации
Верхняя грань в F.19) достигается на совершенном сплайне Л,
задаваемом формулой
/+1, (=1, 2, ..., п — 1,
Далее, для каждого ft€30, такого что й(^.) = 0, f=l, ..., п,
имеем _ _
—fc(x)<A(*)<ft(x) V*€[—I, I].
Отсюда мы заключаем, что
F.20) d(9I,S) = 2supj J |ft(*)|d*: Л(х,) = 0, t=l9 ...,п,к?9Л
для любого п и любых попарно различных точек xh Рассмотрим
аппроксимационный оператор
SJ = /;
при этом 35 наделим Lx-HopMofl. Тогда, з силу F.19) и F.20),
d(9l, S) = d($l, St) VSRgT.
Следовательно, выполняется F.15). Конечно, <7(SiC0), ^)=1.
Известно, что dn(Sl(S0)9 L1)=l/n, а множество
4w = {f: /B/) = 0, 2, = -l +/i, z, = —1 +2(f —l)Af ft=l/n, f€[2, n]\
является n-M экстремальным подпространством для S^q). Поэтому,
согласно следствию 6.2,
inf
где 9?(/:) = [/:(г1), /(г2), ..., /(zn)]1 —оптимальный
информационный оператор в W.
В § 4 гл. 6 будет показано, что для многих множеств 30,
представляющих практический интерес, задачу интегрирования
можно исследовать в терминах задачи аппроксимации (см. по
этому поводу работу Короткова [77], где изучаются близкие
вопросы). |
7. АДАПТИВНАЯ ЛИНЕЙНАЯ ИНФОРМАЦИЯ
В §§ 2—6 мы рассматривали линейные информационные
операторы вида
G.1) Р
7. Адаптивная линейная информация 63
определенные п независимо заданными линейными
функционалами Lu L2, ..., Ln. Естественным их обобщением являются
адаптивные линейные информационные операторы вида
G.2) №(/) = [М/)> L%[f\ уг), ..., Ln[f\ уи ..., уп^)}\
где каждый функционал Lt линейно зависит от своего первого
аргумента, a y. = Li(f\ yl9 ..., #/_t). Применение таких
операторов позволяет при определении очередного функционала
использовать ранеэ вычисленные функционалы. В
противопоставление адаптивным операторам будем называть информационные
операторы вида G.1) неадаптивными.
Адаптивная информация широко используется на практике
в самых различных областях. Для некоторых задач адаптивная
информация намного эффективнее неадаптивной. Рассмотрим,
например, нелинейную задачу поиска максимума функции,
принадлежащей классу унимодальных скалярных функций. Известно,
что ошибка алгоритма Кифера, базирующегося на п адаптивно
вычисляемых значениях функции, с ростом п убывает
экспоненциально (см. Кифер [53, 57]). В то же время, как мы покажем
в § 6 гл. 8, ошибка оптимального по точности алгоритма,
базирующегося на п одновременно вычисляемых значениях функции,
всего лишь обратно пропорциональна п.
Зададимся вопросом, может ли адаптивная информация помочь
при решении линейных задач. Точнее, существует ли для
линейных задач адаптивная информация, которая эффективнее любой
неадаптивной информации, базирующейся на том же числе
линейных функционалов?
Мы покажем., что ответ на этот вопрос отрицателен. А именно,
будет показано, что для любой линейной задачи и любой
адаптивной информации, базирующейся на п линейных функционалах,
существует неадаптивный информационный оператор
кардинальности не выше п с таким же или меньшим диаметром
информации. Таким образом, гораздо более сложный по структуре класс
адаптивной информации позволяет узнать о линейных задачах
не больше, чем относительно простой по структуре класс
неадаптивной информации.
Подчеркнем, что этот результат означает, что для любой
адаптивной информации ЭТа существует элемент задачи f0 из 30,
для которого 9?а(/) не дает информации, большей чем 9?поп (/0)
при соответствующим образом выбранной неадаптивной
информации $1поп 1}. Конечно, может случиться, что для многих других от
личных от /0 элементов задачи / адаптивная информация 9?а(/)
намного эффективнее, чем 91ПОП(/), благодаря специальным
свойствам таких / (см. пример 7.1).
1} Индекс поп —от nonadaptive (неадаптивный) — Прим. перев.
64 Ч. А, гл. 2. Теория линейной информации
В вычислительной практике идея адаптивности используется
также и применительно к информационным операторам,
кардинальность которых может изменяться и зависеть от конкретного
аппроксимируемого элемента задачи /. Например, в задаче
вычисления интеграла $lf(t)dt часто значения функции /вычисляются
в точках хи х2у ..., где Xj = Xj(xu ..., х^и f(xt)9 ..., /(*y-i)),
до тех пор пока не будет выполнено условие остановки
Здесь фу—квадратурная формула, а б—заданное малое число.
Общее число вычислений значений функции (т. е.
кардинальность информации) теперь зависит от конкретного /.
Это иная модель аналитической сложности; в данной книге
она подробно не изучается (см. гл. 10, где мы обсуждали другие
модели аналитической сложности).
Перейдем к точной формулировке и доказательству результата,
о котором идет речь. Пусть 9{а— произвольный адаптивный
линейный информационный оператор вида G.2). Рассмотрим
неадаптивный информационный оператор
№0П(/) = [М/), МЛ 0), .... М/; о,. .,0)]*.
Конечно, card (9fnon) < п.
Теорема 7J. Пусть S—линейный оператор, а множество 30
уравновешенно и выпукло. Тогда
G.3) d($l\ S)^d(№°\ 5). |
Доказательство. Ввиду замечания 3.1,
d(9tnon, S)«2 sup \\Shi
Пусть б—произвольное положительное число. Выберем h?
? ker 9?non П 3<» такое что ||Sh 1^2~Ч (SRllon, S)—б, если d (Шпоп, 5)<
< + oo, и ||5/i||^6, если d(dlnon, S)=*= + oo. В силу
соотношения B.9) гл. 1,
Положим f=*h и f=--A63e. Тогда L, (/) = L, (/) = 0, L,(/;0)e
=L2(f;0) = 0, .... LH(f; 0, ...,0)-^я(/|0, .... 0)-0. Это
означает, что ЭТа (/) = ЭТа (/) и
. _v_ n, S) —26, если dERnon, 5)<+oo,
"I 26, если d(9ino\ S) = +oo.
Ввиду произвольности б отсюда следует G.3). |
7. Адаптивная линейная информация
Пусть ?„—класс всех адаптивных информационных операторов
вида G.2). Поскольку любой неадаптивный информационный one*
ратор кардинальности не выше п принадлежит W%, из
теоремы 7.1 вытекает
Следствие 7.1. Справедливо равенство
inf
где d(n) — это п-й минимальный диаметр информации,
определенный формулой F.2). |
Сходный результат был установлен Бахваловым [71а] в
предположении, что S—линейный функционал, а также Гэлом и
Миккелли [78], которые использовали другой метод
доказательства. Кроме того, Кифер [57] доказал, что адаптивная
информация не приносит выгоды в задаче интегрирования для
некоторого конкретного неуравновешенного класса 30.
Такой же результат имеет место для некоторых нелинейных
задач. См. работы Сухарева [71] и Зализняка и Лигуна [78],
где рассматривается задача нахождения максимума функции из
класса 30. Сухарев [71] рассматривал класс скалярных
функций, зависящих от нескольких переменных и удовлетворяющих
условию Липшица, а Зализняк и Лигун [78] — класс функции,
представляющий собой алгебраическую сумму некоторого
уравновешенного выпуклого компактного множества и некоторого
конечномерного линейного пространства.
Теорема 7.1 и следствие 7.1 утверждают, что, когда речь идет
о диаметре информации, использование адаптивной информации
выгоды не приносит. Это означает, что существует /€§0, для
которого адаптивная информация 9?а(/) не лучше
соответствующим образом выбранной неадаптивной информации 91поп (/).
Однако для некоторых специальных /?30 адаптивная
информация может оказаться очень полезной и гораздо более
эффективной, чем неадаптивная информация 91ПОП(/). Это показывает
следующий пример.
ПРИМЕР 7.1. Пусть Зг—класс скалярных абсолютно
непрерывных функций f: [—1, 1] —> R, таких что f'^L^. Положим
§0 = {/g3i: |]/'|L^U и рассмотрим задачу аппроксимации Sf = f.
Из примера F.2) легко следует, что
G.4) ОД™ (/)«[/(*J. /(*,), ..., f(*n)Y
есть П'й (неадаптивный) оптимальный информационный оператор
и d(dlnony I) = d(n) = 2/n. Предположим, что !ЭТЯ0П применяется
к функции /?30, такой что f(zk) = zk и f(zp) = zp при k^
3 №561 '
66 Ч. А, гл. 3. Линейные алгоритмы для линейных задач
Заметим, что, зная f (zk) и f(zp), мы можем немедленно
заключить, что f(t) = l для t?[zk, гр]. Следовательно, нет
необходимости вычислять f(zk+1), f(zk+2), ..., f{zp_x). В случае
адаптивной информации мы распознали бы этот благоприятный случай
и вычисляли / вне интервала [zk, zp]. I
Глава 3
ЛИНЕЙНЫЕ АЛГОРИТМЫ
ДЛЯ ЛИНЕЙНЫХ ЗАДАЧ
1. ВВЕДЕНИЕ
Комбинаторная сложность оптимального по точности
алгоритма может быть большой. Фактически может оказаться, что
стоимость вычисления ц>(у) при заданном y = $l(f) существенно
превосходит стоимость вычисления $l(f). В этой главе мы будем
изучать линейные алгоритмы; для таких алгоритмов
комбинаторная сложность заведомо мала.
Пусть 3l(f) = [L1(f), ..., Ln(f)]{. Будем называть алгоритм ер
линейным, если
A.1) Ф(Э1(/))« 2МЛ ft,
1=1
гДе ft = ft(S,30, <р)—элементы из 32. Поскольку glf ...,gn
не зависят от /, их можно определить до начала вычислений.
При заданных gt для вычисления ф(#) следует произвести не
более п умножений элементов из 32 на скаляры и п—\
сложений элементов из Э2. Комбинаторная сложность линейного
алгоритма линейна по п и, вообще говоря, мала по сравнению со
сложностью вычисления 9?(/). Детальное обсуждение сложности
линейных алгоритмов по времени будет проведено в гл. 5. Мы
покажем (лемма 2.2 гл. 5), что линейный оптимальный по точности
алгоритм является «почти оптимальным по сложности
алгоритмом». Вдобавок сложность линейных алгоритмов по емкости
невелика. В частности, если S(f)-г-линейный функционал, то
сложность по емкости не превосходит 2п,
Поэтому нас весьма интересуют линейные алгоритмы,
оптимальные или почти оптимальные по точности.
Для каждой ли линейной задачи существует оптимальный по
точности линейный алгоритм? В § 4 приводится принадлежащий
Миккелли [78] пример линейной задачи, для которой не
существует линейного оптимального по точности алгоритма. Однако
/. Введение 67
это — специально построенный пример, нам не известны такие
примеры, возникающие в реальных приложениях.
Хотя отыскание линейного оптимального поточности алгоритма
возможно не всегда, мы показываехМ, как построить линейный
алгоритм с ошибкой, отличающейся от радиуса информации
множителем с, который зависит только от Т(кетШ). В случае
гильбертова пространства с равняется единице.
Смоляк [65] доказал, что если 5—вещественный линейный
функционал, a 9i состоит из п вещественных линейных
функционалов, то линейный оптимальный по точности алгоритм
существует. В своей классической статье [49] Сард изучал
оптимальные алгоритмы интегрирования. Его информация — это значения
/ в п фиксированных точках. Он предполагает, что
рассматриваемые алгоритмы линейны и точны на многочленах не выше
определенной степени. -Используя теорему Смоляка, мы
показываем в § 3, что ни одно из предположений Сарда не является
необходимым. Там же можно найти дальнейшее обсуждение этого
вопроса.
Никольский [50] изучал вопрос об оптимальном выборе узлов
интегрирования и исследовал оптимальные алгоритмы
интегрирования с оптимально выбранными узлами (узлы—это точки, в
которых вычисляются значения функции). Он тоже предполагает
линейность алгоритмов. Мы доказываем при довольно слабых
предположениях, что понятия оптимальности в смысле
Никольского и оптимальности в смысле Сарда (при оптимально
выбранных узлах) совпадают.
Указываются дополнительные взаимосвязи (см. § 6 гл. 2) между
теорией аппроксимации и теорией аналитической сложности. Мы
определяем п-ю минимальную линейную погрешность и находим,
как она связана с линейным я-поперечником по Колмого*
рову.
Дадим краткий обзор результатов данной главы. В § 2
приводятся предварительные замечания общематематического
характера. В § 3 излагается с некоторыми модификациями данное Бах-
валовым доказательство теоремы Смоляка (теоремы 3.1).
Используя теорему Смоляка, мы доказываем, что алгоритмы, оптимальные
в смысле Сарда или Никольского, являются также оптимальными
по точности (теорема 3.3).
В § 4 приводится (пример 4.1) линейная задача, для которой
не существует линейного оптимального алгоритма. В теореме 4.1
мы строим линейный алгоритм, погрешность которого отличается
от погрешности оптимального по точности алгоритма не более
чем в с раз. В заключительном параграфе изучается связь между
оптимальными линейными алгоритмами, использующими
линейные информационные операторы кардинальности не выше п, и
линейными n-поперечниками по Колмогорову.
68 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
2. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
В этом параграфе рассматриваются некоторые специальные
случаи, когда возможно отыскание линейных алгоритмов,
которые не только оптимальны по точности, но также являются
центральными и интерполяционными.
Предположим сначала, что г (9i, S) = 0. Тогда любой
интерполяционный алгоритм ф1 (см. § 2 гл. 1) имеет погрешность
^(ф[) = 0. Следовательно, алгоритм Ф!(^ (/))—?(/) является
линейным и центральным. Отсюда вытекает
Следствие 2.1. Если r($l, S) = 0, то существует линейный
центральный интерполяционный алгоритм. |
Заметим, что г (91, S) = 0 для любого линейного S тогда и
только тогда, когда кег9{п30 = {0} (предполагается, что 30—
выпуклое уравновешенное множество). Последнее условие
выполнено, например, если card EXi) = dim 3»t, так как в этом случае
ker9i = {0}. Если card (SR) = dim 3, == лг, то существуют такие
h, /¦. • .. А», что З^ЩЛ, /„ ..., fn) и L,tf/)e6/y Тогда
для каждого /€3^ имеем f = 2j!=1Li(f)fi. Определим ф формулой
B.1) ф(Я(Л>« .SMflft. 8i^Sfi9 W = [L1f Ц, ..., LJt.
/=i
Поскольку ф(Л(/))я5(/), мы получаем
Следствие 2.2. Если card (9?)==dim31, то алгоритм ф,
определенный равенством B.1), является центральным
интерполяционным алгоритмом и е(ф) = 0. |
Перейдем к случаю, когда г (91, S) не обязательно равно нулю.
Лемма 2.1. Пусть 3y=={/63i» |Т/||^1}. Предположим, что
существует элементы flt /2, ..., fn из 3lf такие что
B.2) Lt(f)~6t/ и Г (/,)-(> при t, /=l, 2, ..., п.
Тогда алгоритм ф, задаваемый формулой ф(Э1(/)) = 2?=1 ^/(/)§"/»
gi — Stft), является линейным центральным интерполяционным
алгоритмом и
B.3) е(Ф) = г(И, 5, Г)«Id(SI, S, T)= sup |S/i|/ЦГh||. |
* 1€кег9?
Доказательство. Пусть /0 = 27= i ^/ (/) //• Тогда /06кегТ и
^/(fo) = 2/«i Lj(f)Lj(fj). Этим доказано, что ф—линейный и
интерполяционный алгоритм. Для доказательства центральности ср
напомним, что множество U = U (/), определенное равенством B.5)
гл. 1. есть множество всех элементов решения Sf для элементов
задачи / из 30, которые дают такую же информацию, что и /.
3. Линейные оптимальные по точности алгоритмы 69
Отметим, что U симметрично относительно Sf0 для каждого
Действительно, если Sf^+Sh^U, то /i?ker9? и |]77i||<:i, а
потому SfQ—Sh также принадлежит U. На основании замечания 2.1
гл. 1 заключаем, что ср (91 (/)) = SfQ—центральный алгоритм, и B.3)
выполняется в силу соотношений B.12) гл. 1 и C.2) гл. 2. |
Заметим, что условие B.2) означает, что dim kerT12^ card (ffi)
и линейные функционалы Ll9 ..., Ln линейно-независимы на
kerT. У леммы 2.1 много интересных приложений, в частности
к некоторым классическим задачам. Это будет
продемонстрировано в гл. 6.
Завершим этот параграф леммой, которая потребуется нам
в следующем параграфе для установления связи между
оптимальными по точности алгоритмами и алгоритмами, оптимальными
в смысле Сарда.
Лемма 2.2. Пусть 30 = {/63i: ||77||<1}. Если
ср—однородный алгоритм и е(ф)< + <х>> то
B.4) Ф(ЗД) = 5(/) V/€ker7\|
Доказательство. Пусть /—произвольный элемент из кегТ.
Тогда cf е 30 для любого с и | <р (91 (cf))—S (cf) \\ = |с| || ф (Ш (/)) —
—5(Ш<е(ф)< + оо, откуда и следует, что <p($l(f)) = Sf. |
Лемма 2.2 утверждает, что любой однородный алгоритм с
конечной погрешностью точен на элементах из kerT. В качестве
примера положим Sf = jbaf(t)dtf Tf = f^ и 9tf(/) = [/(/i), f(t2),
•••» /(OP- Тогда г($1, S, Г)< +оо для п>&, и любой
однородный алгоритм с конечной погрешностью точен на всех
многочленах степени не выше k—1.
3. ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ ПО ТОЧНОСТИ АЛГОРИТМЫ
ДЛЯ ЛИНЕЙНЫХ ФУНКЦИОНАЛОВ
В этом параграфе предполагается, что 5—линейный
функционал, т. е. S2 = R и оператор dl — [Lif L2, ..., LJ* образован
из вещественных линейных функционалов Li9 L21 ..., Ln. Мы
докажем теорему Смоляка, в которой устанавливается
существование линейного оптимального по точности алгоритма. Используя
эту теорему, мы покажем, что оптимальные в смысле Сарда или
Никольского алгоритмы оптимальны по точности.
Лемма 3.1. Если S—вещественный линейный функционал,
а Зо—уравновешенное выпуклое множество, то
C.1) r($l, S) = ±d(9l, S)= sup SA.|
^ &6k«R3
70 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
Доказательство. Так как 5—вещественный линейный
функционал, а 50 выпукло, то множество U (/) представляет собой
интервал. Поэтому rad U (f) = diam (U (/))/2 V/ g 90. Отсюда
r ER, S) = d(9l, S)/2. Согласно замечанию 3.1 гл. 2, имеем
r(«R, 5) = rad(f/@)) = sup{|S/i): ft€ker9ln30}. Поскольку f/@)
уравновешенно, знак модуля в \Sh\ можно опустить. |
Пусть
C.2) г t (х) = sup {Sf: /€Эв, Lt{f) = x% Ly(/) = 0 при /#i}.
Теорема 3.1 (Смоляк [65])Х). Пусть S—вещественный
линейный функционал, определенный на уравновешенном выпуклом
множестве ft0, a $l = [Ll9 ..., LJ*—линейный вещественный
информационный оператор. Тогда
(i) существует линейный оптимальный по точности алгоритм;
(ii) если производные rJ(O) существуют при 1=1, 2, ..., я,
то ф (91 (/)) = 2?-i ^/(Л ri @) — единственный линейный
оптимальный по точности алгоритм. |
Доказательство. Дадим доказательство этой теоремы,
являющееся модификацией доказательства Бахвалова [71а]. Рассмотрим
сначала случай г (Щ, S) = +oo. Тогда каждый алгоритм ф
оптимален по точности, так как е(у)~г(Ш, S) = +oo. Далее, если
г@1, S) = 0, то из следствия 2.1 сразу вытекает (i). Поэтому
без потери общности можно считать, что r=r(9l, S)?@, +oo).
.Допустим сначала, что Liy L2, ..., Ln линейно-независимы
на 3„ т. е. 2с/у(/) = 0 V/€30=»c1 = c2= ... =с„ = 0. Пусть
K = {(S(/), ?,(/), -.., Ln(f)): /€3,^cR-+l.
Вследствие наших предположений относительно 90 множество У
уравновешенно и выпукло. Из теории выпуклых множеств
известно, что через каждую точку /?, принадлежащую границе
выпуклого множества X, можно провести опорную гиперплоскость.
Это значит, что существуют вещественные числа с0, с1у ..., сп,
п
такие что гиперплоскость со(уо—г)+ 2<у#/в0 проходит через
граничную точку (г, 0, ..., 0) и является опорной для Y, т. е.
C.3) cQ (S (f) - г) + S cfLf (/) < 0 V/ б Эв.
/=1
Х) На самом деле Смоляк [65] получил следующий более сильный
результат. Пусть К—выпуклое замкнутое множество в топологическом линейном
пространстве, a L (x), Lx (х), . . ., Ln (x) — непрерывные линейные функционалы
в этом пространстве. Тогда среди всех функций от п переменных,
обращающих в минимум величину sup \L(x)—O(L1(x) Ln(x))\, есть и линейная
хьк
функция Ф (г19 . . ., zrt) = a1z1-\-. . *-{-onzn-\-b. При этом, если К
уравновешенно, то 6 = 0.—Прим. перев.
3. Линейные оптимальные по точности алгоритмы 71
Предположим, что со = О. Так как 80 уравновешенно, то
^jrf=iCJLj(f) = O V/?$o, вопреки нашему предположению о
линейной независимости Lu L2, ..., Ln. Следовательно, спФ0. Так
п
как Y уравновешенного гиперплоскость со(уо + г)+ 2 С/У;=®
1= 1
проходит через граничную точку (—г, 0, ..., 0) и является
опорной для множества У, т. е.
C.4) co(S{f) + r) + ^c/L/(f)>O Vf?30.
Положим q/ = —c//c0. Тогда из C.3) и C.4) следует, что
Это означает, что линейный алгоритм ср (Ш (/)) = 2?= i ^y (/) ?у
оптимален по точности. Тем самым для указанного случая
утверждение (i) доказано.
Пусть теперь Llt L2, ..., LM линейно-зависимы на Эо. Без
потери общности можно предположить, что существует такое
целое k, k<,ny что L19 L2, ..., Lft линейно-независимы на 30 и
при некоторых константах с/7, (=1, 2, ..., п —й. Определим
информационный оператор $1г формулой 9\ (f) = [Ll (/), ...
..., L^f)]1. Тогда кегЭТ = кег^ и r(% S) = rEl1> 5). Пусть
Ф2 —линейный оптимальный по точности алгоритм для Ш1У
<Pi(«i (/)) == 2/=i h if) Я/• Тогда * (ф1) = г Cllf S) = г (Я, S), откуда
видно, что фх является линейным оптимальным по точности
алгоритмом и для 91. Утверждение (i) доказано полностью.
Перейдем к доказательству утверждения (и). Пусть ф(^(/))=
= 2?=i А/ (/) ?/—оптимальный по точности алгоритм. Выберем
такое /€&о> что L/(/) = x, где х достаточно мало, и Ly(f) = O
при /4^*. Тогда
C.5) /|
Заметим, что г^г^О), откуда видно, что г конечно. Поскольку
S(f) может быть сколько угодно близким к г((х) (см. C.2)), мы
заключаем, что ri{x) — ri{Q)^xqi, Поделив на х, получаем
П(\х\)-п@) ^ „ ^ П(-\х\)-п(Р)
72 Ч. А, гл. 8. Линейные алгоритмы для линейных задач
Поскольку г\ @) существует, то, устремляя х к нулю,
заключаем, что <7/ = г\ @). Это показывает, что ф (ЭТ (/)) = 27= i Lj(f)r'f(O)—
единственный линейный оптимальный по точности алгоритм. |
Теорема 3.1 была обобщена Марчуком и Осипенко [75] на
случай информации с ошибками (т. е. на случай, когда вместо
$l(f) нам известно при заданном б такое z, что |9?(/)—г||<8),
Осипенко [76] — на комплексный случай (т. е. на случай, когда
S, Lu L2, ..., Ln—комплексные линейные функционалы) и Мик-
келли и Ривлином [77]—на случай информации произвольной
кардинальности (card ($1) разрешается быть равным
бесконечности) с ошибками.
В качестве применения теоремы 3.1 покажем, что алгоритмы,
оптимальные в смысле Сарда или Никольского, оптимальны по
точности.
Сард [49] рассматривает аппроксимацию в задаче
интегрирования Sf — )af(t)dt для класса скалярных функций /: [а, Ь] —+ R.
Информация состоит из значений f в п фиксированных точках
^i» ^2» •••» К- Обозначим для фиксированного целого
неотрицательного г, r^/г, через Ф = Ф(я, г) класс алгоритмов <р,
использующих информацию 9t(ft = [/('i)i f(t2), ..., /(*„)]* и
удовлетворяющих следующим двум условиям:
(i) алгоритм ф линеен, т. е. ф(^(/))= У]"в1 f(ti)ki для
некоторых ki = ki((p), f=l, 2, ..., п\
(ii) алгоритм ф точен на классе Пг_1 многочленов степени не
выше г—1, т. е. <р {Ш (/)) = Sf У^П
Тогда, предполагая абсолютную непрерывность /(/"~1), Сард
заключает, что существует функция kt для которой
C.6) Sf-
причем
где /+==тах(/, 0). Сард называет алгоритм ф?Ф(я, г)
наилучшей квадратурной формулой, если отвечающие ему
коэффициенты ki минимизируют функцию
ь
C.7) \h?(f)dt
а
на множестве всех возможных k{. Будем называть такой
«наилучший» алгоритм оптимальным в смысле Сарда алгоритмом
Условие оптимальности в смысле Сарда представляется
довольно ограничительным. Априори неясно, почему алгоритм
3, Линейные оптимальные по точности алгоритмы 73
должен быть линейным или точным на многочленах степени не
выше г—1. Может сложиться впечатление, что, допуская к
рассмотрению нелинейные алгоритмы, не обязательно точные на
многочленах, можно найти алгоритм с погрешностью меньшей,
чем у алгоритма, оптимального в смысле Сарда.
Покажем, что это не так. Используя теорему Смоляка,
докажем, что алгоритм, оптимальный по точности в классе всех
возможных алгоритмов, принадлежит классу Сарда Ф(п9 г) и
оптимален в смысле Сарда.
С этой целью возьмем <3j == Wr2 [a, b] (пространство скалярных
функций /: [a, b]—+R, у которых (г — 1)-я производная
абсолютно непрерывна, а r-я производная принадлежит L2). Далее
положим
Так как 30 выпукло и уравновешенно, то теорема Смоляка
гарантирует, что существует линейный оптимальный по точности
алгоритм фое, использующий информацию 97 (/) = [/(^i), /(^2)» •••
..., /(/„)]*. В этом случае Фое (ЗД) = $*а (t)dt, где
а—единственный натуральный сплайн степени 2г — 1, интерполирующий /
в точках tu t2t ..., tn (см. гл. 4 и § 4 гл. 6). Так как
,) = 0, /=1, .... /г,
то по лемме 2.2 алгоритм фое точен на элементах из кегГ, т. е.
на многочленах степени не выше г — 1. Итак, фое принадлежит
классу Сарда Ф(п, г). Мы доказали следующую теорему.
Теорема 3.2. Ни одно из предположений (i), (ii) не является
необходимым. Точнее, оптимальный алгоритм в смысле Сарда
является оптимальным по точности для задачи интегрирования
с Э0 = 1^2[а, Ь] и информационным оператором ^(/) = [/(^), ...
...,/('„)]•¦
Аналогичным образом определяются оптимальные алгоритмы
в смысле Сарда и для аппроксимации других линейных
функционалов. Можно показать, что при соответствующим образом
выбранных 30 они также оптимальны по точности.
Оптимальные алгоритмы в смысле Сарда рассматриваются в
работах многих авторов. См., например: Карлин [69, 71], Ли [77],
Липоу [73], Мангасарян и Шумейкер [73], Мейерз и Сард [50а, Ь],
Мэнсфилд [72], Риттер [70], Сард [63, 67], Шёнберг [64а, Ь —66,
69, 70].
74 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
Замечание 3.1. Сард рассматривал наилучшие квадратурные
формулы, использующие значения / в п фиксированных точках.
Шёнберг [69] определил оптимальные квадратурные формулы в
смысле Сарда как формулы, в которых узлы th равно как и
веса kh выбираются так, чтобы минимизировать значение
\^ak2(t)dt. Эта задача намного труднее, так как k зависит от tt
нелинейно. Как мы увидим, эта задача связана с одной задачей,
поставленной Никольским [50]. |
Обсудим теперь оптимальные алгоритмы в смысле
Никольского. Никольский [50] рассматривает аппроксимацию в задаче
интегрирования Sf= \af(t)dt для некоторого класса 30
скалярных функций. Он вводит следующие величины:
ь
C.8)
а
C.9) ?C0; a, &) = inf ?„C0; ph xt).
P{, x.
Алгоритм ф(ЭТ(й) = 2?в1р,К*,) с 9t(f) = U(*i)> •••• /(*.)]'
называется оптимальным в смысле Никольского, если Еп(%0; ph xt)=^
=ЕпC0\ a, b). (Иногда отмечается, что эта задача была
поставлена Колмогоровым.)
Таким образом, Никольский рассматривает линейные
алгоритмы с оптимально выбранными узлами (точками, в которых
вычисляются значения /). Он требует выполнения условия (i), но
не обязательно условия (И), т. е. точность алгоритма на каких-
либо многочленах не предполагается.
Пусть ^/(п)—класс всех информационных операторов Ш вида
»t(/) [/(<) /(') f(b *&t '' 2
Если 90 уравновешенно и выпукло, то, согласно теореме
Смоляка, для любого 9?€Ч/(я) существует линейный оптимальный
по точности алгоритм.
Так как
iniEnC0\ Pi9 *,)«г(Я, S),
где $1 (/) = [/ fa), ...f /(л:й)]1, то мы можем переписать C.9)
в виде
C.10) ?йC0; а, &)= inf г C1, S).
Таким образом, задача Никольского эквивалентна задаче
минимизации радиуса информации по множеству узлов х{. Эта
задача в свою очередь связана, как мы упоминали в § 6 гл. 2,
с ^-поперечниками по Гельфанду и экстремальными
подпространствами для задачи аппроксимации в пространстве L^.
S. Линейные оптимальные по точности алгоритмы 75
Из проведенного обсуждения следует, что предположение
Никольского о линейности алгоритмов не является
ограничительным. Оптимальные алгоритмы в смысле Никольского
оптимальны также по точности. Далее, если 30 = {/: производная
fir-D абсолютно непрерывна и \\f{r)§2 ^ 1}, то, в силу леммы 2.2,
оптимальность в смысле Никольского и оптимальность в смысле
Сарда при оптимально выбранных узлах совпадают. Подытожим
сказанное в виде следующей теоремы.
Теорема 3.3, Если множество 30 уравновешенно и выпукло,
то оптимальный алгоритм вымысле Никольского оптимален по
точности в задаче интегрирования с информационным
оператором $t(f) = [f(t1), ..., f(tn)]\ где узлы tg выбраны так, чтобы
минимизировать радиус информациии.
Если 30 = {/: f{r~1) абсолютно непрерывна и ||/(г)||в^ 1}, то
понятия оптимальности в смысле Никольского и оптимальности
в смысле Сарда при оптимально выбранных узлах совпадают. |
Оптимальные алгоритмы в смысле Никольского изучались
многими авторами. В их числе: Алхимова [72], Боянов
Женсыкбаев [76—78], Корнейчук [74], Корнейчук и Лушпай
Крылов [67], М. И. Левин, Гиршович и Арро [76], Лигун
76
9"
76"
р [], р рро [76], у
Лушпай [66, 69, 74], Моторный [73, 74, 76], Никольский
Шайдаева [59].
До сих пор мы ограничивались рассмотрением линейных
функционалов. Из теоремы Смоляка следует существование
линейных оптимальных по точности алгоритмов для некоторых
линейных операторов S. Именно, достаточно предположить,
что пространство 32 значений линейного оператора решения S
удовлетворяет условиям:
C.11) 32 есть пространство вещественных функций g9
определенных на некотором множестве X,
C.12) Э2 наделено sup-нормой, т. е.
Действительно, пусть /€30, a g = Sf. Располагая информацией
мы должны аппроксимировать g(x) для х$Х. По теореме
Смоляка каждого х?Х существуют такие gi~gi(x)i t = 1, 2, ..., /г,
что линейный алгоритм
C.13) Ф(ЭТ(/), *) =2^. (/)?/(*)
оптимален по точности. Это означает, что
1 (Sf) (х)-Ф (SR (/), х) | - sup (Sh)-(x) < sup ||Shi
76 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
В силу C.12),
откуда следует, что ф—линейный оптимальный по точности
алгоритм. Подытоживаем сказанное:
Следствие 3.1. Если Э2 удовлетворяет условиям C.11) и
C.12), то существует линейный оптимальный по точности
алгоритм. |
Завершим этот параграф библиографической справкой.
Аппроксимации линейных функционалов изучалась многими
авторами. Мы уже упоминали ряд работ, посвященных оптимальным
алгоритмам в смысле Сарда или Никольского. Некоторые
относящиеся сюда результаты можно найти также в работах: Алберг
и Э. Нильсон [66], Боянов и Черногоров [77], Вайнбергер [61],
Голомб и Вайнбергер [59], Гэл и Миккелли [78], Кифер [57],
Кнауфф и Кресс [74, 76], Ларкин [/0], Менге [67], Миккелли
[75], Мзнсфилд [71], Г. Нильсон [73], Райнш [74], Рихтер-Дин
[71Ь], Секрест [65а], Чавла и Кауль [73].
4. ЛИНЕЙНЫЕ АЛГОРИТМЫ ДЛЯ ЛИНЕЙНЫХ ОПЕРАТОРОВ
В этом параграфе предполагается, что S—линейный
оператор, а 90=г{/: |77|К1}, где Т—линейный оператор
ограничений. Мы показываем, что для некоторых 5, Т и 91 не
существует линейного оптимального по точности алгоритма. Далее, мы
строим линейный алгоритм, погрешность которого отличается от
радиуса информации не более чем в с раз, причем с зависит
только от Т(кетШ). В случае когда область значений Т лежит
в гильбертовом пространстве и Т (кетШ) замкнуто, множитель с
равен единице. В этом случае мы получаем линейный
оптимальный по точности алгоритм, являющийся также центральным.
Этот алгоритм тесно связан со сплайновыми алгоритмами,
изучаемыми в гл. 4.
Начнем с примера линейной задачи, для которой не
существует линейного оптимального по точности алгоритма. Этот
пример, который сообщил нам Миккелли [78], основан на примере
1.1 Мелкмэна и Миккелли [77], а также на результатах
Миккелли и Ривлина [77].
Как мы увидим, в этом специально сконструированном
примере используется нестандартная норма в пространстве Q2. Нам
неизвестно ни одного примера линейной задачи, возникающей в
реальных предложениях, для которой не существовало бы
линейного оптимального по точности алгоритма.
4. Линейные алгоритмы для линейных операторов 77
ПРИМЕР 4.1. Пусть 31 = (R:j. Для f = (fu /2, /3) положим
Sf=(fi, /2)?32, причем 32 наделено нормой Jg||32= j/^gl+^gt
где А,, > Х2 > 0. Пусть Г = /: 31-^34 = R3, причем 34 наделено
нормой ||g||3( = max {Vg\ + gL Igsl)- Положим, наконец, 9J(/) =
= /i + а/з» гДе 0 < а ^ \i = К2^2/(^ + Х2)/3. Заметим, что
D.1) dER, S, Г) = 2 sup ||5/i|| = 2
Действительно, sup{^+^2/J: f^fl^Mi + fKl» l/з
для а<3|ы, откуда и следует D.1). Определим нелинейный
алгоритм ф формулой
"\ 0), у
>2а.
Рассмотрим величину e = \\Sf—(p ($l(f)) |. Если |9?(/)К2я, то
== max (Я2, ^ (ЗаL + А,, A —(ЗаJJ) = Ь%9
так как а<|ы. Для \ШA)\>2а получаем \f1\>ay fl^l—a2 и
4 ^(а/зL + Kf\ < ^i«4 + ^2 A ~a2J <%г. Таким образом, е (<р)=
- Вместе с D.1) это показывает, что
r(% S, Г)=/
Рассмотрим теперь произвольный линейный алгоритм ф (у)
**(сгу, c2y)f где с, и с2—вещественные числа. Для него
е* (Ф) - sup (^ (/, -с, (f, + a/3)L + К (h-c2 (h + a/3)L).
Полагая /,= 1, f2 = /3 = 0 и /x=0, /2=1, /8 = ±1, получаем
в* (ф) > max (Xi A -cO4 + hci, К {cxaf + X2 A ±ac2L).
Если с2Ф0 или же с2 = 0, но ^^=0, то второй член под знаком
максимума гарантирует, что е4(ф)>^2. Если ^ = ^ = 0, то
первый член гарантирует, что ^(ф)^^ > Л2. Итак, всегда
е(ф)> УЪ = г(т, 5, Г),
откуда следует, что для этой задачи не существует линейного
оптимального по точности алгоритма. |
Хотя линейный оптимальный по точности алгоритм и не всегда
можно найти, всегда существует линейный алгоритм,
погрешность которого отличается от радиуса информации некоторым
множителем с, зависящим только от Т (кег$1). Построим такой
алгоритм.
78 Ч. А, гл. S. Линейные алгоритмы для линейных задач
Без потери общности можно считать, что мы имеем дело с
информационным оператором
D.2) ЭТ = [^,/,2, ...,?,„]*,
задаваемым при помощи линейно-независимых линейных
функционалов. В силу следствия 2.2 можно ограничиться случаем
n=card (9?)<dim3t. В § 3 1\д. 2 мы показали, что d(9i, S, Г)= + оо,
если ker Sinker Г не содержится в kerS. Условие ker 9{ Л ker Г с:
ckerS выполнено, если 9{*а!ЭТ, где информационный оператор
D.3) 9*=[Ц,l;, ...,l;.p, Ц(П)=ьФ
определен формулой D.1) гл. 2 с ft* = ind(S, T) < + <*>. Поэтому
предположим, что для ЭТ, определенного равенством D.2),
выполняется условие
D.4) ?/ = ?? при t = l, 2, ..., я*,
Пусть
D.5) 94
где Т(kerSftI = Нп(т|1, г|2, ..., г^). Из леммы 4.4 гл. 2 нам
известно, что fe = dim71(ker97)-L ^л—п*. Поэтому для каждого
g?<34 имеем
D.6) er-*t+2J*/teL/.
где gr0 € 7" (ker9Z), а /?1э /?2, ..., /?л—линейно-независимые
линейные функционалы, такие что ^/(Лу)^^. Положим
Заметим, что с зависит от Т(кегШ), но не зависит от Si и S.
Кроме того, с^ 1, и если Г(кегЭТ) замкнуто, то с конечно. Если
S4—гильбертово пространство, а Т(кег9?) замкнуто, то можно
предположить, что Т(кетШ)±—ортогональное дополнение к
Т(кегЭТ), (ti,, ^=6,.,, R,(g)=(g, г,,-) и UPHefel'+Sf-iKer, %)l2.
откуда с =1.
Пусть Э1 = кег5«®(кег9О^. Тогда f = /0 + S?-i^/ (/)?,-, где
fo€ker5R, a L/Fy) = 6/y для /, /=1,2, ...,п, ||- = Е? для i=l,
2, ..., /г* A} определены в D.3)). Заметим, что Tf = Tfo +
2$n.+iLi(f)nh ибо П; = 0. Итак,
Существуют такие линейно-независимые элементы ^* + 1, ..
что П* = 0 и ^€lin(^ + 1, ...,U, *-л*+1, ...tn—k.
4. Линейные алгоритмы для линейных операторов 79
Пусть /я = /г—k. Так как xS4 = T(^l)i то существуют 1*п+и ...,
?*, такие что r\i = Tl^+i для / = 1,2, ...,&. Введем матрицу
D.8) M = (L,(g;)), *\/ = 1,2, ...,/г.
Покажем, что эта матрица невырожденна. Действительно, пусть
c1Li(H)+. • • + сяМ?л) = 0 для i = 1, 2, ..., п.
Тогда . g = ^gt + . •. + ся& € ker 31 и Tl?T (ker 5ft). Поскольку
Tl* = 0 для f = l,2, . ..,m = /i—А, получаем
Отсюда cm+ , = ...= r;n = 0. Следовательно, ? = c^,* + ... + cml*m €
€ (ker SR)J-, откуда cx = ... = cm = 0. Этим доказано, что матрица Л1
невырожденна. Положим
D.9) [/,,/2>...,fj*—(А1»)-»[е;,g;f ..Mад4.
Заметим, что ^,(/^ = 6^ для f, /«1,2, ..., m. Мы готовы
доказать основной результат этого параграфа.
Теорема 4.1. Пусть n* = ind(S, 71) <д? = card (ЭТ)<+ оо, и
пусть с\ /1Э /2, ..,/„ определены равенствами D.7) и D.9)
соответственно. Тогда погрешность линейного алгоритма
D.10)
отличается от погрешности оптимального по точности алгоритма
не более чем в с раз, т. е.
D.11) гCt, S, T)^e(q>)^{c/2)d($lt S> T)^cr(9l, S. T).
Доказательство. Так как T^T/o + ^j?-!^/^)^^/» T0
D.12) /?уG7)= 2 LtiftRjiTlt) для /^1, 2, ..;,*.
Положим в D.12) / = |* для /= 1,2, .. .f п. Так как 7*6? = 0 для
i^n—kf a R/(Tl-)^ R/(r\i.m)^bi_mt/ для / > т, то
D.13) [0, /] = МХМ,
где 0 — нулевая матрица размера kx(n—?), /—единичная
матрица размера kxk, а Мл = (/?,(Т^)), 1 = 1, 2, ...,?, у = 1,2,
Поскольку Л4 невырожденна, имеем
D.14) M>s=[0, I]M-\
80 Ч. А, гл. 3. Линейные алгоритмы для линейных задач
Из D.9) и D.14) получаем
[Tflt .... 77„]< = (МГ1 [0 0, ш, Л.. • •' •. %Ь
D.15) 77, = 2 Я/ТО Л/.
/ = 1
Теперь мы можем доказать, что алгоритм ф (91 (/)) = 2?=i
близок к оптимальному. Пусть / = 2?=г ?/ (/)// Для /€30> Так
как Mf/) = fi//> то $l{f) = $l(f). Пусть /t = /—/, А?кег*Я. Из
D.15), D.12) и D.6) вытекает, что
Th = Tf-? Li (/) Г/, = 77-S L, (/) S */ (Ш Л/
= П - 2 (Д ^ (ЛЯ, (Г?,-)) Л/ = 7-/-J) Я, (Г/) tj,
Поэтому || ГЛ || = 1(^H К с ЦТ/1|< с, в силу D.7). Итак,
| ф (Ш (/)) -5/1| = || Sh |< с sup I Sft ||=(c/2) d (91, S, Г) <«r @1, S, Г).
A e ker 91
Поскольку f—произвольный элемент из 30, то е (ф) ^ (c/2) d (ЭТ,
S, Г) и, конечно, е(ф)> г (SR, S, Т). Тем самым D.11) доказано. |
Теорема 4.1 дает способ построения алгоритма ф, погрешность
которого отличается от оптимальной не более чем в с раз.
Заметим, что ф (ЭД (/)) =2Sf, где 9?(f) = 9Z(/). Так как f не обязательно
принадлежит 30, то алгоритм ф, вообще говоря, не является
интерполяционным в смысле определения 2.3 гл. 1.
При с=\ алгоритм ф оптимален по точности. Укажем теперь
случай, когда он является также центральным.
Теорема 4.2. Пусть 34—гильбертово пространство, а Т (ker 5R)
замкнуто. Тогда алгоритм ф, определенный равенством D.10),
представляет собой линейный центральный интерполяционный
алгоритм и
D.16) *(ф)-г(Я. 5, Г)=4<*(ЭТ, 5, Г). |
Доказательство. Пусть Э4 = Т (ker ЭТ) ф Т (ker
ЛI—ортогональное разложение пространства 34. Для каждого /€30 имеем
77 = (Г/)о + G7)« и || Г/1|2 = || (Г/)о р +1| (Г/ЬII2 < 1 • Покажем, что
9(SR(/))=:Sf—центр (/(/) (см. B.5) гл. 1). Пусть / = / + А. Тогда
ft G ker SR. В доказательстве теоремы 4.1 было показано, что
Th = (TfH. Отсюда следует, что Tj=(Tf)L ортогонально,к Th и
/€$(>• Таким образом, ф — интерполяционный алгоритм. Кроме
того, Я(/—А) = 5И(/) и \Т{[— А)||2-|Г/||2+||ГА|J-1Г/||2<1?
5. Оптимальные линейные алгоритмы и линейные п-поперечники *П
Следовательно, Sf—Sh?U(f), откуда вытекает, что U (f)
симметрично относительно Sf. На основании замечания 2.1 гл. 1
заключаем, что ф—центральный алгоритм и выполнено D.16). |
В гл. 4, посвященной сплайновым алгоритмам, будет
доказано, что в предположениях теоремы 4.2 алгоритм 4.10 является
сплайновым.
5. ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ АЛГОРИТМЫ
И ЛИНЕЙНЫЕ /^-ПОПЕРЕЧНИКИ ПО КОЛМОГОРОВУ
Это—второй из параграфов, в которых выявляются
взаимосвязи между некоторыми основными понятиями теории
аппроксимации и теории аналитической сложности (см. также § 6 гл. 2
и § 4 гл. 7).
При фиксированных S и 30 мы рассматриваем оптимальные
линейные алгоритмы для класса линейных информационных
операторов кардинальности не выше п. Как было замечено рядом
авторов, погрешность линейного алгоритма, использующего Щ
с card (9Z) ^ я, не меньше n-поперечника по Колмогорову
множества решений SC0) (см. наряду с другими работы: Бабушка
и Соболев [65], Бахвалов [62а, 68], Голомб [77], Мелкмэн [77],
Мелкмэн и Миккелли [77], Миккелли и Пинкус [77], Миккелли
и Ривлин [77], Чжан Гуанцзюань [62], Шульц [74].
Мы докажем в развитие этого наблюдения, что погрешности
таких алгоритмов еще более тесно связаны с линейными п-ио-
перечниками по Колмогорову. Более того, мы покажем, что
минимальная погрешность таких линейных алгоритмов отличается от
соответствующего линейного д-поперечника по Колмогорову
множителем, зависящим только от S и 30.
Пусть Фь(л)—класс линейных алгоритмов, использующих
линейный информационный оператор кардинальности не выше я,
т.е. ф?Фь(я) означает существование такого линейного
информационного оператора 9t = [Llf L2f ..., LJ*, что ср(9?(/)) =
= SUM/)?/ Для некоторых элементов gl9g%9>..,gn из Эа.
Положим
E.1) %(п) = Х(п, S)- inf
€Ф(
это п-я минимальная линейная погрешность линейных
алгоритмов из класса Фь(я). Напомним читателю понятие линейного
n-поперечника по Колмогорову. Пусть X—уравновешенное
подмножество в 32. Линейным п-попе речником по Колмогорову
множества X называется величина
E.2) ЯЛ(Х, 3,)-inf inf sup|x
' Аа A; AX<ZAnx$X
82 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
где А—линейный оператор с множеством значений АХ в
линейном подпространстве А п (пространства 32) размерности не больше п.
Таким образом, мы в E.2) аппроксимируем тождественный
оператор в X линейным оператором, область значений которого
имеет размерность не больше п. Линейный n-поперечник по
Колмогорову (дальше для краткости будем иногда говорить просто
«линейный я-поперечник»)—это нижняя грань погрешности при
таком способе аппроксимации (см. Тихомиров [60]). Отметим, что
я-поперечник множества X по Гельфанду не превосходит
линейного я-поперечника по Колмогорову: dn(X, 32)^ЯЛ(Х, Зв)Уя
(см. работу Исмагилова [74], где установлены связи между этими
двумя поперечниками).
Замечание 5.1. Совершенно аналогично определяется п-попе-
речник по Колмогорову dn(X, 32), только опускается
предположение о линейности А:
E.3) dn(X4 32) = infsup inf \x—y\.
Ап zX$A
Разумеется, dn{Xy S2)^Xn(Xt 32). Может случиться, что
dn(Xy 32)<Xn(X, 3>2). Однако для многих множеств X,
интересных с практической точки зрения, dn(X, 32) = XW(X, 32) (см.,
например, Тихомиров [76], Корнейчук [76]). В § 4 гл. 7 мы
установим связь между n-поперечниками по Колмогорову и
минимальной погрешностью гс-мерных (не обязательно линейных)
алгоритмов.
Для любого линейного алгоритма <р из <DL (n) имеем ср (Щ (/)) g
?An~\ln(gu gt gn) и \\Sf-q>(m(f))\\>mlysAn\\Sf-y\l
Таким образом,
E 4) е (Ф) > dn (S Ce)f S2) V/ 6 Фь (я)
и, конечно, к (я) > dn (S C0), 32). |
Пусть
E.5) K = K(S{9.), Э.)
— линейный я-поперечник множества решений S C0) в Эа. Мы
готовы к доказательству теоремы, которая аналогична теореме
6.1 гл. 2 и показывает, что последовательность я-х минимальных
линейных погрешностей {^(п)} ведет себя по существу так же,
как последовательность линейных п-поперечников по
Колмогорову {Хп\. Напомним, что фигурирующая в формулировке
приводимой ниже теоремы величина q = q(S, 30) была определена
равенством F.6) гл. 2.
Теорема 5.1. Пусть S: 3, —> 32—линейный оператор. Если
множество 30 уравновешенно и выпукло, то
E.6) Ця)^Ч Уя.
8. Оптимальные линейные алгоритмы и линейные п-поперечники 83
Если, кроме того, 30 — поглощающее множество, то
E.7) <7<1
E.8) q=+oo и
E.9) q = +oo и
Доказательство. Покажем сначала, что Х(п)^Хп. Пусть Л —
такой линейный оператор, что Л5(Э0) содержится в некотором
я-мерном подпространстве пространства 32. Тогда ASf= ^[t^R^Sf)^
V/?30 для некоторых элементов ll7 ga, ..., ?д из 32 и некоторых
линейных функционалов Ru R2, ..., /?„. Рассмотрим
информационный оператор Sft^f/^S, R2S, ..., /?,Д] и алгоритм ф(9](/)) =
= Л5/. Ясно, что <р€Ф/.(л) и e((p) = sup{\\x—Ax\\: *€SC0)}.
Взяв нижнюю грань по Л, получаем К(п)^'кп.
При доказательстве утверждения E.7) можно без потери
общности считать, что q?{0, 1]. Пусть ф€Ф^(п), т.е. Ф (97 (/)) =
«"'Sfc-iMDS/ Для некоторого 9Ы[11э L2, ..., LJ*. Определим
линейный оператор А: За—^Э2 формулой Л*==2?-1^/(/2)?/э г^е
x=S/ + x2, S/CSCafx), ^.€5C^, a f=h+f*, h €kerSf /,€
Заметим, что это определение корректно и /45 C:0)c:lin
..., ln). Рассмотрим разность
E.10)
/ = 1
Пусть 6g@, q). В силу F.6) гл. 2, для каждого /6$0
существует такая константа c = c(f)^q—б > 0, что с/2б30. Из E.10)
вытекает, что
И s/—л
В силу произвольности tp и 6, получаем ^„^^"^(п), чем E.7)
и доказано.
Пусть теперь ^ = +оо. Если S(<3x) представляет собой
подпространство размерности k^n, то, конечно, А,„ = 0. Ввиду E.6)
имеем Ця) = 0, откуда и вытекает E.8). Предположив, что
dim S (-Эх) > п и существует алгоритм ср ? CDl (п)у такой что е (ср) <
< + оо. Так как g = -foo, a ^0 уравновешенно и выпукло, то
/?;30=>с/2€30 для каждого с. Поэтому из того, что |]S(c/2) —
-Ф(Weft)II = \сj\\Sf-ф(91 (/2))Ке(ф)< + оо, следует, что 5/ =
= 5/2 = ф(9?(/:2)). Таким образом, SC0) cz ф (91 (So))- Но
множество Qo является также и поглощающим, откуда вытекает, что
dim lin 5 C0) = dim S (Эх) > п. Это означает, что dim lin ф ER(So)) >
>п. Мы пришли к противоречию. Следовательно, е(ф) = +оо.
Отсюда Я(я) = +оо и E.9) следует из E.6). 1
Следующий пример показывает, что неравенство в E.6) может
быть строгим.
84 Ч. Л, гл. 3. Линейные алгоритмы для линейных задач
ПРИМЕР 5.1. Рассмотрим задачу, описанную в примере 6.1
гл. 2. Как легко показать, Хх = а+\. Отметим, что алгоритм
ф(#) = [0. #» yf c (#==)^(/) = /2 + /з— h является линейным и
е(ц) = а. Так как q = a/(a+l), то на основании E.7) заключаем,
что ХA) = а. Таким образом, XJXA) = (я + 1)/я может быть сколь
угодно большим при малых а. Конечно, Х(п) = Хп = 0 Vm^2. |
Замечание 5.2. Для случая q=\ теорема 5.1 утверждает, что
Этим устанавливается «двусторонняя» связь между теорией
аппроксимации и теорией аналитической сложности. Это значит, что
если из теории аппроксимации известно ХПУ то мы знаем и i(n);
обратно, если из теории аналитической сложности известно X (п),
то мы знаем и Хп. |
Доказанную теорему и теорему 6.1 гл. 2 можно использовать
для установления оптимальности информационных операторов и
линейных алгоритмов. С этой целью заметим сначала, что
где d(n) есть я-й минимальный диаметр, определенный
формулой F.2) гл. 2. Весьма желательно, чтобы выполнялось равенство
% (п) = d (ft)/2, так как это по существу означает, что для п-го
оптимального информационного оператора существует линейный
оптимальный по точности алгоритм. Точное утверждение
содержится в приводимом ниже следствии.
Следствие 5.1. Предположим, что существуют информационный
оператор 9^ = [Lf, L2, ..., LJ* и использующий его линейный
алгоритм ф, такие что
F.11) в(ф)-Х(п).
Если
E.12) 4")=4<*(л),
то 91 является /г-й оптимальной информацией, а ф—линейным
оптимальным по точности алгоритмом. |
Доказательство. Заметим, что Х(п) = е(у)^г(Ш, )
01 d) = X(n). Поэтому d(STC, S) = d(n), a e(q>)
Чтобы установить, равны ли между собой Х(п) и d(n)/2, можно
воспользоваться «-поперечниками по Гельфанду и линейными
дг-поперечниками по Колмогорову. Из теоремы 5.1. с учетом
теоремы 6.1 гл. 2 вытекает такое
/. Введение 85
Следствие 5.2. Пусть q = q(S, 30)=1. Тогда
E.13) ад у
Для многих множеств SC0), представляющих практический
интерес, ^n = dn (см. Тихомиров [76]). Некоторые примеры будут
приведены в гл. 6.
Глава 4
ОНЛАЙНОВЫЕ АЛГОРИТМЫ
В ЛИНЕЙНЫХ ЗАДАЧАХ
1. ВВЕДЕНИЕ
Эта глава базируется в основном на работе Васильковского и
Вожьняковского [78]. Оптимальные по точности алгоритмы
минимизируют погрешность для всех элементов задачи / из некоторого
рассматриваемого класса (в смысле данного ранее определения).
Для «наихудших» элементов /, т.е. таких /, что || 5/—ф (91 (/)) || =
= е(ф), оптимальные по точности алгоритмы дают наилучшую
возможную аппроксимацию. Однако может оказаться, что
оптимальный по точности алгоритм не дает наилучшей возможной
аппроксимации для «легких» элементов /. Говоря о легких /, мы
имеем в виду, что \\Sf—у(Ш (/))||<^?(ф). Для пользователя,
который, может быть, хочет решить задачу как раз для такого
легкого /, это весьма нежелательное свойство. Поэтому в настоящей
главе мы изучим алгоритмы, которые не только оптимальны (или
близки к оптимальным), но и таковы, что для каждого f из 30
локальная погрешность почти минимальна.
Как было упомянуто в § 2 гл. 2, центральные алгоритмы имеют
наименьшую возможную локальную погрешность для каждого /.
Определим отклонение dev (ф) алгоритма ф как отношение для
наихудшего / локальной погрешности алгоритма ф к погрешности
центрального алгоритма. Таким образом, dev (ф) ? [1, + оо], и
dev (ф)= 1 тогда и только тогда, когда ф—центральный алгоритм.
Нас интересуют алгоритмы с малым отклонением.
Как всегда, мы хотим найти алгоритм малой комбинаторной
сложности. Известно, что таким свойством обладает класс
линейных алгоритмов. Поэтому нас будут главным образом интересовать
линейные алгоритмы с малым отклонением.
Это двойное пожелание — малого отклонения и линейности —
приводит к следующим вопросам:
A.1) Существуют ли линейные алгоритмы с малым отклонением?
86 Ч. А, гл. 4. Сплайновые алгоритмы в линейных задачах
A.2) Существуют ли линейные алгоритмы с малым отклонением,
оптимальные по точности?
Мы вводим понятие сплайнового алгоритма и показываем, что
это понятие позволяет ответить на вопросы A.1) и A.2).
Сплайны интенсивно используются в вычислительной
математике и теории аппроксимации. Имеется огромное число статей,
посвященных теоретическим и практическим аспектам сплайнов.
Для сплайнов известен целый ряд свойств оптимальности.
Первым, кто осознал тесную связь между сплайнами и оптимальными
алгоритмами в смысле Сарда, был, по-видимому, Шёнберг [64а].
Сплайны использовались при построении оптимальных
алгоритмов (иногда в смысле Сарда) во многих задачах. См., например:
[71] К [72] Кй [74] Кй Лй
( р) , рр
Карлин [71], Коман [72], Корнейчук [74], Корнейчук и Лушпай
[69], Ли [77], Лигун [76], Липоу [73], Секрест [65Ь], Шёнберг [64Ь,
65, 69, 70] (задача интегрирования); Боянов [75] и Гаффни [77а, Ь],
фф П [76] Ф [77] ( ) Г
, , ] (д рр); [] фф [, ],
Гаффни и Пауэлл [76], Форст [77] (задача интерполяции); Го-
ломб [77], де Бур [77], Мелкмэн [77], Миккелли и Пинкус [77],
Миккелли, Ривлин и Виноград [76] (задача аппроксимации);
Алберг и Э. Нильсон [66], Мангасарян и Шумейкер [73], Мэнс-
филд [72], Г. Нильсон [73], Райнш [74], Риттер [70], Секрест [65а],
Шёнберг [64а] (аппроксимация линейных функционалов);
Гребенников и Морозов [77]-, Миккелли и Ривлин [77] (аппроксимация
линейных операторов); Гребенников [78] (аппроксимация
нелинейных операторов). В классической статье Голомба и Вайнбер-
гера [59], посвященной аппроксимации линейных функционалов,
в неявном виде также используются свойства оптимальности.
сплайнов.
В данной главе мы унифицируем и обобщаем многие известные
результаты и получаем новые свойства оптимальности сплайновых
алгоритмов.
Дадим краткий обзор результатов этой главы. В § 2 вводится
понятие отклонения, играющее центральную роль во всей главе.
В § 3 мы напоминаем определение сплайнов в нормированном
линейном пространстве, а в § 4 даем общее определение
сплайнового алгоритма. Сплайновые алгоритмы однородны, но
необязательно линейны. Мы доказываем, что их отклонение не больше
двух. Далее, предполагая единственность сплайнового алгоритма,
мы доказываем, что отклонение любого линейного (на самом деле
даже любого однородного) несплайнового алгоритма бесконечно.
Этим дается ответ на вопрос A.1). А именно, класс линейных
алгоритмов с конечным отклонением состоит из одних лишь
линейных сплайновых алгоритмов. Таким образом, этот класс пуст,
если сплайновые алгоритмы нелинейны. В § 5 мы рассматриваем
случай гильбертова пространства. Показано, что в этом случае
сплайновые алгоритмы являются линейными и центральными.
2. Отклонение 87
Это значит, что их отклонение равно единице, а комбинаторная
сложность пропорциональна кардинальности информации. В § 6
мы возвращаемся к общему случаю. Даны необходимые и
достаточные условия центральности или оптимальности сплайновых
алгоритмов, и тем самым получен ответ на вопрос A.2).
Проведенный анализ иллюстрируется парой примеров,
демонстрирующих точность условий наших лемм и теорем. В § 7 мы
подытоживаем результаты главы.
2. ОТКЛОНЕНИЕ
Пусть S—линейный оператор решения,
где Г—линейный оператор ограничений, и 9^ [t 2 „]
линейный информационный оператор с card (9?) = д. В этой главе
мы предполагаем, что радиус информации г(ЭТ, S, Т) конечен.
Напомним, что
B.1) г (91, 5, Т) = с sup (| Sh И Th ||,
h e ker W
где c?[l, 2]. Поэтому из условия г [91, S, Т) < + оо следует, что
B.2) ker 9? П ker T с kerS.
Пусть Ф = Ф (Щ, S, Т) — класс всех алгоритмов, использующих
информационный оператор 91 для задачи (S, Т). Напомним (см.
замечание 2.2 гл. 1), что для ф бФ и f €Эо локальная погрешность
?(ф, /) определяется формулой
B.3) е(Ф, /)= sup I ф(ЭТ(/))-5/1|,
7 € 1/ (f)
где V(f) задается равенством B.4) гл. 1. Очевидно, е(ф) =
== sup {в (ф, /): /€30}. Согласно замечанию 2.2 гл. 1,
B.4) inf *(<р, /) = rad?/(f) V/€30i
ф€Ф
где U (f) определено формулой B.5) гл. 1. Поэтому радиус
rad U (/) дает точную оценку снизу локальной погрешности
алгоритма для каждого /€Э0. Поскольку мы хотим, чтобы локальная
погрешность алгоритма ф была по возможности близка к
минимальной, сравним е(ф, /) с rad U (f). Это приводит к понятию
отклонения, определяемому следующим образом.
Определение 2.1. Будем называть отклонением алгоритма
Ф?Ф(9?> S, Т) величину dev (ф), задаваемую формулой
,,5,
при этом принимается соглашение^ что 0/0= 1.|
88 Ч. А, ел. 4. Сплайновые алгоритмы в линейных задачах
Конечно, dev (ф) ^ 1 для любого ф, и dev (ф) = 1 тогда и только
тогда, когда, ф — центральный алгоритм. Проблема существования
линейных алгоритмов с малым отклонением тесно связана с
теорией сплайновых алгоритмов, которые будут введены в § 4.
Предварительно напомним читателю определение сплайнов в
нормированном пространстве.
3. СПЛАЙНЫ
Приведем определение и некоторые основные свойства
сплайнов в нормированных линейных пространствах и введем
обозначения, которые будут использоваться в этой главе. Более
подробные сведения о сплайнах можно найти, например, у Аттэйя [65],
Холмза [72], Энслоуна и Лорана [68].
Пусть у(-Сп. Положим
C.1) A{y)
Заметим, что для любого у множество А (у) непусто, ибо
оператор -Я задается п линейно-независимыми линейными
функционалами и, значит, 9Ц31) = СЯ (см. § 2).
ОПРЕДЕЛЕНИЕ 3.1. Элемент о(у)?А(у) называется
сплайном , интерполирующим у, если
C.2) \\То(у)\\= min |O7||.|
feA (у)
Пусть z€34. Положим1}
C.3) Pz = {tinker$l: \\Th—z|| = dist (T (kerSR), г)}.
Таким образом, каждый элемент из Т (P(z)) осуществляет
наилучшую аппроксимацию элемента г элементами множества Т(кег $1).
Легко видеть, что понятия сплайнов и наилучших
аппроксимаций тесно связаны. А именно, между ними имеются следующие
связи:
C.4) Сплайн с (у), интерполирующий уу существует тогда и
только тогда, когда множество Я G7) непусто для
некоторого feA(y).
C.5) Элемент о?А(у) является сплайном, интерполирующим у,
тогда и только тогда, когда f—o^P(Tf) для каждого
f?A (у).
C.6) Сплайн а (у) единствен тогда и только тогда, когда kerSftfl
П ker Т = {0}, а множество Р (Tf) для любого f?A(y)
состоит из одного-единственного элемента.
1J Ниже dist(AJ, z) обозначает расстояние от точки z до множества М,—
Прим. ред.
4. Онлайновые алгоритмы 89
Сплайны однородны, т.е. если а (у)— сплайн,
интерполирующий у, то со (у) будет сплайном, интерполирующим су, для любой
константы с ? С. Отсюда следует, что если сплайн а (у) определен
однозначно, то а (су) = со (у).
Предположим, что 34 = Г(81) —гильбертово пространство. Тогда
P(Tf) непусто, для любого /б^ тогда и только тогда, когда
Т (кетЩ замкнуто. Далее, а (у) является сплайном тогда и только
тогда, когда о(у)?А(у) и (То (у), 77z) = 0 Vh?ker$l. Сплайн
а (у) зависит от у линейно, т.е. если сплайны о(уг) и о(у2)
интерполируют соответственно уг и у2, то с1о(у1)-\-с2о(у2) будет
сплайном, интерполирующим c1y1+c2y2f при любых константах
с19 с2 ? С. Сплайны а (у) определены однозначно в том и только
том случае, когда кег9?П кег7 = {0}.
4. СПЛАЙНОВЫЕ АЛГОРИТМЫ
В этом параграфе мы вводим понятие сплайнового алгоритма
и доказываем, что сплайновые алгоритмы обладают определенными
свойствами оптимальности в классе однородных интерполяционных
алгоритмов. Чтобы гарантировать существование сплайнов, будем
предполагать всюду далее в этой главе, что множество P(Tf)
непусто для любого [?$!.
ОПРЕДЕЛЕНИЕ 4.1. Будем говорить, что cps—сплайновый
алгоритм для задачи S при использовании информации 9? (и
писать (ps?<Ds), если для любого /€$0
D.1) <Ps(!/) = Sa((/),
где f/==5R(/), а а (у)—сплайн, интерполирующий у. |
Заметим, что всякий сплайновый алгоритм является
интерполяционным, откуда вытекают неравенства е (cps, /) <1 diam U (/) <
^2vadU (f) и dev (cp) jgl2. Так как сплайны однородны, то и
сплайновые алгоритмы тоже, очевидно, однородны.
Замечание 4.1. Для вычисления фч (у) при заданном у нам
надо, вообще говоря, знать сплайн а (у), т. е. надо решить
оптимизационную задачу C.2). Сложность ее решения может быть
большой. Однако если сплайновый алгоритм линеен, т. е. ys($l(f)) =
= 2ii=iLi(f) gfj то достаточно вычислить лишь элементы gu g2,
..., gn. Эти элементы можно вычислить заранее, раз и навсегда,
так как они не зависят от $l(f). Это означает, что во многих
случаях оптимизационную задачу C.2) нужно решать только
один раз. Для нелинейных сплайновых алгоритмов идея
проведения вычислений заранее в общем случае не проходит, и
комбинаторная сложность таких алгоритмов может оказаться очень
большой. |
90 Ч. А, гл. 4. Сплайновые алгоритмы в линейных задачах .
Установим свойства оптимальности сплайновых алгоритмов
в классе Ф = Ф(^, S, Г).
Лемма 4.1. Пусть ср?Ф—однородный алгоритм и у€91(<30)-
Если е(ц>)< + оо и o(y)gker7\ то
D.2) <p(y) = Sa{y).§
Доказательство. Так как о (у) ? ker 7\ то со (у) ? 30 для любого
с ? С и 5R (са (у)) = су. Рассмотрим разность ф (су) —5 (со (у)) =
=с (ф(у)—So (yj). Ясно, что | с ||) <р(у) —So (у) ||<е (ф)< + оо Vc? С,
откуда и следует, что ф(у) = 5а(у).|
Лемма 4.2. Пусть ф ? Ф—однородный интерполяционный
алгоритм. Тогда ф — сплайновый алгоритм. |
Доказательство. Так как ф — интерполяционный алгоритм, то
е (ф) ^ 2г (97, 5, Т)< + оо. Выберем произвольное у из 9{ C0) и
рассмотрим сплайн о(у). Если о(у)? кегГ,то ф(у)=5а(у)по лемме 4.1.
Поэтому можно считать, что Та (у) Ф 0. Пусть у = у/\\ То (у) ||, а
oQ/)—сплайн, интерполирующий у. Заметим, что ||Та(у)||=1;
отсюда вытекает, что о (у) g30 и 9?(а(у)) = у. Рассмотрим
множество V = V(o (у)) = {/ 6 3i: 9{ (f) = у, 1Г/J < 1}. Каждый элемент
из V—это сплайн, интерполирующий у, так как 1=|7а(у)||^
<||Т/1| для любого f?V.
Алгоритм ф является интерполяционным. Поэтому ф (у) =
z=S{o(y)) для сплайна о (у). Поскольку ф также и однороден,
то Ф(у) = ||71о(у)|)ф(у) = ||Та(у)||5а(у) = 5а(у), где а (у)-сплайн,
интерполирующий у. Этим доказано, что ф—сплайновый
алгоритм. |
Мы хотим выяснить, когда сплайновый алгоритм существует
и является единственным. Нетрудно доказать следующую лемму.
Лемма 4.3. Сплайновый алгоритм существует и единствен в том
и только том случае, когда множество SP (Tf) состоит из одного-
единственного элемента для любого /?3
Доказательство. Пусть /?30 и y = 9?(f). Рассмотрим сплайны
<*i(У) и о2(у). Из § 3 мы знаем, что f—oi{y)=-hi^P{Tf) для
f«=l, 2. Имеем
Поэтому множество SP (Tf) одноэлементно тогда и только тогда,
когда So, (у) = So2 (у) Vy 6 $1 (Эо). I
Мы подготовлены теперь к рассмотрению отклонений
однородных алгоритмов, принадлежащих Ф.
4. Онлайновые алгоритмы 91
Теорема 4.1. Пусть множество SP(Tf) одноэлементно для
любого /63О, и пусть ф—однородный алгоритм, ф?Ф. Тогда
( <2, если ш —сплайновый алгоритм,
D.3) dev(q>)= ,
4 ' VY/ ( + оо в противном случае. |
Доказательство. Неравенство dev (ф) ^ 2 для сплайнового
алгоритма ф уже было доказано. Если ?(ф) = +оо, то dev (ф) =
= + оо, так как rad U (f)^r (Ш, S, Т) < + оо. Поэтому без
потери общности можно предположить, что ф не является сплай-
новым алгоритмом и е(ф)< + °°. Это означает, что существует
у € $1 C0), такое что ф (у) Ф So (у), где о (у)—единственный сплайн,
интерполирующий у. Лемма 4.1 гарантирует, что То(у)фО.
Положим у — у/1То(уI, как и в доказательстве леммы 4.2, и
рассмотрим состоящее из одного элемента множество U = U (о (у)) =
= {So (у)}. Конечно, rad U = 0. Поскольку алгоритм ф однороден, то
Ф (У) = Ф (У)/\\ То (у) [| Ф So (y)/\\ То (у) || = So (у).
Поэтому е (ф, а (у))фО и dev (ф) ^ е (ф, а (y))/rad U (а (у)) = +оо. |
Предположение о том, что множество SP(Tf) одноэлементно
для любого / ^ 30, является существенным. Чтобы убедиться в этом,
рассмотрим следующий пример.
ПРИМЕР 4.1. Пусть ^1 = 32 = Э4 = С[0, 1] —пространство
непрерывных функций на [0, 1] с нормой J/|| = maxo<*< 11/(*)|.
Пусть, далее, 5 = Г = /—тождественный оператор, а у = ^(/) =
= [/(^i), /(^2)» -v, f(xj]\ где х,е[0, 1J — некоторые попарно
различные точки. Таким образом, мы хотим восстановить
функцию /, зная п ее значений в точках xt и зная, что ||/|^ 1. Легко
показать, что
radt/(/)-l
и единственным центром множества U (/) является нулевая
функция. Заметим, что центр U (/) не принадлежит U (/), если 9i(/) =7^=0.
Каждая функция а^Зх, совпадающая с / в хь т. е. такая, что
о(xi) = f(xi) = yh i=l, 2, ... , п, и удовлетворяющая условию
Ia\^:msix1<i<n\f(xi)\s=lylof будет сплайном. Следовательно,
если / ^ ker^i, т. е. уфО, то существует бесконечно много
сплайнов и, очевидно, множество
состоит более чем из одного элемента.
Рассмотрим центральный линейный алгоритм ф(#) = 0.
Конечно, dev^)= 1. Алгоритм ф не является сплайновым так как
qh не является интерполяционным. Далее, можно показать, что
92 Ч. Л, гл. 4. Сплайновые алгоритмы в линейных задачах
любой интерполяционный алгоритм ф имеет локальную
погрешность е(ф, /) = 2 для всякого /?30 с [9l(/)L=l и, кроме того,
d() 2
Замечание 4.2. В теореме 4.1 утверждается, что отклонение
однородного алгоритма конечно лишь в случае, если он сплай-
новый. Тем самым дан ответ на вопрос A.1). Если сплайновый
алгоритм нелинеен, то класс линейных алгоритмов с конечным
отклонением пуст. Если же сплайновый алгоритм линеен, то класс
линейных алгоритмов с конечным отклонением состоит в
точности из одного элемента, а именно из единственного сплайнового
линейного алгоритма. |
Таким образом, важно знать, когда сплайновый алгоритм
линеен. Мы определили сплайновый алгоритм ср только для
#€9iCu). Очевидное обобщение—это алгоритм у (у) = So (у), где
а (#)—- сплайн, интерполирующий у, при у?Сп. Предположим,
что множество SP (Tf) одноэлементно для /?30. Заметим,
что отображение Р(г), определяемое формулой C.3), однородно.
Поэтому, поскольку множество SP(z) состоит из одного элемента
при любом г?ТC0), то SP(z) = {a(z)\ также состоит из одного
элемента при любом г?Т(Зг) = ЭА. Следовательно, можно
определить оператор /?: Э4 —> 32, такой что
D.4) /?(*) = a (*).
С помощью этого оператора сплайновый алгоритм можно
представить в виде
D.5) So(y) = Sf-
Действительно, так как а (у)—сплайн, то /—o(y)?P(Tf) для
любого /, такого что Ш (/) = у. Тогда S (f—o (у)) € SP (Tf) = {a (Tf)}
и So(y) = Sf—S(f—o(y))=Sf — R(Tf), чем и доказано D.5). Из
D.5) немедленно следует
Лемма 4.4. Пусть множество SP(z) одноэлементно для любого
^34 Тогда сплайновый алгоритм линеен, если и только если
R—линейный оператор. |
Позже мы приведем примеры, когда линейный сплайновый
алгоритм существует. А сейчас проиллюстрируем лемму 4.4
примером, где единственный сплайновый алгоритм нелинеен.
ПРИМЕР 4.2. Пусть З^За^зЗ^—пространство многочленов
от одной переменной степени не выше п, наделенное нормой
|]/1| = тахо<*< 11/@|» и S = T==/. Рассмотрим информационный
оператор, задаваемый равенством
»-*и)-[г«». ф «У
5. Гильбертов случай 93
Ясно, что п € ker $l=$h. (/) = const. Поэтому
*h0: sup |/(O-Ao| = inf sup \f(t)-c\\t
0< /< 1 :€RO<!<1
т. е. функция h принадлежит P(f) тогда и только тогда, когда
она постоянна и является наилучшим приближением к / среди
всех многочленов нулевой степени. Хорошо известно, что
множество Р (/) = {а (/)} состоит ровно из одного элемента и
/?(/) = «(/) = G+/)/2,
где / = тах0<*<!/(*), a ?=mino<*< xf(t). Очевидно, оператор R
нелинеен и, стало быть, единственный сплайновый алгоритм также
нелинеен. Положим g(y) =2?-il//''f где f// = /(/> @)/i!. Из D.5)
вытекает, что
Можно показать, что наш сплайновый алгоритм является
центральным и
е(ср% /) = 1—(g—g)/2^ r (9?, 5, Т)=\. |
5. ГИЛЬБЕРТОВ СЛУЧАЙ
В этом параграфе предполагается, что оператор Т является
отображением на гильбертово пространство З^Г^) и Т (ker 9t)
замкнуто. Отметим, что множество SP (Tf) одноэлементно при
любом /? Зх. Действительно, пусть at (у) и сг2 (у)—сплайны,
интерполирующие */ = ЭД(/). Тогда элемент Tot(y) ортогонален к
T(ker5R). Пусть h^a1(y)—a2(y)t Тогда /гg ker9i и [|Га21|2 =
== || 7"а21|2 = || Тах—Т/г |]2 ^ЦГсг^ + ЦТЛЦ2. Следовательно, 77г~0.
Итак, h? кегЭТп кегТ, откуда на основании B.2) заключаем,
что h?kerS, т. е. 5а, (y)=So2(y).
Единственный сплайновый алгоритм можно получить
следующим образом. Пусть через
е' = [0, ... , 1, ... , О
обозначен i-й единичный вектор, (=1, 2, ... , п. Возьмем a, ?3i,
для которого $l(Oi) ^el и То( ортогонально к T(ker9i). Очевидно,
что ot—сплайн, интерполирующий е(. Тогда вектор а(г/) =
= 2?=i^/(/)°/ также ортогонален к T(ker9Z), и поэтому о(у)~-
сплайн, интерполирующий y = [L1(f)f L2(f)9 ..., Ln(/)]*. Един-
94 Ч. Л, гл. 4. Сплайновые алгоритмы в линейных задачах ^
ственный сплайновый алгоритм (ps имеет вид
E.1) <Ps(y) = So(y) = JZLiiftSot
? = 1
для у = Ш((). Отсюда видно, что сплайновый алгоритм линеен.
Оптимальность сплайновых алгоритмов для случая
гильбертова пространства устанавливалась в различных конкретных
ситуациях многими авторами. См., например, работу Миккелли
и Ривлина [77], где рассмотрен случай 34 = 3flf T = I. Применяя
метод доказательства, сходный с методом Миккелли и Ривлина [77],
установим следующую теорему.
Теорема 5.1. Если Э4— гильбертово пространство и Г(кег9?)
замкнуто, то сплайновый алгоритм ф5 является центральным и
E.2) e(cps, /) = rad U (/) = К 1-|] To (у) ||2 г (Я, S, Т\ у = Мф,
причем
E.3) r($l,S, Г)= sup Ш. |
/f € ker 9? II '1
Доказательство. Пусть }?V(f). Тогда f = o(y) + hi где у =
и 1 >||Г/||2 = || То (у) f + \\Thf. Таким образом,
и || Th |2 < 1-|| Га (у) f}.
Покажем, что множество U (f) = SV(f) симметрично относительно
So (у). В самом деле, пусть So (y)+Sh?U (/). Тогда /г?кег9{
и || Th f < 1 —1| То (у) ||2. Элемент Sa (y)—Sh также принадлежит
(/(/), поскольку $l(o{y)-h) = y и ||Г(а((/)-/1I2 = ||Га((/)||2 +
+ |) 77*||2 ^1. На основании замечания 2.1 гл. 1 заключаем, что
So (у)—центр (/(/) и
г (Я, 5, T) = i-d@i, S, Г)= sup
Следовательно, фМу) = 5а(^)—центральный алгоритм и
(Ф% /) = rad f/ (/) + sup {|| 5 (а (у) + h)-So (у) ||: а (у) + h € V (/)}
]/"l — Ц Га (г/) ||2}
}/" 1 _|| То (у) ||2 sup {|| SA ||/|| Г/г (]: h € ker SR}
KSl, S, Г). |
Замечание 5.1. Так как существует в точности один
линейный алгоритм с конечным отклонением, то алгоритм,
определенный соотношением D.10) гл. 3, является сплайновым и это
соотношение совпадает с E.1). |
Теорема 5.1 утверждает, что сплайновый алгоритм является
центральным. Он также линеен. Это очень желательные и по-
S. Гильбертов случай 95
лезные свойства. Тем самым даны положительные ответы на наши
вопросы из § 1 для случая любых линейных операторов 5, Т и
9? (в предположении что 34 — гильбертово пространство, а Т (кегЭ?)
замкнуто). Проиллюстрируем теорему 5.1 двумя примерами.
ПРИМЕР 5.1. Пусть Э1 = -34—гильбертово пространство с орто-
нормированным базисом {?/}?=! и Т — некоторый ортогональный
оператор, т. е. Т*Т = ТТ* = 1. Пусть, далее, /63lf т. е.
/=2]Г=1 (/» Б/) Б/. Определим информационный оператор 91 формулой
0 = 3ltf) = [tf.Ei), (/, Б,), ...,(/, У]1.
Тогда Я (а (у)) = */ для а (у) = 2?-i (//. 5/) S/ и (^ (</)> ™) = (а^ л) -
= 2?-itf, Б/) (Б/, л) = 0 для любого fi?kerm = {h: (Л, Е/) = 0,
i=T, 2, ... , п\. Отсюда видно, что конечная сумма Фурье о (у)
есть сплайн. Таким образом, для любого линейного оператора
S: -Зх —^32 сплайновый алгоритм
ф(</)= S (/,
является центральным и г(9?, 5, 71) =
и |А||<1}. I
ПРИМЕР 5.2. Пусть ^=^[0, 1] —пространство Соболева
(пространство функций, (г—1)-я производная которых абсолютно
непрерывна, а r-я производная принадлежит 34 = L2[0, 1]), и
пусть r = Dr, т. е. T/ = /(r), a
^/€[0, 1]—попарно различные точки и max1<i<kji^:r. Тогда
кардинальность 9Z равна я = /1 + /2+ ... +/л. При условии, что
м > г, сплайн а (у) есть так называемая натуральная
сплайн-функция степени 2г— 1 по отношению к узлам хи х2у ... , xk
кратности /х, /2, ... , jk соответственно.
Многие авторы изучали этот информационный оператор при
различных линейных операторах 5 (ссылки на литературу см. во
введении). Например, в случае S = I или 5/= j0 f(x) dx известно,
что г (91, S, Т) равно оо при п < г и ведет себя примерно как
п~г при ni^r. Теорема 5.1 гарантирует, что для любого
линейного оператора S алгоритм, использующий натуральный сплайн,
является центральным. В гл. 6 читатель найдет многочисленные
примеры оптимальных сплайновых алгоритмов. |
96 Ч. -А% гл. 4. Онлайновые алгоритмы в линейных задачах
6. НЕГИЛЬБЕРТОВ СЛУЧАЙ
В этом параграфе мы изучаем сплайновые алгоритмы в
случае, когда пространство 34 не обязательно гильбертово. Даны
условия, необходимые и достаточные для гого, чтобы сплайновый
алгоритм был центральным, и для того, чтобы он был
оптимальным по точности. Приводятся также примеры, когда сплайновые
алгоритмы- не являются ни центральными, ни оптимальными по
точности. Начнем со свойства центральности сплайновых
алгоритмов. Интуитивно очевидно, что сплайновый алгоритм
централен в том и только в том случае, если центры множеств U (/)
принадлежат этим множествам и обладают свойством
однородности. Точная формулировка этого утверждения такова:
Лемма 6.1. Центральный сплайновый алгоритм qf существует
тогда и только тогда, когда существует функция с: 9iC0) ->Э2,
такая что выполнены следующие условия, в которых ^ = 9Г? (/):
(i) с (у) принадлежит множеству U (f) и является центром этого
множества при любом f€$0\
(ii) функция с однородна, т. е. tc (у) принадлежит множеству
U (tf) и является центром этого множества V|/|<1 V/?30. |
Доказательство. Пусть срс—центральный сплайновый алгоритм.
Положим с(#) = срс (y)=*So(y). Так как фс—интерполяционный
центральный алгоритм, а сплайн а (у) однороден, то с обладает
всеми желаемыми свойствами.
Предположим теперь, что с удовлетворяет условиям (i) и (ii);
это означает, что с (*/)—однородный интерполяционный алгоритм.
Из леммы 4.2 следует, что с (у)—сплайновый алгоритм. |
Приведем теперь пример, когда единственный линейный
сплайновый алгоритм оптимален по точности, но не централен.
ПРИМЕР 6.1. Пусть Эх =S2 = 1^L> [0, 1] (пространство
абсолютно непрерывных функций с Г€А»[0> 1]) и S = /, Tf=ff,
Sft (/) = [/((}), /A)]* (см. рис. 3). Легко удостовериться, что
существует единственный сплайновый алгоритм
У1)*> е(<р*) = ± = г($1, S, Г).
Центральный же алгоритм задается формулой
где рг и р2—совершенные сплайны,
+ у} при
v ; ^ х + у-\-1 в противном случае,
6, Негильбертов случай
97
f(\)
w
0
/
/
fr
z
совершенный
» ^^с*плайн pi
\\i центральный
I ><^-^ алгоритм у с
0^\/^~^^ сплайновый
\yS алгоритм у5
J\ ^^^^-^ совершенный
i сплайн p%
i ^
1 X
Рис. Ь
i при *<(& — у2+\)/29
* — 1 в противном случае.
Ясно, что (ps^?<pc. |
Перейдем к вопросу о том, когда сплайновый алгоритм
оптимален по точности. Отметим, что теперь мы имеем дело с
неединственными сплайновыми алгоритмами, так как не предполагаем,
что множество SP(Tf) одноэлементно.
Лемма 6.2. Оптимальный по точности сплайновый алгоритм
существует в том и только том случае, если существует функция
а: ЭТC0)—»-32, такая что
(О °(у) есть сплайн, интерполирующий у, Уу\
(и) для любого /?30
\\Tf-To(y)\\>l=i>\\Sf-Se(y)\\^r($l S, Г),
где */ = ЭТ(/).|
Доказательство^ Пусть__ф5—оптимальный по точности
сплайновый алгоритм, cps (у) = So (у), где а (у) — сплайн,
интерполирующий у. Тогда для любого / € 30 имеем || Sf—So^ (у) || < г C1, S, Т),
где y = $l(f). Следовательно, функция а (у) = о (у) удовлетворяет
условиям (i) и (ii).
Предположим теперь, что а удовлетворяет условиям (i) и (ii).
Определим алгоритм <р формулой <p(#) = Sa(#). В силу (i),
алгоритм ф —сплайновый Рассмотрим \\Sf-ц>(уЦ для у = щ}). Если
№-То(уЦ> 1, то, в силу (ii), IS/—ф@)|<г(Й, S,T). Если
4 л 564
Ч. Ау гл. 4. Сплайновые алгоритмы в линейных задачах
же [\Tf—To(y)l^ 1, то, полагая h = f—o(y), /igkerSR, имеем
15/—<p(#)|| = ||S/i|| и ||77t||^l. Поэтому, учитывая B.1), получаем
Sf—ф(УI<|5Л||/|ТА»|<г(Э1, S, Г). Но это и означает, что
Ф—оптимальный по точности сплайновый алгоритм. |
Лемма 6т2 утверждает, что сплайновый алгоритм cps (y) = So (у)
оптимален по точности, если элементы А=/—о (у) с большой
Т-нормой (\\Th\\> 1) «увязаны» с оператором S в том смысле, что
норма \\Sh\\ мала, а именно ||S/z||^/*(9?, 5, Т). Отметим, что если
34—гильбертово пространство, то имеется единственный
сплайновый алгоритм и для него || 77i|| = |/"|| 7/||2—11 То (у) ||2 < || Г/||< 1,
т. е. условие (п) выполнено автоматически. Далее, заметим, что
лемма 6.2 дает ответ на вопрос A.2). Именно, класс линейных
оптимальных по точности алгоритмов с конечным отклонением
непуст в том и только том случае, когда существует функция а,
удовлетворяющая условиям (i) и (п) леммы 6.1.
В примере 6.1 представлена для случая негильбертова
пространства 34 задача, для которой выполнено условие (И). Теперь
рассмотрим пример, в котором единственный сплайновый
алгоритм не является оптимальным по точности, а его отклонение
сколь угодно близко к двум.
ПРИМЕР 6.2. Пусть 31 = 32 = R2 = {(/;i, /2): /,—вещественные
числа} с /2-нормой 1/1 = Vfl + fl, и пусть 34 = R2 наделено нормой
fl/HmaxflU a-4/.l),
где ag(lt +°°)—параметр. Положим Sf = f, 77=/и y=t^l(f)=z
e/i + /i- Таким образом, зная сумму координат вектора /, мы
хотим восстановить сам вектор /, причем
На рис. 4 показаны центральный и сплайновый алгоритмы.
Центральный алгоритм задается формулой
при-1-а<{/<-а+1
при |у
^2~A+а—\у\) в противном случае.
6. Негильбертов случай
99
V(cL-i)'
CL~\
\
центральный
алгоритм &с
сплайновый
алгоритм a>s
-а
Рис. 4
Следовательно, r(% S, Г) = |/. Единственный сплайновый
алгоритм ф? задается формулой
Локальная погрешность алгоритма фэ равна
I) при \у
г—\у\) в противном случае,
и в(ф3) = в(ф% a— l) = BK2/(l+fl))a«Bfl/(l+fl))r(9l, S, Г).
Это означает, что ф? не является оптимальным по точности
алгоритмом. Далее,
Следовательно, с!еу(ф5) может быть сколь угодно близким к 2
при больших а.
Подчеркнем, что для этой задачи существует единственный
оптимальный линейный алгоритм фь, фь (#) = ((), у). Он не является
интерполяционным алгоритмом, а его отклонение равно
бесконечности. |
100 Ч. А, гл. 5. Сложность в линейном случае
7. РЕЗЮМЕ
Подытожим результаты этой главы. В предположении
единственности сплайнового алгоритма cps ответ на вопрос A.1) таков:
если 9s нелинеен, то класс линейных алгоритмов с конечным
отклонением пуст, а если линеен, то этот класс состоит из одного
элемента, а именно cps. Ответ на вопрос A.2) таков: класс
линейных оптимальных по точности алгоритмов с конечным
отклонением пуст, если алгоритм cps нелинеен или не является
оптимальным по точности, и состоит из одного элемента, а именно <ps, если
этот алгоритм линеен и оптимален по точности. Даны
необходимые и достаточные условия для того, чтобы алгоритм cps был
линейным, центральным и оптимальным по точности.
В случае когда Т(кегЩ — замкнутое подмножество в
гильбертовом пространстве, существует единственный сплайновый
алгоритм ф% и он централен и линеен. В силу центральности, он
дает наилучшее возможное приближение для каждого /. В Силу
линейности, комбинаторная сложность алгоритма мала, так как
можно воспользоваться методом проведения вычислений заранее.
Еще раз подчеркнем, что в общем случае сложность нелинейного
сплайнового алгоритма велика и что проводить вычисления
заранее нельзя.
Глава 5
СЛОЖНОСТЬ В ЛИНЕЙНОМ СЛУЧАЕ
1. ВВЕДЕНИЕ
Мы исследуем в данной главе сложность линейных задач E, Т)
с линейными информационными операторами Щ. Для этого
линейного случая будет уточнена модель вычислений (общая модель
вычислений была определена в § 3 гл. 1).
Как было отмечено во введении к гл. 3, сложность линейных
алгоритмов по времени и по емкости должна быть небольшой.
Здесь мы количественно конкретизуем это утверждение, показав,
что каждый линейный алгоритм с погрешностью, меньшей
некоторого 8, почти оптимален по сложности. Мы также количественно
охарактеризуем связь между минимальной кардинальностью
операторов 31, для которых г($1, 5, Т) < е, и сложностью задачи.
Мы ставим и даем ответ на следующий вопрос. Какие
функции могут быть функциями сложности? Будет установлен
удивительный факт, заключающийся в том, что произвольная
убывающая вещественная функция на множестве положительных чисел
является, по существу, сложностью некоторой линейной задачи
2. Сложность линейной информации 101
(точный результат сформулирован в теореме 2.2). Отсюда следует
существование сколь угодно сложных линейных задач. Кроме
того, в отличие от теории рекурсивно вычислимых функций,
в нашей модели отсутствуют «пробелы» в множестве значений
функций сложности.
2. сложность линейной информации
Уточним модель вычислений для линейной задачи (S, Т)
с линейным информационным оператором 91 следующим образом.
(По поводу общего случая см. § 3 гл. 1.)
Модель вычислений в линейном случае
(i) Пусть Р—заданный набор простейших операций.
Предполагается, что операции сложения двух элементов из 92 (f + g)
и умножения элемента из 32 на скаляр (cf) являются
простейшими и принадлежат Р. Предполагается также, что для каждого
линейного функционала L: Зх —> С вычисление его значения —
тоже простейшая операция, принадлежащая Р. Отсюда следует,
что любой линейный информационный оператор $l=[Lu L2, ..., Ln]f
конечной кардинальности допустим при произвольных линейных
функционалах Lx, L2, ..., Ln.
(ii) Введем масштаб измерения сложности, приняв стоимость
сложения двух элементов из 32 или умножения элемента из 32
на скаляр равной единице. Заметим, что если
32—конечномерное пространство размерности т, то единичная стоимость
складывается из стоимости т сложений скаляров или умножений
скаляров.
Пусть comp (L) обозначает сложность вычисления линейного
функционала L. Пусть Ш = [Lu L2, ..., Ln]f—линейный
информационный оператор с линейно-независимыми линейными
функционалами Lu L2, ..., Ln, card(9?) = п. Предположим, что для
вычисления Ш([) необходимо независимо вычислить L^/), L2(/), ...
..., Ln(f), при этом информационная сложность 91 задается
равенством (см. C.4) гл. 1)
п
comp (Щ = 2 comp (Lt).
Если comp (Li)z=icu то comp (Ш) = пси откуда видно, как
информационная сложность зависит от кардинальности $?.
(iii) Пусть ф-—допустимый алгоритм, использующий
информацию ШA) и отыскивающий е-приближение для элемента a = S(/).
Пусть й(ф) —комбинаторная сложность ф. Для всех линейных
задач, представляющих практический интерес, алгоритм ф должен
использовать каждое значение ?/(/), ( = 1,2, ..., я, по крайней
102 Ч. А, гл. 5. Сложность в линейном случае
мере один раз, и d((p)^zn—1. Исключая из рассмотрения
«нетипичные» задачи и информационные операторы, будем
предполагать, что для каждого из рассматриваемых алгоритмов d (ф) ^
>1
ПРИМЕР 2.1. Пусть Р = {арифметические операции,
вычисление значений линейных функционалов, вычисление значений
операторов, вычисление значений производных от операторов}. Пусть
^(/) = (/(*)> /'(*))> гДе /—оператор в m-мерном пространстве,
т^оо. Предположим, что ф ($1 (f)) = х—(/' (х))"*1 f (x).
Случай 1: т<оо. Пусть сотр (L)=*Ci для каждого линейного
функционала L, Тогда сотр (/ (л:)) = тси сотр (/' (л:)) ^тЧ^
Предположим, что при вычислении ф(9(/)) соответствующая
линейная система решается гауссовым методом исключения. В силу (ii),
й(ф) = 0(т2). Итак,
сотр (ф) = тсг + т3^! + d (ф).
Случай 2: т = оо. Добавим к нашему набору простейших
операций операцию решения линейной системы. Пусть сложность
этой операции равна с4,ч и пусть сотр (/(#)) ==*с2, сотр (/' ())
Тогда () + +
Замечание 2.1. В пункте (i) нашего описания модели
вычислений мы предполагаем, что каждый линейный функционал допустим.
Для многих операторов решения представляет интерес
рассмотрение лишь некоторого подкласса класса допустимых
информационных операторов. Например, в случае 5/=J0/(/)d/ можно
ограничиться рассмотрением подкласса, соответствующего
функционалам вычисления значений функции.|
Построенная модель носит идеализированный характер,
поскольку предполагается, что вычисление значений каждого
линейного функционала является простейшей операцией. Однако даже
для этой идеализированной модели мы докажем (см. теорему 2.2),
что сложность линейной задачи (S, Т), рассматриваемая как
функция от 8, может быть по существу любой убывающей
функцией.
Зафиксируем 5R, S и Т. Пусть ф-линейный алгоритм, т. е.
Ф(9?(/)) = 2?= 1 М/)?/> гДе gu ё2> •••> ?„—некоторые элементы
из Э2- Элементы gt зависят от 91, «S и Г, но не зависят от ff
поэтому их можно вычислить заранее. Для вычисления ф(9?(/))
при заданном $l(f) требуется не более п умножений ип—1
сложений, а это простейшие операции единичной стоимости.
Следовательно, любой линейный алгоритм допустим, и его
комбинаторная сложность не превосходит 2/г—1. В силу (iii), комбинаторная
сложность любого линейного алгоритма отличается от минималь-
2. Сложность линейной информации 103
ной не более чем в 2 раза. Итак,
B.1) сотр (ф) < сотр (9?) + 2п— 1.
Напомним, что comp(9i, S, 7\ е) обозначает е-сложность задачи
(S, Т) при использовании информации 91 (см. определение 3.1
гл. 1). Если погрешность линейного алгоритма ф меньше е, то,
как легко показать,
B.2) сотрC1, S, Т, г)=*сотр(Э1) + а1п—19
где ^€[1, 2]. Из B.1) и B.2) следует, что
B.3) сотр (9*, S, 7\ е)<сотр (ф)<2сотр (97, 5, Т9 в).
Таким образом, сложность каждого линейного алгоритма с
погрешностью, меньшей е, не более чем вдвое превосходит
е-сложность задачи (S, Т) при 9i. Кроме того, для таких алгоритмов
B.4) сотр (Ш) ^> п =Ф сотр (91, S, 7\ е) ~ сотр (ф) ~ сотр (9?).
Из условия B.4) следует, что сложность каждого линейного
алгоритма с погрешностью, меньшей е, почти равна е-сложности
E, Т) при 9t. Предыдущие рассмотрения служат мотивировкой
следующего определения.
Будем говорить, что фпос—почти оптимальный по сложности
алгоритм1* для (S, Т) при % если фпос удовлетворяет условиям
B.3) и B.4).
Таким образом, нами доказана
Лемма 2.1. Предположим, что существует линейный алгоритм ф>
использующий 9i, для которого ?(ф)<8. Тогда ф — почти
оптимальный по сложности алгоритм для (S, Т) при 97. |
Пусть, при фиксированных S и Т9 "V—класс допустимых
линейных информационных операторов. Нас интересует теперь
вопрос об оптимальных по сложности алгоритмах для задачи
(S, Т) в классе ЧТ (см. определение 3.2 гл. 1). Как мы увидим,
этот вопрос связан с вопросом о минимальной кардинальности
линейных информационных операторов 9t из гР, таких что
r(9i,S, Т)<г.
ОПРЕДЕЛЕНИЕ 2.1. Назовем г-кардинальношью задачи (S, Т)
в классе У (кратко, е-кардинальностью (S, Т) в "ЧР) число
т(^?, S, Tf е), задаваемое формулой
B.5) m(Y, S, Г, e)-min{card(9i): 9i€Y, r (97, 5, 7)< в}. I
Заметим, что т^Р, 5, Т, е)—невозрастающая функция от 8.
Напомним, что s-сложность comp (Y, S, Г, г) задачи (S, Г)
1) В оригинале nearly optimal complexity algorithm. Отсюда индекс пос.—
Прим. ред.
104 Ч. А, гл. 5. Сложность в линейном случае
в классе Ч? была определена равенством C.9) гл. 1. Покажем,
как е-сложность comp (T, S, Т, г) зависит от е-кардинальности
m(V,S,T9B).
Предположим, что для каждого ffl = [Li9 L2, ...,Lm]{
сложность вычисления значений линейного функционала L,- равна cf.
Тогда
comp (9i) = /ic, V9t € V, п = card (SR).
По аналогии с B.3) и B.4) назовем алгоритм ф почти
оптимальным по сложности для E, Т) в V, если
comppF, S, Г, е)< сотр (ф)< 2 comp pF, S, Г, е) и при са>1
comp (?, S, 7\ е) ~ сотр (ф).
Пусть Шт—информационный оператор из класса *Р, такой что
r@lm, S)<e и card C1J = m =»m(Y,Sf Г, е).
Лемма 2.2, Предположим, что существует линейный
оптимальный по точности алгоритм ф, использующий 9IOT. Тогда
(i) е-сложность задачи (S, Т) в классе W равна
^, S, 7\ e)-(c1+a1)m(T, S, Г, е)-1,
где ах€[1, 2];
(ii) алгоритм ф почти оптимален по сложности для (S, Т)
в Т. |
Доказательство. Для е-сложности задачи (S, Г) с
информационным оператором Я1т справедливо неравенство
comp ($lm, S, Tt г) < comp (ф) < тс^ + 2т— 1.
Далее, для каждого 9t G Т с г (9t, S) < е имеем card (!ЭТ) ^ т и
comp ($N, S, Г, е) ^ тсх + т— 1.
Объединяя эти два неравенства, получаем
comp (Т, 5, Г, е) = (сг + а,) т— 1,
где ^?[1,2], чем доказано (i). Очевидно, что comp (ф) ^
^2 comp (V, S, Т, е), а из Ci^>l следует, что сотр(ф) и
comp (Y, S, Т9 г) почти равны тсх. Этим доказано (ii). I
Лемма 2.2 выявляет тесную связь между е-сложностью E, Т)
в V и е-кардинальностью (S, Т) в Y. Она также показывает,
что линейный оптимальный по точности при использовании
информации Шт алгоритм почти оптимален по сложности для (S, Т)
в! В гл. 6 мы приведем несколько представляющих
практический интерес примеров, когда применима лемма 2.2.
Пусть Чу—класс всех линейных информационных операторов
STi с card (91) < + оо (вследствие условия (i) из описания модели
2. Сложность линейной информации 105
вычислений для линейного случая каждый такой оператор Ш
допустим!). Заметим что, U,wsrt*?B с V^, где Y,,—класс всех
информационных операторов Щ, для которых Ш* с 9?, card ($1) ^ п
(см. § 4 гл.2). Далее, U^o^-T^ если ind (S, 7) = 0. Класс
Уц содержит все интересные с практической точки зрения
информационные операторы, поскольку кардинальность каждого
подлежащего вычислению информационного оператора должна
быть конечной.
Покажем, что m(WUf S, 7\ е) может быть по существу любой
убывающей функцией е. Точнее, пусть е принадлежит
.интервалу @, е0], и пусть
B.6) g: @, ee] - К+
— убывающая функция, такая что?(е0)^ 1 и lime->og(e)==+oo.
Для простоты предположим, что g непрерывна.
Теорема 2.1. Для каждой функции g указанного выше вида
существует линейная задача (S, Г), для которой
B.7) g (е) - 1< m (VU9 S, Г, е)< g (г) Ve € @, е0].
Кроме того, существует последовательность {ej, такая что
»/ € @, 80], ИГЛ/ - ooS, = 0 И
B.8) m(VU9S9 T, g/) = g(8/).|
Доказательство. Пусть g: [g (e0), + оо) —*> R+ —функция,
обратная к g. Положим р/==80+1 для /<^(е0) и p/ = g-1(t)
для i^g(%). Ясно, что Нт4-вР/ —0.
Пусть 34 = 32—бесконечномерное гильбертово пространство
с ортонормированным базисом glf |2, ... . Положим 7 = / и
B.9)
S
Таким образом, S—самосопряженный компактный оператор.
Далее, SE, = (*,?, при (=1, 2, ... .
Заметим, что /г* = 0, где n*=ind(S, /). Из соотношения E.4)
гл.2 следует, что /C1 = S2, а собственные числа оператора /С?
удовлетворяют равенствам ^ = 1^, i=l, 2, ... .
Пусть m=smC?Uf S, I, г). Это означает, что существует
информационный оператор ЭТ0, такой что card (9lo)=m и г (9?0, S, Г)<е.
Кроме того, r(9i, S, 7)>е для каждого ЭД с card (9Z) < т.
В силу теорем 5.3 гл. 2 и 4.2 гл. 3,
Таким образом, m+l>g(eu)+l и &m+1 = g~l (m+\) <г, откуда
w>g(8)-—1- Далее, для ЭД — Э^х, определенного формулой E.7)
106 Ч. Л, гл. 5. Сложность в линейном случае
гл.2, имеем card ER^-i)<m и r(9^_i, S, /) = pw> e. Отсюда
следует, что m^g(e), чем доказано B.7).
Пусть ez. = p/+1 для t>g(e0). Тогда 8;€@, е0] и lim/8/ = 0.
Так как г (91, S, /) = р.+1 = е„ то m (Ч^, S,/, e)^t+I =g (е,).
Тем самым доказано и B.8). |
Теорема 2.1 утверждает, что т QPUt S, 71, е) может быть по
существу произвольной функцией от е. Из этой теоремы можно
вывести, что и comp^F^, 5, Т, е) может произвольным образом
зависеть от е. Чтобы доказать это, предположим для простоты,
что сложность вычисления любого линейного функционала Lt
фиксирована, comp (L)
Теорема 2.2. Для каждой функции g указанного выше вида
(см. B.6)) существует линейная задача (S, Т), для которой
B.10) g(e) (Cl + l)-Cl-2 < comp QPU9 5, 7\ в) <
, 80). |
Доказательство. Рассмотрим задачу E, Г), определенную
в доказательстве теоремы 2.1. Для нее е-кардинальность
/n = mDr6r, S, Т, е) удовлетворяет наравенствам B.7), а
информационная сложность оператора $1, такого что card ($l) = m,
г(Щу S, Т) < е, удовлетворяет неравенствам
B.11) (g(e)-l)q< comp^)==m(^, S, Г, е)
Задача (S, Т) определена в гильбертовом пространстве, поэтому
теорема 4.2 гл. 3 гарантирует существование линейного опти"
мального по точности алгоритма ф с е (ф) = г (Щ, S, Т) < е. По
лемме 2.2 имеем
B.12) т—1+comp (91) <compOF^S, 7\ е)<2т—1+сотр(?г),
Из B.11) и B.12) вытекает B.10).!
Теорема 2.2 утверждает, что comp (Ч^, 5, Г, е)
приблизительно так же зависит от 8, как и е-кардинальность m (Ч^, S, Т, г).
Заметим, что функция g может при стремлении 8 к нулю
стремиться к бесконечности сколь угодно быстро. Тем самым
установлено
Следствие 2.1. (i) Существуют линейные задачи сколь угодно
большой сложности.
(п) Множество значений функции сложности не имеет
пробелов. |
Таким образом, положение дел здесь резко отличается от
положения дел в теории рекурсивно вычислимых функций, где
пробелы сложности, как известно, имеются (Бородин [72]).
L Введение 107
Замечание 2,2. Мы предполагали, что оператор Ш образован
из линейных функционалов, вычисляемых независимо, а потому
сотр (Щ) = tiCf. Для некоторых информационных операторов
значение 91 if) можно вычислить быстрее, чем за псг элементарных
шагов. Например, предположим, что L,- (/) = / (х() (xit i— I, ..., /г,—
попарно различные точки), где f—многочлен степени п—1.
Тогда сложность Lt есть О(п), но Ш([) можно вычислить за
О (п log2 n) элементарных шагов. На самом деле теорема 2.2
остается справедливой при более слабом предположении, что
сотр EГС(/)) = (о (я), где со—возрастающая функция от п
с limrt»ooco(n) + I
Глава 6
ПРИЛОЖЕНИЯ
К ЛИНЕЙНЫМ ЗАДАЧАМ
1. ВВЕДЕНИЕ
Развитая в гл. 1—5 теория применяется в этой главе к
разнообразным линейным задачам. В последующих параграфах мы
будем иметь дело с линейными функционалами, интерполяцией,
интегрированием, аппроксимацией, а также линейными
дифференциальными уравнениями с частными производными
параболического, гиперболического и эллиптического типа. При этом будут
использоваться различые функциональные пространства. Мы
решили упорядочить приводимые результаты по степени сложности
используемого математического аппарата. Иногда в наших
построениях используются результаты других авторов. Эти результаты
формулируются в нашей терминологии.
Некоторые из устанавливаемых в этой главе результатов
противоречат интуиции. Дадим два примера.
1. В п. 4 (п) будет показано, что в задаче интегрирования,
определенной на классе периодических гладких функций,
алгоритм прямоугольников оптимален по точности. В то же время
порядок точности этого алгоритма1} равен нулю.
Это—иллюстрация того факта, что порядок точности никак не связан с
оптимальностью квадратурных формул.
2. Будет показано, что для линейных параболических и
эллиптических уравнений, изучаемых в пп. 6(и) и 6(Hi),
увеличение стоимости, связанное с тем, что используется не оптималь-
1> То есть максимальная степень многочленов, на которых этот алгоритм
точен.— Прим. ред.
108 Ч. Л, гл. в. Приложения к линейным задачам
ная информация, а информация, обычно принятая в
вычислительной практике, может быть сколь угодно большим.
Появление представленных здесь результатов стало
возможным как благодаря общей теории, развитой в гл. 1—5, так и
благодаря математическим результатам, полученным за последние
десятилетия в конкретных прикладных областях. Мы полагаем,
что это лишь начало большой работы по изучению оптимальных
алгоритмов для различных прикладных задач. Вот некоторые
из направлений, развития которых мы ожидаем в ближайшем
будущем:
1. Анализ исследованных здесь задач для других норм и
других классов элементов задачи. Большинство результатов
решающим образом зависит от используемой конкретной нормы
и от выбранного класса элементов задачи; изменение того или
другого может потребовать проведения нового анализа.
2. Решение некоторых из задач, поставленных ниже в § 7.
3. Анализ «более трудных» областей приложений.
4. Полный анализ оптимальных алгоритмов для важных
приложений. Полный анализ должен включать изучение сложности
по времени, сложности по емкости, устойчивости и т. д. Здесь
мы ограничимся изучением сложности по времени.
Введем обозначения, которые будут постоянно использоваться
в этой главе. Пусть X—некоторый интервал вещественной оси
R и Lp = Lp(X)—пространство функций /, для которых конечна
величина
(рб[Ь +«>]). Через q мы обозначим сопряженный с р
показатель, определяемый из условия
A.2)
Для неотрицательного целого г положим
A.3) W'p{X)-{f: /<'-» абс. непр., р>€М-
Мы будем часто иметь дело с линейным оператором T~Drp:
Wrp (X) —¦ Lp> задаваемым формулой
A.4) 77-DJ/-/W.
Далее, введем пространство Wrp по формуле
A.5) W'p-{f: /6
2. Линейные функционалы 109
Мы будем также рассматривать пространства периодических
функций. Для X = [а,Ь] положим
A.6) Wrp(X) = {f: f периодична на R с периодом Ъ—а и
Через T = Drp: Wrp(X) —+ Lp обозначим линейный оператор,
действующий по правилу
A.7) Т/-?>?/«/">.
Аналогично
Через С — С(Х) мы обозначаем пространство непрерывных функ~
ций с нормой ||/]| = sup{|/@|: t?X\, а через
С=*С(Х)—пространство периодических непрерывных функций с той же нормой.
Через [~л;~] обозначается наименьшее целое п, такое что
х^п, а через L^J—наибольшее целое п, такое что п^х.
Будем использовать также символ в, введенный Кнутом [76].
Именно, 0(/(е)) обозначает совокупность всех функций g(e),
для которых существуют такие положительные константы сг, с2
и е0, что
cj(е) <g(e)<cj(г) при е€@, е0]. .
Для полноты напомним также смысл стандартных символов О
и о. Под О(/(е)) понимается совокупность всех функций g(e),
для которых существуют такие положительные константы с
и е0, что .
|?(е)|<с/(е) при е?@, е0];
а под о (/(е))—совокупность всех функций g(e), для которых
8-* « f (8)
2. ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ
В этом параграфе мы будем заниматься задачей аппроксима*
ции линейного функционала
B.1) S: Wp[-l, 1]-*R.
Положим T = Drp и 34 = Lp[—1, 1]. При этом
B.2) Зо-И7?.
Рассматривается информационный оператор вида
B.3) ?{л (/) = [/ (*i). .-1 /(frl) W. • • • Л W. • •
ПО Ч. Aj гл. 6. Приложения к линейным задачам
где п = А1 + А2+ ... +^ + s, a xi9x29...9xs—попарно
различные точки из [—1, 1]. Для простоты будем предполагать в этом
параграфе, что
B.4) л<г.
Случай п ^ г будет рассмотрен для нескольких операторов
решения в последующих параграфах.
Мы построим для этой задачи линейный центральный почти
оптимальный по сложности алгоритм. Пусть
Wj—интерполяционный многочлен Эрмита степени не выше п—1, такой что
B.5) dl.(wj)={0 0,1,0 0]', /=1,2,..., п.
Заметим, что Drpw,=*(}, так как п—1 < т. Определим алгоритм q>
формулой
B.6) Ф(Шп(/))= 2 2 /<*> (*,)Swko+... +*
где /@) (*/)"*/(*/) и &0==0. В силу леммы 2.1 гл. 3,
ф—линейный центральный интерполяционный алгоритм и
B.7) е (Ф) - г (Яя, 5, Dp) - \d (ЭТЛ, 5, Dy -
Конкретизируем алгоритм ф для некоторых линейных
функционалов S.
(I) Интерполяция: 5/=/(лг0), аг0 € [—1» Ц
Если х0 совпадает с одной из точек xux29...9xst то
г(Щп, S, Drp) = 0 и ф(9]л(/))*=/(х0). Исключим этот случай из
рассмотрения, предположив, что х0Фх(, t=l,2, ...,s.
Итак, мы аппроксимируем f(x0), зная значения функции f
и, возможно, ее производных в s попарно различных точках,
отличных от х0.
Если п < г, то положим Л (а:) ===== XI ?= i (*—xi)ki+1 • Тогда
eft € ker 9?я П Wrp для произвольного вещественного с. Отсюда и
из B.7) вытекает, что
B.8) г(91я9 5, DJ)-+oo V/i<r.
Если лг== г, то любая функция h из кег!>ЯлпИ% имеет вид
h(x)=g(x)\lui(x—xi)ki+\ где g(*) = ft(*, xlf ..., xlf ..., jc#f
..., xs) есть п-я разделенная разность для ft. При р = + °° имеем
IIgII* < I//*!, откуда
B.9) r(§Rn S, «.)= П Ix.-xJ^Vrl.
i
2. Линейные функционалы 111
При s—1 и прои вольном р имеем
и, в силу неравенства Гёльдера,
B.10)
где l/p + l/q= 1. Так как B.10)—точное неравенство и ||Л(Г)||^^ 1,
то мы получаем
B.11) r@ln S, DQ =
Заметим, что B.9) и B.11) совпадают при s=l и р= + оо.
При s=l алгоритм ф, определенный равенством B.6),
принимает простой вид. А именно, w/(x)^(x—x1)/'1/(j — l)\ и
г- 1
B.12) 9W/)) = ?
это—интерполяционная формула Тэйлора. По поводу алгоритма
B.12) см. статью Боянова [75], где, в частности,
устанавливается его оптимальность.
Проанализируем сложность этой задачи при s=l. Чтобы
можно было найти е-аппроксимацию для /(х0) при каждом
f?Wrp, нужно обеспечить, чтобы
г (Шп S, Drp) < е.
В силу B.11), это выполняется при фиксированном г для л;*,
достаточно близких к х0, или при фиксированном хх для
больших г. Точнее, нам нужно обеспечить, чтобы
df
B.13) |^-хв|<л(в) = (е(г-1)
или
B.14)
8Ar) = \og(r-l)l+±log((r-l)q+\) + (r-^
Заметим, что ^г2 (/-) = г log r(l+o(l)) при больших г и поэтому
B.14) имеет решение при любых xQt xx и е.
Если B.13) или B.14) выполняется, то, учитывая линейность
оптимального по точности алгоритма B.12), мы заключаем на
основании соотношения B.2) гл. 5, что е-сложность задачи ин-
112 Ч. А, гл. 6. Приложения к линейным задачам
терполяции E, Dp) при использовании $1Г (кратко, е-сложность
(S, Drp) при Шг) задается формулой
comp(9?r, S, D'P9 e) = F1+a)r —1,
где с1—сложность вычисления линейного функционала вида
Pta), / = 0, 1, ..., г —1, а а? [1, 2]. Из леммы 2.1 гл. 5
вытекает, что алгоритм B.12) также почти оптимален по сложности
для E, Drp) при Щг.
Подытожим эти результаты в виде следующей теоремы.
Теорема 2.1. Рассмотрим задачу интерполяции для xS0 = Wp
и Ып, определенного формулой B.3).
(i) Справедливы равенства
1+ оо для п < г,
\Xi-xA'-XipHkr-\W(r-l)9+\)
для s=l, l/q + l/p = l,
г(Жп S, ОЦ=\1\х9-х№+Чг\.
(ii) При «==г и s=l интерполяционная 4°РмУла Тэйлора
B.12) задает линейный центральный интерполяционный почти
оптимальный по сложности алгоритм для E, Drp) при 9?г, е(<р)=
=г(9|г, S, ОД.
(iii) Для возможности нахождения е-аппроксимации при
п = г и s=l нужно обеспечить, чтобы
I *i—^о I < gi (е) или g2 (г) > log I/e,
где ^ определены в B.13) и B.14).
(iv) В случае если выполняется (iii), е-сложность (S, Drp) при
9?л для п = г и s=l выражается формулой
comp(9?r, 5, ОД = (
Мы показали, что интерполяционная формула Тэйлора задает
оптимальный по точности на Wp алгоритм при любых г и р.
Интересно отметить, что этот алгоритм не является
оптимальным по точности для множества 90 аналитических функций на
единичном круге, ограниченных по модулю единицей. Для
такого 30 Осипенко [72, 76] доказал, что при ^ = 0 и
вещественном я0 единственный линейный оптимальный по точности
алгоритм имеет вид
я1
1= 0
а е(ф) = г(ЭТл, D, 1) = \хо\п\ доказательство основано на
обобщении теоремы Смоляка на комплексный случай.
2. Линейные функционалы 113
Задача интерполяции с информационным оператором
при произвольных г и s рассматривалось Боя новым [75] для
30=Г? и Форстом [77] для 30 = №'«>.
(ii) Дифференцирование: S/=/' @)
Предположим, что &,==(), а я—нечетное число, n = 2k-\-l.
Положим #2, = ihy / = 0, 1, ..., k% и x?/-elsa —ihy i= 1, ..., ky где
параметр ft?@, 1/?) Это значит, что мы рассматриваем
информационный оператор
B.15) 8U/)-I/@)f /(-Л), /W, ..., /(-*fc), Д*к)]1.
Для заданного h мы хотим аппроксимировать f @), зная
значение функции в точках /ft при / = 0, ± 1, ..., ±k. Заметим, что
анализ погрешности округления показывает, что ft не должно
быть слишком малым.
Определим многочлен w формулой
Ясно, что w?ker$ln. Если п < г, то w принадлежит также
Wrp, так как до(г) = 0. Тогда сшёкег9?пП^ для произвольного
вещественного с. Поскольку сш' @) = с (— 1 )* (klJh2ft стремится
к бесконечности вместе с с( — 1)*, отсюда следует, что
B.16) г@1Я, S, 1У„)~+оо V«<r.
Для п = г положим
<2-17) g/W-fr-ffi(/»)' /-0. ±1 ±*.
Ясно, что
Поскольку gi(ih) = bi/9 то, как легко показать, многочлены
^определенные соотношением B.5), можно теперь записать в виде
Алгоритм B.6) принимает вид
B.19) ^
114 Ч. А, гл. 6. Приложения к линейным задачам
Этот линейный центральный интерполяционный алгоритм
представляет собой широко известную формулу численного
дифференцирования. Заметим, что ср не использует значения /@).
Найдем погрешность алгоритма ф при р= +оо. Поскольку
f(x)—2/~kf(jh)gf {x) = g(x)w(x), где g(x) есть r-я
нормированная разделенная разность функции /, и \g{x) | ^ 1/г1, то
Отсюда
B.20) е(Ф) = г(Яг> 5, DL) = ^
Вершульц в работе [77 Ь] рассматривает зависимость е (ф) от
ft. Он говорит, что ф имеет порядок точности р, если е(<р) = в(А*).
Наше соотношение B.20) согласуется с его результатом,
гласящим, что порядок точности каждого алгоритма, использующего
информацию $1Г, задаваемую формулой B.15), не превосходит
г—1.
Проанализируем сложность этой задачи. Чтобы обеспечить
возможность отыскания е-аппроксимации для /'@) при каждом
f^Wn, потребуем, чтобы
B.21) A^1(L/'/2J!J/H<8.
При фиксированных ft, в это определяет г. Заметим, что h
можно выбрать настолько малым, насколько позволяет требование
обеспечения хорошего округления. Если B.21) выполняется, то
сложность алгоритма B.19) выражается формулой
сотр (ф) = сЛг + (Зг —5)/2,
где сх—сложность вычисления одного значения функции. Отсюда
заключаем, что е-сложность (S, D^) при $1Г выражается
формулой
где а?[1> 1.5]. Это также показывает, что алгоритм B.19)лочти
оптимален по сложности для (S, DJ») при $1Г.
Подытожим эти результаты в виде следующей теоремы.
Теорема 2.2. Рассмотрим задачу дифференцирования для
30 = Ц7р и $1п, определенного формулой B.15).
(i) Справедливы равенства
r($ln, S, D?)=+oo для п<г,
г ER,, S, DrJ) = ft'-1 (L r 12 J l)Vr\ для нечетных г.
(ii) В случае когда г нечетно и п = г, r-я центральная
разностная формула ф, определенная в B.19), задает линейный
2. Линейные функционалы 115
центральный интерполяционный почти оптимальный по
сложности алгоритм для (S, ?>«) при 97Г, причем
е(<р) = г(Жг, S. Drp).
(iii) Чтобы иметь возможность найти 8-аппроксимацию при
нечетном /*, п = г и р = + оо, нужно обеспечить, чтобы
(iv) В случае если выполнено условие, указанное в (iii), e-
сложность E, Drp) при $1п для нечетного г, я = г и р==*+оо
выражается формулой
compERr, S, Я'л, е) = (с1 + а)г —1. |
Задача дифференцирования изучалась целым рядом авторов.
Некоторые результаты, связанные с нашим подходом, можно
найти в работах Арестова [67, 69], Миккелли [76], Паллашке
[76], Секреста [65 а], Стечкина [67] и Тайкова [68].
+ i
(iii) Интегрирование: S/=J ?(x)f(x)dx
-i
Рассмотрим задачу интегрирования
B.22) S/=J t{x)f{x)dx,
где ?—весовая функция и f?Wrp. Пусть информационный
оператор задается формулой
B.23) 8ie(/)=¦[/(*). f(x2), ..., f{xn)\\
где ^—попарно различные точки из отрезка [—1, 1]. Алгоритм
B.6) принимает в этом случае следующий вид:
+1
B.24) Ф (Яя (/)) - Ц / (х,) С С М П (*-*/)/ II (ДР, -
На основании леммы 2.2 гл. 3 мы заключаем, что если е (ф) < + «>,
то ф имеет порядок точности г—1, т. е. ф (ЭТЛ (/)) = $-i С (jc)/(jc)Лс,
если /—многочлен степени не выше г—1.
В силу B.7),
B.25) *(<р)=.г(9!я, S, D;) = sup|S l{x)h{x)dx\ ft€
116 Ч. А, гл. 6. Приложения к линейным задачам
Предположим, что п<г/2. Тогда h(x) = c JI?=i (x—х(J
принадлежит кег 91п П кег Drp для каждого с, откуда
r(%, S, D?)=+oo Vn<r/2.
Примем поэтому, что п^г/2. Мы хотим выяснить, когда
величина г(9{„, 5, Drp) конечна. Она конечна при гс = /\ Рассмотрим
случай я<г —1. Положим
B.26) 4i (х) = П (х-Х/), I = 0, 1, .. м я,
и введем скалярное произведение
+ i
B.27) (/, 8)ши lt(x)f(x)g(x)dx, f,gSW'p[-l9 1].
Докажем, что
B.28) г(Шп, S, О,0< + оофф(?й, 9/) = 0, f = 0, 1,..., r-1-л.
Действительно, допустим, что г (Шп, S, D^) < +oo. Тогда, по
теореме 3.1 гл. 2, кег ЩЛП кег Dicker 5. Заметим, что qnqi?
&kerЩп(]\<етDrp при t = 0, I, ..., г—I—п. Поэтому
J -1 ? (*) 9n W 9/ W ^ ¦¦ (?«» ?/)а °t чем доказана импликация
«=$>» в B.28). Обратно, пусть (qnt ^) = 0, /==0, 1, ..., r—1—n.
Тогда ker9?nnkerD? = !in(<7n<7o, ^9l, ..., ^^.JckerS. Из
леммы 4.2 гл. 2 при 92 = ЭТИ и соотношения B.7) вытекает, что
r(9ln,S, ^)«p1D
Так как оператор SDj' непрерывен, то величина г(ШПУ S, DJ)
конечна, чем и завершается доказательство соотношения B.28).
Если р= 4- °°, то
B.29) г ф„ S. Dy $
В самом деле, если Л € кег $1п П И^р, то
coqn {x) ft W+.. • +c,-t.rfn (x) qr-i-n
где c{ = h(xu ..., хя, atj, . •., ^/+l)—это (я + г>я разделенная
разность функции ft, t = 0, 1, ..., г—п—1, и
2. Линейные функционалы
117
Поскольку (qn, q() = 0 для * = 0, 1, . ..,г— 1— п и fcr-iilL < 1/Н,
получаем
С (х) Л (х) dx
С М с,.я М <7* (*) Яг-п М ^
-1
Этим доказано B.29).
Теперь можно задаться вопросом о том, как определить точки
вычисления значений функции /, чтобы минимизировать
погрешность алгоритма B.24). Это эквивалентно минимизации B.29),
т.е. отысканию точек хи х2, ..•, хп, минимизирующих
функционал
B.30)
-1
i= 1
11 \х xi
dx.
Заметим, что при л = г/2 решением задачи B.30) служат нули
ортогонального многочлена n-й степени, отвечающего весу ?.
Алгоритм B.24) сводится тогда к квадратурной формуле Гаусса,
порядок точности которой равен 2п—1.
Например, если g (а:)
—л:2, то
B.31)
— нули многочлена Чебышёва первого рода; алгоритм
известен как квадратурная формула Гаусса—Чебышёва, а
B.32) е (Ф)» г (91Я, S, D?) = 2я/D« BпI).
Проанализируем сложность этой задачи. Найти е-аппрокси-
мацию—значит обеспечить, чтобы г (91„, S, ?>?)< е. Это будет
выполняться только для я ^ г/2.
В силу линейности оптимального по точности алгоритма B.24),
е-сложность (S, D?) при 91Л выражается формулой
л, S, DJf *) = (
где л—наименьшее целое, для которого г{$1ю S, D^) < е, cf—
сложность вычисления одного значения функции, а?[1, 2].
Например, если г = 2я, /? =s -f-oo, J (д:) ^= l/l^l —х%, а ^ заданы
формулой B.31), то нужно обеспечить, чтобы 2л/Dл Bя)!} < е. Алго*
116 Ч. А, гл. 6. Приложения к линейным задачам
ритм B.24) является также почти оптимальным по сложности
для (S, Drp) при 9ta.
Подытожим эти результаты в виде следующей теоремы.
Теорема 2.3. Рассмотрим задачу интегрирования для 30=й^ и
ffint определенного формулой B.23).
(i) г(Яя, Sf D?) = +oo Vn<r/2.
(ii) гEЯл, S, DJX+oo при /г>г/2ффя = г или (qu% <7/) = 0,
t=0, 1, ..., г—1—/г, где qt определены в B.26).
A ii) Если « = /- или (qn, q() = 0 при i = 0, I, •.., г—1—п, то
г(Яя1 S, K) = )
(iv) При п = г/2 и /? = +оо радиус информации минимален,
если значения / вычисляются в точках, являющихся нулями
ортогонального многочлена я-й степени, отвечающего весу ?.
(v) Алгоритм ф, определенный формулой B.24), является
линейным центральным интерполяционным почти оптимальным
по сложности алгоритмом для (S, Drp) при Шп. Для я = г/2,
р = 4-оо и точек *i, ..., ^„, совпадающих с нулями
ортогонального многочлена n-й степени, алгоритм ф представляет собой
квадратурную формулу Гаусса.
(vi) Чтобы иметь возможность найти е-аппроксимацию, нужно
обеспечить, чтобы
B.33) г(Э1я> 5, DQ<b.
При п = г/2, р=+оо, ?(x)=l/Vl—х2 и точках*/, заданных
посредством B.31), неравенство B.33) принимает вид
2л/DпBп)\)<г.
(vii) 8-сложность задачи (S, Drp) при $1п выражается
формулой
сотр (91Л, S, Z)J, е) = (сг + а) п— 1,
где п—наименьшее целое, для которого выполнено B.33). |
3. ИНТЕРПОЛЯЦИЯ
В этом параграфе рассматривается задача интерполяции
C.1) sf~f(x.) v/e30
где /: X—*R (или С)—скалярная функция.
Ограничимся рассмотрением оптимальных по точности
алгоритмов, использующих информационный оператор
C.2) Я„0) 4
3. Интерполяция 119
где хг < х2 < ... < хп. Заметим, что card ($ln) = п. Если одна из
точек X; совпадает с х0У то г(Шп, 5) = 0. Исключим этот случай
из рассмотрения, предположив, что Х{Фх0, i=l, 2, ..., п.
Мы построим оптимальные по точности алгоритмы для класса
гладких функций W^ и для двух классов аналитических
функций. За одним исключением, все эти алгоритмы линейны и почти
оптимальны по сложности.
Задача интерполяции для различных классов элементов задачи
рассматривалась во многих работах. См., в частности: Барнхилл
и Уиксом [68], Бахвалов [72], Боянов [72], Боянов и Черного*
ров [77], Великий [77], Гаффни [76, 77а, Ь], Гаффни и Пауэлл
[76], Голомб [77], Коробов [63], Мейерз и Сард [50Ь], Мелк-
мэн [77], Осипенко [72, 76], Рихтер-Дин [76Ь], Секрест [65а],
Смоляк [60], Форст [77].
(i) Интерполяция для W^
Пусть З^ГЦ-1, 1] и *0€[—1, 1]. Пусть, далее, Г-Di,
а 34 = L^. Таким образом,
C.3) 30=:11^.
В силу B.8), при п<г имеем г(ЭД„, S, /}?,) —оо. Поэтому
предположим, что
C.4) п>/\
Эту задачу изучали Гаффни и Пауэлл [76] и Гаффни [76, 77а, Ь].
Они разработали некий алгоритм, который является
центральным (в нашей терминологии) и определяется следующим образом.
Пусть и и v—совершенные сплайны степени г с п—г узлами
г\; и g/ соответственно, *'=1, 2, ..., п—г, такие что
C.5) и (д)) =»»(*,) = /(*,), 1 = 1,2, ...,*,
а r-е производные функций и и v удовлетворяют соответственно
условиям
C.6) «<'>(*) = (—1)' при r\i<x<r\i+i, *- = 0, 1, ...гп—г,
где Tio = *i, а тЬ|-г+1в*«»
C.7) и<'>(*Н-(-1)' при g?<Jf<g/+f, ' —0, 1, ...,/i-r,
где go = *i, a g^^+i^^. При г=1 узлы п, и ^ задаются
формулами
I,
120 Ч. А, гл. 6. Приложения к линейным задачам
При г ^2 узлы x\t и ?,• можно получить, решая систему
нелинейных уравнений
j
(-1)у J
= (/--l)!/(*,, ..., xi+r)9
где /(л:/, ..., xi+r)—это г-я разделенная разность функции/,
а Мг, i—это В-сплайн, равный r-й разделенной разности функции
Mrfa У) = (У—xY+l> т< е- мп /М ~ёг(х> xi> •••» ^/+г)- Положим
C.8) /(xo) = min(«(A;v), у(д:0)), /(^^maxCw (*0), v(x0)).
Гаффни и Пауэлл [76] доказали, что
C.9)
причем оба неравенства точны. В наших обозначениях это
означает, что множество U (/) решений / (л:0) (где функции / таковы,
что 31 (/) = $1 (/)) задается формулой
Тогда алгоритм
C.10) Ф № (/)) - (/ (х0) + f(xo))/2 _ (« (х0) + v (xQ))/2
является центральным и интерполяционным. Кроме того,
локальная погрешность ф (см. замечание 2.2 гл. 1) равна
е(Ф, /) = rad U (/) = 11 и (xQ)-v (x0) |.
В общем случае алгоритм ф нелинеен, и для вычисления
значения ф требуется решить две нелинейные системы порядка
п—г. Для решения этих систем Гаффни [76] предложил
применять итерационный метод Ньютона, используя при этом
ленточную структуру матрицы Якоби.
По теореме Смоляка существует линейный оптимальный
алгоритм (не являющийся центральным). Этот алгоритм был также
найден Гаффни и Пауэллом [76]. Именно, пусть лГ < Лг < • • •
... < г\*п_Г9 х{ < vS < xi+n i = 1, 2, .. •, п—г, определены
условиями
C.11) "ЗЫК '/Х.|
/•о л*
3. Интерполяция 121
где л! = *1. а 4n-r+i = xn- Например, ц- = (*,+*/+1)/2 при г=1.
Заметим, что узлы г|,* не зависят от / и потому их можно
вычислить заранее.
После того как узлы ц* найдены, определим сплайн-функцию
at степени г — 1 с п — г узлами т]*, ..., ц^г так, чтобы
<*/(*/) = s//> t, /=1, 2, ..., /г.
Тогда
C.12) Ф(Я(Я)-Jjf (*,)*,(*•>
есть линейный оптимальный по точности алгоритм и
C.13)
где 9/i—совершенный сплайн степени г с п—г узлами rtf, ...,
т|*_г, удовлетворяющий условиям
Радиус информации зависит от точек х0, хг-, ..., ;ся. Имеем
C.15) г(91Л, S, Dy = |?п(хв)|< sup |?Л(х) | = ||^Ц..
1<< 1
Как показали Миккелли, Ривлин и Виноград [76], величина
ll<7/iL равна радиусу информации 9?п в задаче аппроксимации
в пространстве 32 = С[—1, 1] с 9O = 1F^. В частности, они
установили, что для равноотстоящих точек #/=--1+2(/—\)/п9
i=l, 2, ..., я, справедливо соотношение \\qn\\oo=s:®(n~r). В § 5
мы докажем, что для оптимально выбранных точек xt
где Кr—постоянная Фавара, определяемая следующим образом:
(зле) K,=4-i
Заметим, что /Со==1, /С, «л/2, /С2 = л2/8, /С3 = я3/24 и 1^=/С0<
< /С 2 <... < 4 /я <... < К а < К г = д/ 2.
Посмотрим, какова сложность этой задачи. Из C,15) следует,
что 8-сложность задачи интерполяции не превосходит е-слож-
ность соответствующей адачи аппроксимации. Возьмем в
качестве примера равноотстоящие точки Х;= —\ +2(i—1)/п. Чтобы
можно было найти е-аппроксимацию, нужно обеспечить, чтобы
122 Я. А, гл. 6. Приложения к линейным задачам _^__
Поскольку ||?п1 = в(п"г)> это выполняется для п = п(х0),
такого что
n = n(*0) = O(e-i/0.
Далее, существует точка xQt удовлетворяющая условию \qn(x0)\ =
HkJI и такая, что
Аг = п(л:о) = е(е-1/0.
В силу линейности оптимального по точности алгоритма C.12)
е-сложность (S, D^) при <$1п выражается формулой
Rn, S, D'TO, e)^(
где п—наименьшее целое, для которого \qn(x0)\ <&,
ct—сложность вычисления одного значения функции, а€[1, 2].
Алгоритм C.12) почти оптимален по сложности для E, Di) при $1п.
Подытожим эти результаты в виде следующей теоремы.
Теорема 3.1. Рассмотрим задачу интерполяции для 30 = №?> и
9?й, определенного формулой C.2).
(i) г (^„, 5, Di) = +оо при п < г и г (Шп, 5, D*») = | qn (л:0)) при
п^гу где q—совершенный сплайн, определенный в C.14).
(ii) Алгоритм ф, определенный в C.10), является
центральным и интерполяционным, ^(ф) = /'(ЭТп, 5, Dy.
(iii) Алгоритм ф, определенный в C.12), является линейным,
оптимальным по точности, почти оптимальным по сложности
алгоритмом для (S, Dy при 9ln, e(q>) = r($lni S, Dy.
(iv) Чтобы иметь возможность найти 8-аппроксимацию, нужно
обеспечить выполнение неравенства | qn (д;0) J < е, откуда следует,
что для, случая равноотстоящих точек х( = — 1 + 2 (i— 1)/п,
f«l, 2, ..., п,
n = n(x0) = 0(8-1/0.
(v) е-сложность задачи (S, Dy при Шп выражается формулой
comp@tn, S, D'n, г) = (сг+а)п — 1,
где м—наименьшее целое, для которого |?Л#0I < е-¦
(ii) Интерполяция для аналитических функций
Пусть 3i—класс аналитических функций /: G->C, где G —
некоторая односвязная область. Пусть, далее, Т =
/—тождественный оператор, а З^Зх оснащено нормой ||/|]=*sup{|/(z)|:
z?G\. Тогда
C.17) 30=*{/: / аналитична в G и ||/||<1}.
Рассмотрим информационный оператор
C.18) Я„(/)-[/(*i), f(xj, ..., f(xn)}
для попарно различных точек Xj из G.
3. Интерполяция 123
Эту задачу изучал Осипенко [76]. Приведем его результат
в нашей терминологии. Радиус информации равен
C.19) r(SRnfS, /) = sup{|ft(*0)|: Л(*у) = 0, /=1,2, ..., nt
1 h |)< l}.
п
По принципу максимума модуля h(z) = g(z) Д Wj(z)t где
g€30, a Wj—конформное отображение области G на единичный
круг, такое что Wj(Xj) = 0. Таким образом,
C.20) r(^,S,/) =
В указанной работе Осипенко [76] обобщает теорему Смоляка
на комплексный случай и, используя это обобщение, показывает,
что алгоритм
C.21) |
где
C.22)
линеен и оптимален по точности. Заметим, что
В качестве примера рассмотрим случай, когда
G—единичный круг: G — {z: |z|<l}. Тогда W/(z) = (z—x/)/(l—xJz) и
C.23) г (9С 5, /)-Ц
Если
C.24) *0=*0 и *,=
при 5€@, 1), /=1, 2, ..., п, i=*V— 1, то
г(91„, S, /)-С».
Проанализируем сложность этой задачи. Чтобы существовала
е-аппроксимация, нужно обеспечить, чтобы
C.25) П|ИМ*оI<е.
Если G—единичный круг и выполнено C.24), то из C.25)
следует, что ?" < е. При фиксированном ? это определяет п:
«=[>g(l/e)/log(i/?)J + l,
а при фиксированном п определяет ?:
124 Ч. А, гл. 6. Приложения к линейным аадднам
В силу линейности оптимального по точности алгоритма C.21),
е-сложность E, /) при $1п выражается формулой
сотр(9?„, 5, /, г) = {с1 + а)п—19
где п — наименьшее целое, для которого выполняется C.25),
сх—сложность вычисления одного значения функции, а ?[1,2].
Алгоритм C.21) почти оптимален по сложности для E, /) при 9?л.
Подытожим полученные результаты в виде следующей теоремы.
Теорема 3.2. Рассмотрим задачу интерполяции для 30 и Щп,
определенных формулами C.17) и C.18).
(i) r(9ln9 S, /)=Il7-il«M*o)|.
(ii) Алгоритм ф, определенный в C.21), является линейным
оптимальным по точности и почти оптимальным по сложности
алгоритмом для E, /) при 9?„, е (у) =* г (Шп, S, /).
(iii) Чтобы было возможно найти е-аппроксимацию, нужно
обеспечить выполнение неравенства H/=i \Wf- (xo)\ < е, которое
в случае единичного круга и точек C.24) означает, что ?" < г.
(iv) 8-сложность задачи (S, /) при использовании
информации Шп выражается формулой
сотр(Яя, S, /, e) = (cl + a)n — 1,
где п—наименьшее целое, для которого выполняется (iii). В
частности, если G—единичный круг, а ху, /=1, 2, ..., я,
определены соотношением C.24) при фиксированном ?, то
К„, S, /, 6)-(
(iii) Интерполяция для случая гильбертова пространства
с воспроизводящим ядром
Следуя Голомбу [77], рассмотрим в качестве Зх гильбертово
пространство комплекснозначных функций /: Х—>~С, обладающее
воспроизводящим ядром k: XxX—*С, т.е.
C.26) /(*) = (/,*(••*)) V/€3j Vx?Xf
где (•, •)—скалярное произведение в 3i. Пусть Г=/, 34 = ^i-
Тогда
C.27)" 30 = {/: ||/|
Рассмотрим информационный оператор
C.28) . *M/) = [/(*i)> /Ы ••
3. Интерполяция 125
для попарно различных точек х{ из X. Радиус информации
равен
г (97„, S, /) = sup
(Xj)=0 h(x.) = Q
Пусть сХо—сплайн (см. определение 3.1 гл. 4),
удовлетворяющий условиям
/Q опч г (у\ ] и г (у\ П / 1 9 п
(o.Zv) Сх0 \Х0)— 1 И СХо \Xj) — U, /— 1, Z, . .., п.
Это значит, что ||c*J^||g|| для любого g, удовлетворяющего тем
же условиям. Отсюда
/Q Г>Г)\ г /5O <? ]\ II Г И
Далее, рассмотрим функцию
п
с коэффициентами ау-, выбранными так, чтобы
Такая функция а всегда существует и единственна, поскольку
функции k( , xt)f ..., ^(-, д:Л) линейно независимы, а матрица
Грама (/^(лг/, xj)) не вырожденна. Покажем, что а—сплайн, т. е.
lla!^ll?ll Для любой функции g из Зх, удовлетворяющей C.32).
В самом деле, пусть h — g—а. Тогда h(Xj) = O, /=1, 2, ..., п,
и (ft, а) =2^.! fly (ft, k(-y Xj)), В силу C.26), (/г, &(•, л:у)) =
= А(Х/) = 0 и (А, а) = 0. Следовательно, функция а ортогональна
к ker& и
Этим доказано, что a—сплайн. Определим сплайновый алгоритм
формулой (см. § 4, гл. 4)
C.33) Ф ( (/)) @) S
Из теоремы 5.1 гл. 4 следует, что ф—центральный алгоритм и
Вслед за Голомбом [77] приведем такой пример. Пусть X =
= XR = {z: \z\<R}—открытый круг. Введем скалярное
произведение по формуле
/г ч 1
dXR
126 Ч. Л, гл. 6. Приложения к линейным задачам
И ПОЛОЖИМ
C.34) St^tf: f аналитична в XR и |]/(| = |/"G77
Ясно, что 3,—гильбертово пространство и ?, (z) = zJl RJ образуют
полную ортонормированную систему в 3$. Пусть
Тогда
и, таким образом, k—воспроизводящее ядро для З^. В работе
[77] Голомб дал в явном виде формулы для \сХй\ и сплайнового
алгоритма. Именно,
C.35, г т., s, '>"Ki-'-A,,X^
C.36) ф ERn </)) = Е / (*у) gk-W Д (^-^) '
Заметим, что при /? —* + оо мы получаем
lim Rnr$tn9StI)= П Uo~*/Ii
/? -> 00 / as 1
Нш ф №п (П) = 2 / (г,)
П
1ф\
Таким образом, алгоритм q> сходится к интерполяционной
формуле Лагранжа.
Из C.5) вытекает, что для точек
C.37) хо = О, ^ = ^««*//«, / = 1, 2, ..., п. i = V^\,
где ? € @> ^)» мы имеем
C.38) г(ЩпУ S, /) = (С/^)Я.
Проанализируем сложность этой задачи. Чтобы можно было
найти е-аппроксимацию, нужно обеспечить, чтобы
C.39) 1КГ<е. *
Если 3f задано соотношением C.34), a Xj—соотношением C.37),
то, в силу C.39), (?//?)п<е. Для фиксированного ? этим опре-
4. Интегрирование 127
деляется п:
n=l\og(l/e)/\og(R/?)J+l,
а для фиксированного п определяется ?:
I < R&1.
В силу линейности оптимального по точности алгоритма C.33),
е-сложность E, /) при $1п выражается формулой
сотр(9?й, S, /, г) = (
где п—наименьшее целое, для которого выполняется C.39),
сг—сложность вычисления одного значения функции, а?[1, 2].
Алгоритм C.33) почти оптимален по сложности для (S, /) при
Подытожим эти результаты в виде следующей теоремы.
Теорема 3.3. Рассмотрим задачу интерполяции для 30 и 9?п>
определенных формулами C.27) и C.28).
(i) r(9ln, S, /)==||^0[|', где сХо—сплайн, определенный в C.29).
(и) Алгоритм ф, определенный формулой C.33), является
линейным, центральным, сплайновым и почти оптимальным по
сложности алгоритмом для (S, /) при Шп, ?(<р) = г(91л, S, /).
(Hi) Чтобы возможно было найти е-аппроксимацию, нужно
обеспечить выполнение неравенства \\сХо Ц < е, которое для 3lf
заданного равенством C.34), и xJy заданных равенствами C.37),
означает, что (l/R)n < e.
(iv) е-сложность задачи (S, /) при использовании информации
ЭД„ выражается формулой
^„, S, /, г) = (
где п—наименьшее целое, для которого выполняется (И*). В
частности, для случая C.34), C.37) при фиксированном ? имеем
^, S, /, 8) = (
4. ИНТЕГРИРОВАНИЕ
В этом параграфе мы рассмотрим задачу интегрирования:
ь
D.1) Sf =
где /: [a, b]-+R—скалярная функция. В пп. (i) и (iii)
предполагается, что [а, 6] = [0, 1], а в п. (И)—что [а, Ь] = [0, 2л].
Пусть Ч^—класс всех информационных операторов Шп вида
D.2) ЗД = [/(*1)
128 Ч. А, гл. 6. Приложения к линейным задачам
для попарно различных точек х( из [а, Ь], хх < лг2<... < хт.
Мы ищем точки xi} минимизирующие радиус информации. Точнее,
рассмотрим n-й минимальный радиус информации для задачи
интегрирования в классе Щ (или просто /г-й минимальный радиус)
D.3) г (Yfc, 5, 30) = inf г(ЭТя, S).
Информационный оператор 9?л называется n-й оптимальной
информацией в Щ9 если
㹄 S) = r№, S, So).
В случае когда 30 = {f: |)Г/|]^1}, где Т—некоторый линейный
оператор ограничений, мы будем иногда писать г D% 5, Т)
вместо г(Щ, S, 30). Заметим, что
r(Y>, S, 30)<rft S, 30).
Как было показано в § 3 гл. 3, задача определения п-го
минимального радиуса и n-го оптимального информационного
оператора эквивалентна задаче Сарда для 3„ = Wr2 и задаче
Никольского для некоторого выпуклого уравновешенного 30.
В данном параграфе мы найдем n-й минимальный радиус и
/г-й оптимальный информационный оператор для класса 30 = Н??
с четным г, предполагая, что ? = г — 1 или ? = /-—2, а также
для класса 30 = №«, предполагая, что ? = 0- Далее, мы выясним
асимптотическое поведение /г-го минимального радиуса для 30 = W[
и произвольного ?. Будет также показано, что n-й минимальный
радиус взаимосвязан с п-поперечником по Гель^анду для
соответствующей задачи аппроксимации.
Задачей интегрирования занимались очень многие авторы.
Приведем далеко не полный список работ, в которых задача
интегрирования для скалярного и векторного случаев изучалась
с близкой к нашей точки зрения: Аксень и Турецкий [66], Ал-
химова [72], Бабенко [76], Бабушка [68 а, Ь], Барнхилл [67, 68],
Барнхилл и Уиксом [67], Баррар, Лоуб и Вернер [74],
Бахвалов [59, 61, 62Ь, 63, 64, 67, 70, 72]. Боянов [73, 74, 76], Бу-
сарова [73], Гайсарян [69], Джеттер [76], Л. Джонсон и Рисе
[71], Женсыкбаев [76—78], Жилейкин и Кукаркин [78],
Ибрагимов и Алиев [65], Иванов [72Ь], Карлин [69, 71], Каутски [70],
Кист [73], Кифер [57], Коман [72], Коман и Микула [71],
Корнейчук [68, 74], Корнейчук и Лушпай [69], Коробов [63],
Крылов [67], Ларкин [70], М. И. Левин и Гиршович [77], М. И.
Левин, Гиршович и Арро [76], Ли [77], Лигун [76], Липоу [73],
Лоуб и Вернер [74], Лушпай [66, 68, 74], Маунг Чжо Ньюн и
Шарыгин [71], Мейерз и Сард [50а], Моторный [73, 74, 76],
Мэнсфилд [71, 72]; Никольский [50, 58], Паллашке [76], Паулик
[77], Пинкус [75], Рихтер [70], Рихтер-Дин [71а], Сард [49, 63],
4. Интегрирование 129
Секрест [64, 65b], Смоляк [60], Соболев [65, 74], Соболь [69],
Стенгер [78], Стеттер [69], Стёрн [67], Сухарев [78Ь], Тихонов
и Гайсарян [69], Уилф [64], Форст [75], Хэйбер [71],
Чавла и Кауль [73], Ченцов [61], Шайдаева [59], Шарыгин
[63, 77], Шёнберг [64Ь, 65, 66, 69, 70], Шмайсер [72], Экхардт
[68], Элхей [69].
(i) Интегрирование функций из W?
Рассматривается задача интегрирования вида Sf = j0/(x)dx.
Пусть S^WtfO, 1]. Возьмем T/=DJ/ = fr) с 34 = Lr Таким
образом,
Пусть
9U/)=*[/(*i) f(t>(Xi) f(xj, ...,Г*)(хт)Т,п~т&+\),
для /?30. Чтобы гарантировать существование ^(х/),
предположим, что ?г^г — 1. По лемме 3.1 гл. 3 имеем
г(Ш„, S, Drp) \[
,ПЩ\.
Из результатов гл. 2 (теоремы 3.1 и леммы 4.2) следует, что
D.4) г(Шп, S, DJ)< + оо <*ker Sinker Dickers.
Пусть
с—*,-)t / =su, l, ..., т.
Докажем, что если ? нечетно, то
D.5) г (ЭТЯ, S, /)?)<+ оо » л > г,
а если четно, то
D.6) r($tn, 5, Drp)<+oo&n + m^r и
), / — О, 1, ..., г — 1 —п.
В самом деле, пусть ? нечетно. Тогда q?ker$ln и $
Так как q?kerDrp тогда и только тогда, когда п < г, то D.5)
выполнено. Предположим теперь, что ? четно и г(ЭТл, S, DJ,)<
< + оо. Заметим, что ^?кег??„ ПРИ i==0, Ь •••» т- Если
n+i<r9 то qqtZkerD'p и из D.4)следует, что^?
5 №664
130 Ч. А, гл. в. Приложения к линейным задачам
Поскольку qqm^kevSt то /г + /п>г. Этим D.6) в одну сторону
доказано.
Предположим, наконец, что п + т Z^r и qqt ? ker St i = 0, 1,...
..., r—1 —/i. Тогда каждое h ? kerШп П ker Drp можно
представить в виде
ft (x) = coqn (x) go(x)+... +cr^^nqn (x) qr^n (x),
и }oh(x)dx~ Sh^C/Jo?!!(xLt(x)dx=Q, чем показано, что /i?
€ker5. В силу D.4), отсюда вытекает конечность г(97п, S, Drp).
Тем самым D.6) доказано полностью.
Начиная с этого места будем предполагать, что г (Шп, S, Drp) <
< + оо. По теореме Смоляка (§ 3 гл. 3) существует линейный
оптимальный по точности алгоритм ср, использующий $1п:
т I
D.7) Ф <«.(/)) =2 2] rh(XiLi,k> е(ф)-г (91,, S, DJ).
?= 1 6 = 0
Заметим, что в случае р = 2 алгоритм ф является сплайновым,
а кроме того центральным и интерполяционным (см. теорему 5.1
гл. 4). В этом случае ф (Шп (/)) = ^ а ($1п (/), х) dx, где а =5
»= а(9?я(/),•)—натуральный сплайн степени 2г — 1 с узлами
хи ..., хт кратности 1+ 1 (см. также Шёнберг [64Ь]). Как было
упомянуто в § 3 гл. 3, алгоритм ф оптимален также и в смысле
Сарда.
Вернемся к общему случаю р€[1> + °°]- Из леммы 2.2 гл. 3
вытекает, что
D.8)
т.е. алгоритм ф точен на многочленах степени не выше г—1,
Известно (см. Корнейчук [74, с. 139—165]), что
1 1
/ @ dt -Ф (91, </)) « Ь^ j Gr @ /«r> @ Л,
J
где
D.9) G,@- ('-^-(-IV
Далее,
D.10) *(ф)-г(Яв, S,
где 1/9+ l/p= 1.
Заметим, что Gr есть сплайн-функция, принадлежащая
классу Л?(х), x==(^i, ^2, ..., хт)} определяемому следующим обра-
4. Интегрирование 131
зом. Принадлежность функции qp: [0, 1] —> R классу А\{\)
означает, что
trf 0<*<*lf
Ф (/) = <( tr-^ak%it\ xk<t^xk+1, й=1, 2, ...,m-l,
кроме того, при ? = r — 2 функция ср должна быть непрерывна
на [0, 1], а при ? < г — 2 должна иметь непрерывные
производные до порядка г — ?— 2 включительно.
Коэффициенты qi%k определенного формулой D.7)
оптимального по точности алгоритма обладают свойством
DЛ1) ||GJa= inf
т. е. Gr—сплайн, обладающий минимальной L^-нормой по
сравнению со всеми другими сплайнами класса А\(х).
Мы ищем узлы х19 х2У ..., хт, минимизирующие радиус
информации, т. е. хотим найти
D.12) rOFiS.Da- inf r(9ln,S,Drp)
и оптимальный информационный оператор -Щ в TJ:
D.13) r(S«,S,D5)-rOPJifSfDJ).
В силу линейности оптимального по точности алгоритма, а
также равенств D.10) и D.11), имеем
D.14) г(?Ъ 5, D?) = inf inf
По существу, точки /г-й оптимальной информации являются
узлами сплайна минимальной ?а-нормы, а /г-й минимальный
радиус информации равен норме этого сплайна.
Задача отыскания оптимальных в W& информационных
операторов решена не для всех значений ? (^^—1) и п. Следуя
Корнейчуку [74], дадим решение этой задачи для ? = /• — 1 и для
? = г — 2 при четном г.
Пусть
D.15) /?г.,(*) = *г-Г2Мг
— многочлен с минимальной La[—1, 1]-нормой, т. е,
1/<7
/+1 \1
5»
132 Ч. Ау гл. 6. Приложения к линейным задачам
Положим
D.16) ft = B(m— l) + 2[/?ftff(l)]1/')"\
D.17) x* = hB(i— l) + [Rr9q(l)]1/r), * = 1, 2, ...,m,
D.18) qlik=*(— l)tym,ft = A*+1{?^^
Л-0, 1, ...,
t = 2, 3, ..., m—1, * = 0, 1, ..., l(r —
D.20) gf#rt+. =0, t = 2, 3, ..., m—1, 6 = 0, 1, ..., L('—
Тогда для ? = r—1 или для ? = r—2 при четном г
информационный оператор
Y±.4l) viJi {/) — [/ (#ij, . . ., /Vb; \Xij9 • • • > I \Xm)> • • • > / i-*WJ
является единственной п-й оптимальной информацией в Щ,
алгоритм
D.22) Ф СИЯ (D) — S
1=1 Л =
линеен и оптимален по точности, а
D.23) *(ф)-п
Результаты D.21). и D.22) были, в сущности, установлены
Ибрагимовым и Алиевым [65] для /7=1, 2 или +оо. Аксенем и
Турецким [66] для любого р и ? = г—2 при четном г, Лушпаем
[66] для ? = г—1 и переоткрыты Каутски [70].
Для некоторых специальных значений р формулы D.15)—D.23)
упрощаются.
Для /7=1 (<7=+оо) многочлен Rr% to(a:) = cos (r arccosx)^7""*
есть нормированный многочлен Чебышёва первого рода и
D.24) ^.ооО)
D.25) ,(Ч. S, DO-
4. Интегрирование 133
Для p = q — 2 многочлен Rrt 2 является многочленом Лежандра:.
D.26)
/t = [2(/n-
D.27)
Для р= +оо (д = 1) многочлен #r$ x (x)=2";'sin((r+ l)arccosjc)/
/j/l—л:2 есть нормированный многочлен Чебышёва второго рода и
DЛ)
Хотя в общем случае мы и не знаем точного значения г (
S, DC), можно показать, что для любых фиксированных ?, г
(С<г-1) ир
D.30) rCPiS,DS) = e(n-')
при п, стремящемся к бесконечности. Докажем это. Пусть
9U/) = [/(*i)> ..'.^«(Xi), ..'JW, ...^Ч^-)?. « =
принадлежит классу *Р?. Положим
где n1 = r/n = m/(?+l). Ясно, что кегЙЯ1 сker 9tw; отсюда, в силу
замечания 3.1 гл. 2, вытекает, что г(91Я1, S, D^)<r(9tn,5,DJ) и
D.31) г (ТЦ, S, DJ) > г (Y^1, 5, DJ) - в (пгО = в (*-').
Для доказательства обратного неравенства положим k=~
Г(г—1—?)/(С+1I и mx= Lw/O + fc) J- Пусть точки ^ для
информации $1п удовлетворяют условию
D.32) *»1+/*+/-**/+i ПРИ Z^0' !» •••»/я1 — 1,
; = 1, 2, ..., fe.
ЕслиЛ€л, то А^(^) = 0 при t=l, 2, ..., m, / = 0, 1, ..., g.
Для точек xif удовлетворяющих условию D.32), получаем в пределе"
= 0 при i=l, 2, ...,тх, / = 0, 1, ..., г—1,
134 Ч. А, гл. в. Приложения к линейным задачам
ибо ?+ 1 +k(l+l)^r. Таким образом,
г (Щ, S, Drp)= inf sup { \ h (x) dx: h € ker $ln П Wrp\
*l* ...» Д?/» V 0 '
< inf sup< \h(x)dx: h^(Xi) = 0,
i 0
(=1, 2, ...f mit / = 0, 1 r—1,
где п^в/ИхГ. Так как mx= L«/((C +1)(*+ 0)J, то ма = в(п) и
njr = e(rt~r). Соотношение D.30) доказано.
Проанализируем сложность этой задачи. Пусть W—класс
всех линейных информационных операторов вида D.2) с п ?1
2(^+1), .... т. е.
В силу D.30),
Inf r($l,S,
5
Мы хотим найти е-кардинальность т (??, 5, D^, e) для задачи
интегрирования' E, Drp) в классе ?6 (см. B.5) гл. 5). По
определению, е-кардинальность равна наименьшему я=т(?+1), для
которого г 0F?, 5, Drp) < e. Ввиду D.30),
D.33) т OP*, S, D^, е) = 0 (е-^).
Для ?=*г—1 и для ?=*г—2 при четном г можно найти точное
значение е-кардинальности. Именно, из D.23) вытекает, что
,4.34,
Для некоторых специальных значений р формула D.34)
упрощается. Для p=s 1
D.35) т№, S, D[t e)= |_HJ ((^I/г + 4—2» + ^) J
4. Интегрирование 135
ДЛЯ р = 2
D,36) « (ТС. S, D'2>
ДЛЯ р = + оо
D.37) т(Т*,5,%,в)-[^((^
Мы видим, что (при малых е и больших г) 8-кардинальность
для /?=1, 2 и оо асимптотически одна и та же.
В силу линейности оптимального по точности алгоритма D.22)
(см. лемму 2.2 гл. 5), е-сложность задачи интегрирования E, Drp)
в классе Wt (кратко е-сложность (S, Drp) в Ч^) выражается формулой
compos, S, D'p, e) = (cl + a)m(Wt, S, Dp, e)-l,
где сг—сложность вычисления значения каждого из линейных
функционалов /(*), /'(*), •••»РМ, а€[1, 2]. Ввиду D.33),
получаем
Из леммы 2.2 гл. 5 также следует, что алгоритм D.22) почти
оптимален по сложности для (S, Drp) b?J.
Подытожим эти результаты в виде следующей теоремы.
Теорема 4.1. Рассмотрим задачу интегрирования S для Wrpm
(i) r ($ln, S, Drp) конечно тогда и только тогда, когда
выполняется D.5) или D.6).
(П) Для ? = /-—1 или для ? = г—2 при четном г
информация ЩУ определенная формулой D.21), является единственной
п-й оптимальной информацией в ??, а алгоритм ф, определенный
формулой D.22), линеен, оптимален по точности и почти
оптимален по сложности для E, Drp) в Ч^,
(iii) г(Щ, S, DJ) = e(/r'). Точное значение r(^, S, Drp) для
^ = г—1 или для ? = /-—2 при четном г дается формулой D.23),
для р=1—формулой D.25), для р = 2—формулой D.27), а для
р= -f оо—формулой D.29).
(iv) е-кардинальность задачи (S, Dp в Ч1 выражается
формулой
W, S, D^,e) = 0(8-1/o.
136 Ч. А, гл. 6. Приложения к линейным задачам
Точное значение т (Ч^, 5, Drp> е) для ? = /-— 1 при четном г дается
формулой D.34), для /?=1—формулой D.35), для /? =
2—формулой D.36), для /?=+оо—формулой D.37).
(v) 8-сложность задачи (S, Drp) в ?? выражается формулой
сотряс, S, D'p, B) = (Cl+a)m(yt, 5, D'p, е)-1 = e(e-i/'). I
Задачу интегрирования для %0 = Wrp изучали многие авторы
для различных частных значений г или р и для частных классов
информационных операторов вида D.2); среди них: Аксень и
Турецкий [66], Алхимова [72], Боянов [76], Ибрагимов и Алиев
[65], Карлин [71], Каутски [70], Коман [72], Корнейчук [74],
Корнейчук и Лушпай [69], Крылов [67], Ли [77], Липоу [73],
Лушпай [66], Мейерз и Сард [50а], Никольский [50, 58], Сард
[49, 63], Секрест [64, 65Ь], Стёрн [67], Шайдаева [59], Шёнберг
[64b, B5, 66, 69, 70].
(И) Интегрирование функций из W*
В этом пункте рассматривается задача интегрирования вида
ffi Пусть 31==ГЦ0, 2я]. Возьмем Tf = DrJ = f{r) с
Таким образом,
Пусть
D.38) $ln(f) = [f(x1), /(*,), ..../(xJJ*
для попарно различных точек xt из [0, 2я]. Заметим, что kerD» —
это множество периодических многочленов степени не выше г—1,
т. е. kerD^, = {/: f(x)^ const}. Поэтому
откуда, как и в случае D.4), следует, что
r(mn,St D^X + oo Vai>1.
Мы изложим здесь интересный результат Моторного [73] об
оптимальности квадратурной формулы прямоугольников.
Напомним, что W°n обозначает класс всех линейных
информационных операторов вида D.38). Нас интересует отыскание /г-й
оптимальной информации Шп из класса Ч™, т. е. оператора ШпУ
удовлетворяющего условию
D.39) г ($Гс„, S, ОД = г W, S,
Так как для каждого информационного оператора вида D.38)
существует линейный оптимальный по точности алгоритм, то D.39)
эквивалентно отысканию узлов xit t = 1,2, ..., п, и весов qh
4. Интегрирование 137
/=1, 2, ..., ft, таких что погрешность алгоритма
D.40) Ф(ЯЛ( JS
Ф(Л(А) JS
минимальна в Wr<». Эту задачу решил Моторный [73],
показавший, что алгоритм ср вида D.40) при
D.41) х( = Bп/п)A—1), ;=1, 2, ..., ft,
D.42) qi=-2n/n
обладает минимальной погрешностью е(<р), которая выражается
формулой
D.43) е(у)=*2пКг/пг,
где Кг—постоянная Фавара (см. C.16)) и /СГ6[1» я/2]. Отсюда
мы заключаем, что
D.44) 91п (/) = [/ @), / Bл/л), ... Л (Bя/п) (я-1))]4
есть я-й оптимальный информационный оператор в классе 4я" и
D.45)
1=1
— линейный оптимальный по точности алгоритм с погрешностью
D.46) е (Ф) = г (Ял> 5, Dy - г (ЧГА, S, DL) = 2я^г/л^.
Отметим, что <р—хорошо известная квадратурная формула
прямоугольников. На самом деле, как показал Женсыкбаев [76],
квадратурная формула прямоугольников—оптимальный по
точности алгоритм класса Wrp при произвольном р из [1, +<х>].
Замечание 4.1. Ранее уже упоминалось, что, как правило,
алгоритмы получают, исходя из критериев, применимых лишь
для данного конкретного случая. Например, для задачи
интегрирования обычно используемый критерий требует найти
квадратурную формулу максимального порядка точности, т. е. точную
на многочленах как можно более высокой степени. Это приводит
к квадратурным формулам Гаусса, независимо от
рассматриваемого класса 30 интегрируемых функций.
В настоящем параграфе мы показали, что для класса Wrw
периодических гладких функций формула прямоугольников,
имеющая нулевой порядок точности, является оптимальным по
точности алгоритмом.
Известно также, что для класса аналитических функций,
ограниченных по модулю единицей на круге {х: \х\^г}у
квадратурная формула Гаусса, т. е. квадратурная формула
наивысшего порядка точности, почти оптимальна по точности при
138 Ч. А, гл. 6. Приложения к линейным задачам
больших г (см., например, Барнхилл [68], Ларкин [70], Пин-
кус [75]).
Это показывает, что оптимальные по точности квадратурные
формулы и их порядок точности сильно зависят от класса 30
интегрируемых функций и что порядок точности никак не
связан с оптимальностью квадратурных формул. |
Проанализируем сложность описанной выше задачи. Пусть
4го = Un-i^w—класс всех линейных информационных операторов
вида D.38) при л = 1, 2, ... . По определению, е-кардиналь-
ность m(V°, S, D», е) равна наименьшему п, для которого /-(??,
S, DL) < 8. Из D.46) вытекает, чтсг
т Dго, S, Ь;, е) = L B*Кг/в)Ч' J +1.
Комбинаторная сложность линейного оптимального по
точности алгоритма D.45) равна т. Таким образом, она не более чем
на единицу отличается от минимальной комбинаторной
сложности. Поэтому 8-сложность задачи E, ?>?>) в ?° выражается
формулой
comp (?*, S, ?>'„, е) = (сх + 1) (L 2nKrltyir J + 1) +а,
где Cf — сложность вычисления одного значения функции,
а?[—1, 0]. Алгоритм D.45) почти оптимален по сложности для
(S, 5у в ?°.
Подытожим эти результаты в виде следующей теоремы.
Теорема 4.2. Рассмотрим задачу интегрирования S для W^.
(i) r QFn, S,Dr0O)=2nKr/n'.
(ii) Оператор Шп, определенный формулой D.44), является
n-м оптимальным информационным оператором в ??:
(iii) Квадратурная формула прямоугольников D.45) является
линейным оптимальным по точности и почти оптимальным по
сложности алгоритмом для (S, б^) в 4°:
в(ф) = г(ЭТя, S, бу.
(iv) е-кардинальность задачи (S, б^) в 4го выражается
формулой
m(W\ S, Dr^ 8)= LBn/Cr/eI/rJ+l-
(v) 8-сложность задачи (S, D^) в Ч/о выражается формулой
comp OP, 5, Di, 8) = (сг+ 1) (L BпКг/гУ" J + l) + fl. I
Задача интегрирования периодических функций одной или
многих переменных для различных 30 и для информационных
4, Интегрирование 139
операторов вида D.2) рассматривалась во многих работах.
См., например: Бабушка [68а, Ь], Бусарова [73], Женсыкбаев [76],
Кист [73], Корнейчук [74], Корнейчук и Лушпай [69],
Коробов [63], Лигун [76], Лушпай [69, 74], Моторный [73, 74, 76],
Смоляк [60], Форст [75].
(iii) Связь с /i-поперечником по Гельфанду
В этом пункте мы показываем, что /г-й минимальный радиус
информации для -задачи интегрирования связан с п-поперечником
по Гельфанду для соответствующей задачи аппроксимации в
пространстве Li# Точнее, д-поперечник по Гельфанду служит оценкой
снизу для п-го минимального радиуса информации. При
некоторых условиях эти две величины совпадают.
Рассмотрим задачу интегрирования D.1) с уравновешенным
и выпуклым 30. Напомним, что
D.47) г (Т«, S, 30) - inf sup { \ A (x)dx: ft (*,) = 0,
0<<<<<1 lo
l, 2, ..., n, ft€
Для любых таких xiy x2, ..., xn положим
D.48) fc(jc) = sup{h(x): A(jc,) = O, i=l, 2, ..., n,
Поскольку 30 уравновешенно, то h(x)^0 Vx?[0, I].
Предположим, что
D.49) Л63О.
Заметим, что ft(#/) = (), t=?l, 2, ..., п, и
D.60) sup U h (x) dx: h(Xt) = O, f=l, 2, ..., n, ft630?««
\h(x)\dx: ft(^)-0,/=l, 2, ..., n,
Теперь рассмотрим задачу аппроксимации
SJ=f, 3,-LitO, 1].
Пусть ЭТ(/) = [/(^), f(x2)y ..., f(xn)Y. Тогда, в силу D.50),
Таким образом, радиус информации для задачи интегрирования
равен половине диаметра информации для задачи аппроксимации
140 Ч. А, гл. 6. Приложения к линейным задачам
в L±. Напомним, что d($l, Sj)^d(n, S19 30)> где^(п, Sls 30) есть
ti'ik минимальный диаметр информации (см. F.2) гл. 2). Согласно
следствию 6.1 гл. 2,
d(n, Si9 30) = 2d",
где dn~dn (Sx (So), ^i@, 1)) есть п-поперечник по Гельфанду
множества значений в LY оператора аппроксимации. Отсюда
заключаем, что
г (% S) > d».
Если D.49) выполняется для любых точек хг < х2 <... < хп> то
имеем
D.51) г (VI S, 90)>d«.
Итак, n-поперечник по Гельфанду для задачи аппроксимации
служит оценкой снизу для п-ro минимального радиуса
информации.
Посмотрим теперь, когда в D.51) достигается равенство.
Предположим, что существуют такие точки xl, xl9 ..., х*п> что
линейное подпространство
D.52) A» = {feLi[O, 1]: /W) = 0, i=l, 2, ..., п\
является п-м экстремальным подпространством в Si C0) в смысле
Гельфанда. Тогда, согласно следствию 6.2 гл. 2,
информационный оператор
D.53)
задает я-ю оптимальную информацию для нашей задачи
аппроксимации и
Заметим, что З^б^п- Применяя информационный оператор
к рассматриваемой задаче интегрирования, получаем
На основании D.51) заключаем, что
г(Ж*п, S) = rCP*n9 S, 3e) =
т. е. 5ftn ^сть n-я оптимальная информация в 4го, а я-й
минимальный радиус информации равен dn.
Подытожим эти результаты в виде следующей теоремы.
Теорема 4.3. (i) Если для любых точек хг < х2 < ... < хп
определенная формулой D.48) функция h принадлежит 30, то
п-й минимальный радиус информации для задачи интегрирования
в классе W°n не меньше n-поперечника по Гельфанду для задачи
4. Интегрирование 141
аппроксимации в Lt:
r(YJ,S,9e)>d«(SiCo), МО. 1]).
(ii) Далее, если задаваемое формулой D.52) линейное
подпространство Ап является п-и экстремальным подпространством
в ^(Зо) в смысле Гельфанда, то определенный формулой D.53)
информационный оператор 91* задает п-ю оптимальную
информацию для задачи интегрирования:
г (ЭК, S) = r№, S, 30) = d"(SfC0), L,[0, 1]).|
Проиллюстрируем теорему 4.3 на примере 3, = Wroo[0J 1] и
Tf = Droof = f{r\ Имеем 30 = tt^. Пусть, как и в задаче
интерполяции с точками хх < х2 <... < хп (см. § 3), qn—совершенный
сплайн степени г с п—г узлами, удовлетворяющий условиям
C.11) и C.14). Из C.9) вытекает, что |й(*)|<|<7„(*I Для
любого h^W^ с /*(*,•) = 0, /=1, 2, ...,д. Предположим, что qn
сохраняет знак на [0, 1]. Тогда функция
удовлетворяет условиям D.48) и D.49), и по теореме 4.3
D.54) r(Tn9St W'm)>d*(W'.9Lt).
Точное значение d*(W^, Lt) и экстремальные подпространства
неизвестны. Однако известно асимптотическое поведение d^W^, LJ
(см. Тихомиров [76, с. 249]):
D.55) d-{W^ L0 = e(n-0.
Кроме тбго, легко найти почти оптимальные информационные
операторы. А именно, пусть
Я.(Я-[/(*!)./(*.). ...,/(^)Р^/-(^-1)/(^-1),^1, 2, ...9п.
Тогда
D.56) г (Я., S, Dy-J
о
Миккелли, Ривлин и Виноград [76] показали, что для
равноотстоящих точек %i
D.57) KL-e (*-')•
Поскольку гE«„, S, %)>г(^ S, №г~), то из D.54) —D.57)
следует, что
г OR, S, 1Гу-в(л-0.
Этот факт, уже известный нам из D.30), приводит к равенству
которое показывает, что информация ЭТ„ в классе V°n почти
оптимальна.
142 Ч. А, гл. 6. Приложения к линейным задачам
б. АППРОКСИМАЦИЯ
В этом параграфе мы рассмотрим для нескольких пространств
Si, Э2 и нескольких классов 30 задачу аппроксимации'.
E.1) 5/=//==/.
Эта задача будет изучена для некоторого класса Эо в
абстрактном гильбертовом пространстве, для класса периодических
гладких функций Wr2 в L2 и для класса непериодических гладких
функций Wr2 в L2. Мы обсудим также равномерную
аппроксимацию C2 = С или С) для классов W^ и W^.
В предыдущих параграфах были рассмотрены операторы
решения, являющиеся линейными функционалами. Для таких
операторов решения проблема п-к оптимальной информации
в смысле определения 4.1 гл. 2 тривиальна. Действительно,
поскольку кардинальность 9?(/) = S(/) равна единице и d(9t, S)=0,
то $1 является п-ы оптимальным информационным оператором.
В данном параграфе мы будем иметь дело с бесконечномерным
линейным оператором S = /, Для которого проблема
существования д-й оптимальной информации интересна и глубока. Для
построения п-х оптимальных информационных операторов и
линейных оптимальных по точности алгоритмов будут широко
использоваться взаимосвязи между теорией аппроксимации и
теорией аналитической сложности, установленные в § 6 гл. 2 и
§ 5 гл. 3.
Задачей аппроксимации занимались многие авторы, например:
Боянов и Черногоров [77], Голомб [77], де Бур [77], Иванов [77],
Корнейчук [76], Мелкмэн [77], Миккелли и Пинкус [77], Мик-
келли, Ривлин и Виноград [76], Моторный [76], Осипенко [76],
Райе [73, 76], Сухарев [78а], Тихомиров [76], Шульц [74].
(i) Аппроксимация в абстрактном гильбертовом пространстве
Пусть H = lin(%i, ?2, ...)—бесконечномерное гильбертово
пространство над полем R вещественных чисел, причем (?,., gyr)=6/y.
Таким образом, для всякого f?H мы имеем f^^T-i(f> ?/)?/ и
2?U(/, E/J<+°°. Пусть {Р,-}—ненулевая последовательность
вещественных чисел, такая что |М^|Р/+1| Для всех *"• Положим
E.2) »! = {/: f$H и J] р?(/, 1/)
а 32 = //. Пусть, далее,
5. Аппроксимация 143
где
E.4)
2
причем 34 = Т (Sf) наделено нормой Я. Очевидно, 34—гильбертово
пространство.
Найдем прежде всего n* = ind(/, T). Так как ker/ = {0}, то,
в силу соотношения C.3) гл. 2, Л (Г, /) = кегГ и п* — dim (ker T).
Пусть i0—наибольший индекс, такой что р/ = 0 для i= 1, 2,..., i0
(Р/о+1=^=0). Ясно, что /г* = /0< + эо. Заметим, что оператор
ЭТ*(/) = [(/, Si), tf. У, ...,(/, ЫГ
удовлетворяет условиям леммы 4.1 гл. 2, т.е. кегШ*Г\кетТ = \О\.
Из соотношения D.3) гл. 2 легко находим оператор, обратный к Т:
Оператор /С = 5Г"* = Г~1 является самосопряженным, /d = /C2 и
/С|/вA/Р/) I/ при i > i0. Таким образом, /( компактен тогда и
только тогда, когда Нт/|р/|=я+°°. Согласно следствию 5.1
гл. 2, задача (/, Т) обладает свойством сходимости в том и только
том случае, если lim/||3/|= + оо.
Найдем п-ю оптимальную информацию Шп для п^п*. Так
как /С(Э4)с34 и (Tf, li) = i\(f, Е,-), то п-я оптимальная
информация, определенная формулой E.7) гл. 2, эквивалентна
информации
Учитывая замкнутость Т (ker Шп) в гильбертовом пространстве 34,
заключаем на основании теоремы 5.3 гл. 2 и соотношения D.16)
гл. 3, что
Линейный оптимальный по точности алгоритм ф, определенный
равенством D.10) из теоремы 4.1 гл. 3, можно задать равенством
п
E.7) ф (Шп (/)) =* S (/, Ц) li9 е (ф) = 1/| $n+i |.
В силу теоремы 5.1 и замечания 5.1 гл. 4, это центральный
сплайновый алгоритм. Отметим, что этот алгоритм выдает в
качестве результата начальный отрезок ряда / = 2?=i(/:' ?/)?/•
Проанализируем сложность описанной задачи. Напомним, что
Чу обозначает класс всех линейных информационных операторов
конечной кардинальности. Как легко видеть, е-кардинальность
144 Ч. Л. гл. 6. Приложения к линейным задачам
m = /nDft/, У, Г, е) (см. B.5) гл. 5) равна наименьшему п,
такому что l/|Pw+i|<e. Поскольку для любого е существует
линейный оптимальный по точности алгоритм, то е-сложность задачи
(/, Т) в классе Чц выражается формулой
E.8) сотрем /, Г, e) = (c,+a)m(Vu, /, Г, е)-1,
где Cf—сложность вычисления значения линейного функционала
вида (/, ?,-), а ? [1, 2]. Заметим, что m зависит только от скорости
стремления |Р;| к бесконечности и по теореме 2.1 гл. 5 может
быть по существу любой убывающей функцией от е. Алгоритм
E.7) почти оптимален по сложности для (/, Т) в Ч^.
В качестве побочного результата получаем n-поперечники по
Гельфанду и линейные л-поперечники по Колмогорову
множества решений. Так как определенная соотношением F.6) гл. 2
величина q(I, Эо) равна теперь единице, то, в силу замечаний
6.1 гл. 2 и 5.2 гл. 3,
Подытожим эти результаты в виде следующей теоремы.
Теорема 5.1. Рассмотрим задачу аппроксимации для
множества 30 в пространстве Я, задаваемого равенством E.3).
(i) Определяемый формулой E.5) оператор $1п задает /г-ю
оптимальную информацию,
(и) Определяемый формулой E.7) алгоритм ф является
линейным, центральным, сплайновым и почти оптимальным по
сложности для (/, Т) в Ч1^, e(q>)=l/|PB+i|.
(iii) е-кардинальность (/, Т) в Ч1^ выражается формулой
m(VUt /, Г, 8){
(iv) е-сложность (/, Т) в Y^ выражается формулой
сотрем, /, Г, г) = (сг+а)пг(Чи9 I, T, е)-1.|
(ii) Аппроксимация для Щ в L2
Конкретизируем результаты предыдущего пункта для случая
гильбертова пространства периодических гладких функций. Пусть
E.9) 31==H^[0, 2я] и 32 = L2.
Положим
E.10) Tf
5. Аппроксимация 145
в 34 = Т (Зх), наделенным нормой L2. Таким образом,
E.11) 30Н/: |Г||<1Н^
Отметим, что для г »0 мы имеем 6/E1, /, /) = 2sup{ |/i|]2: ft
и ||h j|2^l} = 2 для любого информационного оператора конечной
кардинальности. Следовательно, при г = 0 задача аппроксимации
е-неразрешима для e^h В дальнейшем будем предполагать,
что
E.12) г>1.
Для отыскания индекса n* = dim (kerDQ заметим, что если/(г) = О
и f—периодическая функция, то / = const. Поэтому kerZH =
= {/: / = const} и п*=\. Информация
Я* (/) = (/, 1)
удовлетворяет необходимому условию кег Ш* П ker Dr2 = {0}.
Легко проверить, что определенный формулой E.4) гл. 2
оператор Кх представим теперь в виде Кг = (—l)r[Z>$]~2: 34—*34 и
E.13) /d2= 2 jr(af sin jx+ bjcos jx)t
1=1
где z = ir=i (fly sin jx + fty cos jx) 6 34.
Для отыскания д-й оптимальной информации нужно найти
собственные числа и собственные функции оператора Кг. Имеем
EЛ4) /Сх sin /x = /~2r sin /jc, Kxcos jx = j"ircos jx, V/^ 1,
т. e. /~2r — собственное число кратности 2 оператора /С?, а
sin jx, cosjx — соответствующие собственные функции.
Для /г=1, 2, ... определим информационный оператор
формулой
E.15) 31Я(/) = [(/, 1), (/, sinx), ..., (/, sinn'x), (/, cosx), ...
..., (/cosя'*)]*,
гдеп'=[_(п — 1)/2J. Заметим, что card ($ln) = л для нечетных
п и card (97J = п—1 для четных п. Используя введенное в § 2
гл. 2 отношение эквивалентности, можно записать
[(b'J, sin/x), (Dtf, cos/х)]* ж [(ff sin/x), (f, cos/x)]1
для каждого /. Отсюда заключаем, что определенная формулой
E.15) информация $1п эквивалентна п-\\ оптимальной
информации, определенной формулой E.7) гл. 2.
146 Ч. А, гл. 6. Приложения к линейным задачам
Линейный оптимальный по точности алгоритм <р, заданный
равенством D.10) из теоремы 4.1 гл. 3, принимает теперь вид
п'
E.16) Ф C1, (Л) «4 tf, 1) +1 ? ((/, sin jx) sin jx +
+ (/, cos jx) cos jx).
Этот алгоритм является также центральным и сплайновым. Его
погрешность равна V*kn, где {Хп}—невозрастающая
последовательность собственных значений оператора Ки т. е.
E.17) *(ф) = г(Яя, /, D0 = ±d(n, /, DO = Г л/21 "Г-
Проанализируем сложность этой задачи. В силу E.17), е-
кардинальность m — m(WUi /, DJ, e) равна наименьшему пу для
которого Г я/21 "' < е. Поэтому m = 2 [_ е"x/r J + 1. Вследствие
линейности оптимального по точности алгоритма E.16), е-слож-
ность задачи (/, Щ в Ч^ выражается формулой
E.18) сотрем, /, DJf e)«(ct + fl)BLe-^ J +1)-1,
где Cj—сложность вычисления значений линейного функционала
вида (/, sin'/x) или (/, cos /л:), о€[1» 2]. Алгоритм E.16) почти
оптимален по сложности для (У, D0 в Т^.
В качестве побочного результата получаем
d»№, L2)-K№, L,)-Г я/21-',
что нам уже известно из теории аппроксимации.
Подытожим эти результаты в виде следующей теоремы.
Теорема 5.2. Рассмотрим задачу аппроксимации для
множества, 30==Щ в пространстве L2.
(i) Определенный формулой EЛ5) оператор $1п задает /г-ю
оптимальную информацию,
(ii) Определенный формулой E.16) алгоритм ф является
линейным, центральным, сплайновым и почти оптимальным по
сложности для (/, DQ в Ч^, е(ф)= Г^/21""г.
(iii) в-кардинальность (/, D!) в V выражается формулой
(iv) 8-cложность (/t Dr2) в Wu выражается формулой
5. Аппроксимация 147
(iii) Аппроксимация для Wr2 в L2
Рассмотрим теперь гильбертово пространство гладких
непериодических функций. Пусть
F.19) 31"=Wr5[—lt 1] и 32 = La.
Положим
E.20) r/=D27=r;
здесь 34 = Т'C1) = L2. Таким образом,
E.21) 30 = {/:|m<l} = ^.
При г = 0 для любого информационного оператора конечной
кардинальности имеем й(Щу /, /) = 2, и задача аппроксимации
е-неразрешима для 8^1. В дальнейшем будем предполагать,
что г ^ 1.
Заметим, что kerD?= Пг-i (класс многочленов степени не
выше г—1). Поэтому
Пусть I*, gj, ..., ^—ортогональные многочлены из Пг-i»
(SJ, lj) = 8if. Определим информационный оператор формулой
№(/)=[(/> 61), (Д б;), ...,(/, км*.
Тогда кег 91* П кег D^ = {0}.
Используя п-е экстремальное в смысле Гельфанда
подпространство в Эо, с помощью следствия 6.1 гл. 2 найдем /г-й
оптимальный информационный оператор. Рассмотрим задачу на
собственные значения
E.22) /B'> (х) + {—1)г+г Щ \х) = 0
с граничными условиями
E.23) Рг) (±1)= ... «f(v-X)(±l) = 0.
Пусть {к(}—собственные числа задачи E.22) —E.23), A,/<A,/+i,
а {%;}—соответствующие нормированные собственные функции.
Известно (см., например, Тихомиров [76, с. 128]), что
E.24) ^=...=Хг-0, Яг+1>0, Хп = (лп/2У A+
а собственные функции |,- образуют ортонормированный базис
в L2. Без потери общности можно положить ?/ = !? для i«=l,
2, ..., г. Далее,
a An=*{f: (/, ?/) = 0, /=1, 2, ..., п} является п-ы
экстремальным подпространством вЗо в смысле Гельфанда. На основании
148 Ч. А, гл. 6. Приложения к линейным задачам
соотношения F.13) гл. 2 заключаем, что
E.25) Ша(/) = [(/> У, (/, U .... (А ?„)]'
есть я-й оптимальный информационный оператор, г (Щп, I, Dr)=
= 1А», а
E.26) <p(9Uf)) = 2(/, Ш,
1 = 1
— оптимальный по точности линейный центральный сплайновый
алгоритм, е(ф)=1Ди. При г=1, например, А,я = ял/2, ?2„(/) =
= я~1со8мя/ и ?2л+1 (/) = K~1sin (п-(-1/2) я^. При /* = 2
положительные собственные числа Х„ удовлетворяют нелинейному
уравнению |tg|/Tl = thVT
е-кардинальность m = /n(??/, /, D?, e) равна наименьшему я,
для которого 1Д„ < е. В силу E.24), при малых е получаем
Ясно, что 8-сложность выражается формулой
s, /, D\y г) = (С1 + а)т— 1,
где Ci—сложность вычисления значений линейного функционала
вида (/, Е/), a g [1,2]. Алгоритм E.26) почти оптимален по
сложности для (/, D0 в 4V
Подытожим эти результаты в виде следующей теоремы.
Теорема 5.3. Рассмотрим задачу аппроксимации для
множества Э0==Щ в пространстве L2.
(i) Определенный формулой E.25) оператор $1п есть п-й
оптимальный информационный оператор,
(ii) Определенный формулой E.26) алгоритм <р является
линейным, центральным, сплайновым и почти оптимальным по
сложности для (/, D0 в Ч^, е(ф)=1Дл.
(iii) е-кардинальность (/, D0 в Ч^ выражается формулой
(iv) е-сложность (/, Dr2) в Wu выражается формулой
/, DJ, е) = (
(iv) Аппроксимация для WL в С
Рассмотрим теперь задачу равномерной аппроксимации для
периодических функций. Пусть
^ = ^[0, 2я], Эа = С = С[О, 2я],
5. Аппроксимация 149
и пусть Т1 = ЬЦ с S^^T (SJczL^. Таким образом, 30 =
= {/'• i/(r)L<l} = ^~- Известно (см. Тихомиров [76]), что
E.27) d*(W'.f С) = М^, Q = Kr Гп/21-,
где Кг—определенная равенством C.16) постоянная Фавара,
/Сг€[1> я/2]. Для W^ известны два п-х экстремальных
подпространства: Л; = {/: (f, sinjx) = (fy cos/x) = 0, / = 0, 1, ..., n' =
= L(«-1)/2J}, ^ = {f: /('/) = <>, *=1, 2, ..., njr = 2Ln/2J}f
где
/^9W / /B*-1)(я/2л) при г = 2, 4, ...,
E.28) f'eUf—1)(я/л) приг=1,3, ....
Следуя данной в § 6 гл. 2 общей схеме построения
оптимальных информационных операторов, основанной на рассмотрении
п-го экстремального подпространства, находим, что операторы
E.29) 91Яч!(/)-[(/, 1), (Л sinx), ...,
(/, sinn'x),{f9 cosx), ..., (Д cosn'x)]\
и
E.30) «„.,(/)•
оба являются n-ми оптимальными информационными
операторами, а
Используя результаты Корнейчука [76, с. 109—113], находим
оптимальный по точности алгоритм для $1Пг х. А именно,
E.31) ФЛ(/))
п'
+it 2 *у ((/•sin wsin /*+(f*cos wcos w.
1=1
где
l r-
для /=1, 2 /г'. В частности, при г=1 имеем Ху (/)
°tg (/зх/2/г). Таким образом, алгоритм фх—это взятие усеченного
ряда Фурье функции /, коэффициенты (/, sin /*) и (/, cos jx)
которого умножены на hj. Так как ^(9i)=?/C/./r^/21/"i т° Ф1 —
150 Ч. А, гл. 6. Приложения к линейным задачам
линейный оптимальный по точности алгоритм. Заметим, что
алгоритм ф не является интерполяционным, потому что КуФ\.
Чтобы найти оптимальный по точности алгоритм для $1Пг 2,
рассмотрим (как в книге Корнейчука [76, с. 287—290])
единственный 2я-периодический сплайн gt со следующими свойствами:
gt есть 2я-периодическая функция на R, производная gY~2)
непрерывна, g7—многочлен степени не выше г—1 на каждом
отрезке [2(i—\)n/n\ 2in/n"l i=l, 2, ..., п", и &(/у) = 6/у.
Определим алгоритм ф2 формулой
E.32) Ф2(^М/)) = 2т)?/.
Так как е (ф2) =/С,/[~ ^/2 ~1 г> то ф2—линейный оптимальный по
точности алгоритм.
Проанализируем сложность этой задачи. Ясно, что е-кардиналь-
ность m = mDf?/, /, D^, е) равна наименьшему я, для которого
Кг/ Г я/21г < е. Поэтому
Заметим, что /Crg[l, я/2] и |//Сг~1. Вследствие линейности
оптимальных по точности алгоритмов E.31) и E.32), е-сложность
задачи (/, Ьгж) в Чи выражается формулой
сотряс/, /, DrTO, е) = (с,+а)т— 1,
где сг—сложность вычисления значений линейного функционала
вида (/, smjx), (/, cos/x) или f{tj), a?[l, 2]. Алгоритмы E.31)
и E.32) почти оптимальны по сложности для (/, б^) в Чц.
Подытожим эти результаты в виде следующей теоремы.
Теорема 5.4. Рассмотрим задачу аппроксимации для
множества -30 = ft^o в пространстве С.
(i) Определенные формулами E.29) и E.30) операторы $1п%1 и
$1п% 2 задают оба n-ю оптимальную информацию,
± ^ t=l, 2.
(ii) ф! и ф2—линейные оптимальные по точности и почти
оптимальные по сложности алгоритмы для (/, Д») в Ч^,
(Hi) е-кардинальность (/, D^) в Ч^ выражается формулой
5. Аппроксимация 151
(iv) 8-сложность (/, ?>Со) в ^и выражается формулой
сотрем /, ?>'„, e) = (^+a)BLr/^;8-^J + l)-l. I
Отметим, что информация $lnt 2 и алгоритм ф2 обладают
некоторыми свойствами оптимальности для W^ в пространстве
Lit Точнее, пусть 30 = №«, a 32 = Li. Известно (Корнейчук
[76, с. 290]), что
Известно также, что ^„(W7!», 11) = 4/(г+1/Гп/21г. Это означает,
что ф2 имеет наименьшую погрешность среди всех линейных
алгоритмов, использующих линейный информационный оператор
кардинальности не выше п. К сожалению, точное значение п-
поперечника по Гельфанду неизвестно, и потому мы не можем
утверждать, что информация Шп, 2 оптимальна. Однако известно
(см. Тихомиров [76, с. 249]), что
d"(W'.9 10^в (л-')-
Отсюда следует, что оператор ЭТ„, 2 близок к n-му оптимальному
информационному оператору.
(v) Аппроксимация для WI в С
Рассмотрим задачу равномерной аппроксимации для
непериодических гладких функций. Пусть
E.33) ^-^[-1, 1], 32 = С = С[-1, 1],
и пусть r/ = D;/ = /(/>), Э4 = ^. Таким образом,
E.34) 30 = И^.
Заметим, что n* = dim(ker D«) = r. Найдем я-ю оптимальную
информацию, п^гу используя n-поперечник по Гельфанду
множества W» в С. Следуя Тихомирову [76, с. 130—135, 261—263],
определим ХклГ как класс совершенных сплайнов /: [—1, 1]—» R
степени г с k узлами. Иными словами, для каждого f?Xknr
существуют такие ti*=*tg(f)9 — 1 ^ff<^2 < ... </ft ^ 1 и
a,= a/(/)€R, что
E.35) ^ ?
Ы1 issl
Поэтому |f(r)(/)|^l, f{r) меняет знак не более чем в k точках
и f{r)(—l)=*l. Определим fk%r как совершенный сплайн из Хк%г
162 Ч. А, гл. 6. Приложения к линейным задачам
минимальной нормы, т. е.
E.36) l/».,|- inf |/|.
где flf|| = sup{ |f (f)|: t ?[—1, 1]}. Известно, что такой сплайн fk/r
существует. Например,
Для фиксированного г и больших й имеем
I/*. г|-B/яЛ)^г A +o(l))f
где /Сг—определенная равенством C.16) постоянная Фавара.
Далее, fk%r имеет k + r различных нулей в [—1, 1]. Обозначим
через
E.37) х* = х;(п—г, г), /=1, 2, ..., п,
нули функции fn_r%r, и пусть
A» = {f: /W) = 0, f=l, 2, ..., n}.
Тогда
E.38) d"(WL9 С) = ||/_г,г|| = B/лпГ/(гA+оA)),
а Лл есть п-е экстремальное подпространство в W^ в смысле
Гельфанда. Отсюда заключаем, что
E.39) 91Я (/) = [/ (xi), / (*,•), ..., / (x*)]t
есть я-й оптимальный информационный оператор, а
E.40) г Ой», /, D'.) = ld(n, /, ^) = ||/^г,г||.
Обратимся к вопросу о том, как построить оптимальный по
точности алгоритм для n-й оптимальной информации Шп. В
действительности мы построим далее, используя результаты Мик-
келли, Ривлина и Винограда [76], линейный оптимальный по
точности алгоритм для произвольного информационного оператора
вида
E.41) SHft**U(*i)> /(*.). -.-./(*¦)]*
с точками л:/, не обязательно равными х* из E.39). Предположим,
что — 1 <лг1<л;2<.. .<*„< 1, где х( <xi+r, i = I, 2, ..., n—r,
причем если х(_г < ^«x^., = ... =xi+s < xi+s+1, то / (л:/+/)
заменяется на /(у)(х/)> /=51, 2, ..., s. Существует единственный
5. Аппроксимация 153
(с точностью до знака) совершенный сплайн q:
E.42) f ю«?±1>:+?а,*<-1+1? (-1L*-*,);,
с узлами th удовлетворяющими условию ()</!</,<...< *я_г< 1,
такой что q(Xi) = 0, i=l, 2, ..., п. Заметим, что ||<7(г)|] = 1.
Чтобы определить линейный оптимальный по точности
алгоритм, нужно вычислить узлы tt совершенного сплайна E.42).
Поскольку tf—tiin, r) не зависят от /, их можно вычислить
заранее.
Существует единственный сплайн а = а(9г1(/)) вида
i = 1 i= 1
(где tt—узлы сплайна E.42)), такой что
а(*,) = /(*,), N1, 2, ..., п.
Коэффициенты at и bt можно получить, решая систему линейных
уравнений, откуда следует, что а линейно зависит от $l(f). Пусть
ft—такой элемент из №«, что //(Лу) = 6/;Г, и пусть ст/ = а(Щ(/:/)).
Сплайны ot также можно вычислить заранее. Определим
алгоритм ф формулой
E.43) Ф (Я (Л) «Jj/(*/)*,.
Заметим, что ф—линейный, но не интерполяционный алгоритм,
потому что он строит элемент, принадлежащий IFJf^—1, 1], но
не обязательно 1ГГТО. Подпрограмму на Фортране, реализующую
алгоритм E.43), можно найти у де Бура [77].
В силу теоремы 2 из статьи Миккелли, Ривлина и
Винограда [76],
E.44) |/-<p(?ltf))|< sup \h\~r&ln% /, D'^HMI.
Таким образом, е (ф) == г ($ln, /, D^,), чем доказана оптимальность
по точности алгоритма ф. Радиус информации зависит от точек,
в которых вычисляются значения /. При х{~х\ (см. E.39) и
E.40)) получаем линейный оптимальный по точности алгоритм
для п-й оптимальной информации 9?„. В случае равноотстоящих
точек
E.45) л:/ = — 1 -|-2(/ — \)/п, /==1, 2, •.., п,
получаем на основании теоремы 5 из статьи Миккелли, Ривлина
и Винограда [76], что
154 4. Ay гл. 6, Приложения к линейным задачам
Сравнивая эту оценку с E.38) и E.40), заключаем, что
информационный оператор Шп с равноотстоящими точками E.45) близок
к п-му оптимальному информационному оператору.
Проанализируем сложность этой задачи. Ясно, что е-карди-
нальность m = mC?Ut /, D^, e) равна наименьшему п, для
которого !/„_/., J < е. Из E.38) выводим, что
В силу линейности оптимального по точности алгоритма E.43),
8-сложность (/, D») в Чц выражается формулой
где сг—сложность вычисления значений линейного функционала
f(x)t а а?[1, 2]. Алгоритм E.43) почти оптимален по сложности
для (/, DL) в\
Подытожим эти результаты в виде следующей теоремы.
Теорема 5.5. Рассмотрим задачу аппроксимации для множества
^0=zWroo в пространстве С.
(i) Определенный формулой E.39) оператор ЭД„ есть п-й
оптимальный информационный оператор,
(ii) Определенный формулой E.43) алгоритм ф является
линейным, оптимальным по точности и почти оптимальным по
сложности алгоритмом для (/, DrJ) в Ч^, е(ф) = ||/я_г,г||.
(Hi) е-кардинальность (/, D!») в Ч^ выражается формулой
m(VUf /, D'e, 8) = B/я)(/Сг/е)^A+оA)).
(iv) 8-сложность (/, D^) в Чц выражается формулой
6. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
С ЧАСТНЫМИ ПРОИЗВОДНЫМИ
В этом параграфе мы будем иметь дело с дифференциальными
уравнениями с частными производными параболического,
гиперболического и эллиптического типа. Для простоты будем
рассматривать лишь достаточно простые примеры таких уравнений.
Мы найдем новые алгоритмы, которые используют n-е
оптимальные информационные операторы и являются линейными,
центральными, сплайновыми и почти оптимальными по сложности.
Будет показано, что эти новые алгоритмы «бесконечно» лучше
оптимальных по точности алгоритмов, базирующихся на обычно
используемых (неоптимальных) информационных операторах.
б. Линейные дифференциальные уравнения с частными производными 155
Проводимый анализ основывается на результатах пункта (i),
где мы находим n-е оптимальные информационные операторы и
линейные центральные сплаиновые и почти оптимальные по
сложности алгоритмы для аппроксимации линейного оператора в
гильбертовом пространстве.
Работ по оптимальному решению дифференциальных или
интегральных уравнений не так много, как работ по вопросам,
обсуждавшимся в предыдущих параграфах. Вот некоторые из
них: Бахвалов [62а, Ь, 63, 70, 71Ь], Вайнбергер [72], Гайсарян
[70], Емельянов и Ильин [67], Чжан Гуанцзюань [62].
(i) Линейный оператор в гильбертовом пространстве
Нам нужно обобщить результаты, полученные в п. 5 (i). Пусть,
как и там, Н—бесконечномерное гильбертово пространство над
полем R вещественных чисел, с ортонормированным базисом gif
?2> •••> (?/» 6/) = 6/*. Таким образом, для всякого /€Н мы имеем
/ = 2r»i(/, Ш/ и 2r=i(/, ?/J< + °o. Пусть
{(^-последовательность вещественных чисел, такая что |Р,-| ^|P/+i| для всех I.
Предположим для простоты, что Р/^0 Vt. Пусть
F.1) 91
а 82 = #. Положим
F.2)
где
F.3)
о 8А = Т (Зх) ши Н. Поскольку р, Ф 0, оператор Т обратим:
F.4)
Пусть и—целое число. Введем обозначение
F.6) v^v(O = (t— \)и, t=*lt % ....
В этом параграфе мы рассмотрим оператор решения S:
такой что
F.6)
где
F.7) Av
для любого v = (i — \)ищ («I, 2, •..,
П56 Ч. Л, гл. 6. Приложения к линейным задачам
Таким образом, линейное подпространство Av размерности и
является инвариантным подпространством оператора S. Из F.6)
вытекает, что
и
F.8) ss •= 2 с a k)\ k
для некоторых вещественных констант cv(/, k).
Как мы знаем из гл. 2, /г-й минимальный диаметр и n-я
оптимальная информация зависят от собственных чисел и
собственных векторов оператора /С1 = /С*/С: Н-^Н, где K = Sf'1.
Чтобы выразить оператор Кг через величины C/ и cv(/, k),
введем мха-матрицу Mv = (mv(t, /)):
F.9) mv(/, /) = cv(/, O/Pv+/, /, /,= 1, 2, ..., и,
и их «-матрицу
F.10) /V
Пусть, наконец,
F.11) fv = [(/, Sv+i!
Через (Fviv)j будем обозначать /-ю компоненту вектора Fvfv
Тогда оператор Кг можно представить в следующем виде:
FЛ2) i/S 2 /
t = 1 / = 1
Заметим, что матрица Fv симметрична и неотрицательно
определенна: Fv = Fv^0. Пусть xv+/ и Xv+j—собственные векторы
и собственные числа матрицы Fv:
F.13) ^Ху+/«^+/Ху+/, /«1, 2, ..., U,
где (xv+/, Xv+ft)»3^^. Определим xv(j, i) равенством
F.14) xv+/»[>v(/, 1), xv(]9 2), ..., xv(j, u)Y,
a t]v+/—равенством
и
F.15) S
S v (/
/=1,2,..., a, v = (t-l)U, f-1, 2 Из F.12), F.13) и
F.15) получаем, что
F.16) /<-1t1v+/ = Xv+/t1v+/,
т. е. f]v+/—собственный вектор оператора Кх, а
?^+/—соответствующее собственное значение. Далее,
F.17) ft,, Ti/) = 6l7, Я-Нп(тц, гь, ...)•
6. Линейные дифференциальные уравнения с частными производными 157
Пусть %i обозначает /-е по величине собственное значение
оператора Ки т. е.
F.18) Ч>4>----
Оператор Кг компактен тогда и только тогда, когда Hmy^. = 0.
Из результатов § 5 гл. 2 следует, что задача. (S, Т) обладает
свойством сходимости в том и только том случае, если НтуЯ/.=0.
Чтобы найти п-ю оптимальную информацию, заметим, что
индекс tt* = ind(S, T) равен нулю. Поэтому на основании
теоремы 5.3 гл. 2 заключаем, что
F.19) 9U/) = [G7> Л/,), G7, %а), .... 07, Ль)]*
будет /1-й оптимальной информацией, а
F.20) d(9ln, 5, 7Hd(/i, S, T) =
Найдем теперь оптимальный по точности алгоритм,
использующий информацию F.19). Положим
F.21) Ф(Эи/))==2G7, %)ST-i%.
/el J J
Покажем, что <р—сплайновый алгоритм. Пусть or = 2?=i G7,
ri/O1~1Ti^. Тогда ф(9^д(/)) = 5а, и достаточно показать, что а —
сплайн. Заметим, что (То, rj/ ) = G1f, лО» в СИЛУ F.17). Далее
В Та ||2=2<U (Г/, л^J. Если g63x и (Tg, ч*у) = (Г/, тцу), то
S
Л/J > t (Tg, 4/ = t (Tf9 Ч*у) -II 7а
Тем самым доказано, что а—сплайн, интерполирующий 9]„(/),
а ф—сплайновый алгоритм. Из теоремы 5.1 гл. 4 следует, что
Ф—линейный, центральный сплайновый алгоритм и
F.22) в(ф)-г(91яэ S, T) = i-dERrt, S, T)
Алгоритм ф можно выразить через величины xh ft; и cv(jt k)
следующим образом. Положим
Тогда, в силу F.16),
S
168 Ч. А, гл. 6. Приложения к линейным задачам
Так как ^/«Р/б/, то из F.8) следует, что
и / и
F.23) ST-h, «= (
Замечание 6.1. В случае w = l предыдущие формулы можно
упростить. Действительно, F.8) можно тогда переписать в виде
«Б/=¦*/-!О.
откуда
Поэтому n-я оптимальная информация Щп задается формулой
Я„<Й-[М. 6/t). .... toX bJPXECf, 6/Л .... (f, 5Л
а линейный сплайновый алгоритм ф принимает вид
Проанализируем сложность этой задачи. Ясно, что е-карди-
нальность m = mDU9 S, Т9 г) (см. B.5) гл. 5) равна
наименьшему я, для которого hn+i < е2. В силу линейности
оптимального по точности алгоритма F.21), е-сложность задачи (S, Т)
в классе Чу выражается формулой
„, S, Г, eJ-fe+flJmCP^ S, 7, е)-1,
где cf—сложность вычисления значений линейного функционала
вида (Г/, г\{)у а?[\, 2]. Алгоритм F.21) почти оптимален по
сложности для E, Т) в Ч^.
Можно также найти я-поперечник по Гельфанду и линейный
n-поперечник по Колмогорову множества решений. Предположим
для простоты, что q(S, Эо) == 1 (см. F.6) гл. 2). Это условие
выполняется, например, если оператор S взаимно-однозначен.
Тогда из замечаний 6.1 гл. 2 и 5.2 гл. 3 следует, что
dn(SCe)f Я) = К(S(Эо), H)
Подытожим эти результаты в виде следующей теоремы.
Теорема 6.1. В предположениях F.1) —F.8) рассмотрим
аппроксимацию линейного оператора S для множества 30 в
пространстве Я,
в. Линейные дифференциальные уравнения с частными производными 159
(i) Определенный формулой F.19) оператор Шп есть п-й
оптимальный информационный оператор,
г(Шп, S, T)~±d(n9 S, Г) =
(ii) Определенный формулой F.21) алгоритм ф является
линейным центральным сплайновым и почти оптимальным по
сложности алгоритмом для (S, Т) в Ч^,
(iii) с-кардинальность (S, Г) в Ч^ выражается формулой
т(?ц, S, 7\ e)-min{/i: Л<„+1 <е2}.
(iv) е-сложность (S, Г) в ^ выражается формулой
м, S, Т, е) = (с1 + а)т(Т?/, 5, Г, е)—1. I
(ii) Параболические дифференциальные уравнения
Конкретизируем результаты предыдущего пункта для случая,
когда S определяется как оператор решения некоторого
параболического дифференциального уравнения. Пусть
, я], *=1, 2, ...,
lin(?i, ?2> ...) со скалярным произведением
Пусть, далее, Pft==(—\)rl*kr, где г—неотрицательное четное
число. Тогда /?// означает, что /—нечетная функция и
при этом 3! = {/: 23?-1*я/1 (/» sin^)?< + oo}. Отметим, что
F.24) Г/ = 2(~1)Г/2 ^ kr if, sin fee) sin kx = p>,
F.25) 0[f €4 Iini2f| X(/, )
Рассмотрим параболическое дифференциальное уравнение
F.26,
0@, 0=-«(л, 0 = 0, »(л:, 0)-/(д:),
160 Ч. А, гл. 6. Приложения к линейным задачам
где f?$Q. Определим оператор решения равенством
F.27) (Sf)(x) = u(x, f0), /0>0,
т. е. Sf—это решение системы F.26), взятое при некотором
фиксированном t = t0. Как это сделано у Вайнбергера [72],
методом разделения переменных получаем
F.28) (Sf) (х) = - V (/, sin kx) e~kH* sin kx.
Поскольку
TO F.6) И F.8) ВЫПОЛНЯЮТСЯ ПрИ tt=l И
<*-i(l. 1)-*"*"•.
Из замечания 6.1 вытекает, что
Так как {Xft}—убывающая последовательность, то hk — kk. Снова
используя замечание 6.1, получаем, что информация
F.29) 9U/) = [(/> si"*)> (/. sin2^)» ••-.(
есть n-я оптимальная информация, алгоритм
F.30) 9(S?
— линейный центральный сплайновый алгоритм, а
F.31) е(ф) = гC1й> S, Г)-yd(л, 5, Г) —в-<л+1>
Заметим, что ф—это взятие начального отрезка ряда S/.
Проанализируем сложность этой задачи. Отметим, что радиус
является произведением двух сомножителей ехр (— (п + 1)* /0)
и (п + 1)"г. Это произведение— экспоненциально убывающая
функция от п и г. Ясно, что е-кардинальность m = mDf(/, S, 71, е)
равна наименьшему целому п, для которого
Отсюда получаем ассимптотическое выражение
т-
В силу линейности оптимального по точности алгоритма F.30),
б-сложность (S, Г) в Ч^ выражается формулой
Ty> S, Г, е) = (С1 + а)т(^, 5, Г, е)-1,
6. Линейные дифференциальные уравнения с частными производными 161
где сг—сложность вычисления значений линейного функционала
вида (/, sin?x), a?[l, 2]. Алгоритм F.30) почти оптимален по
сложности для (S, Т) в л?и.
Подытожим эти результаты в виде следующей теоремы.
Теорема 6.2. Рассмотрим оператор решения параболического
дифференциального уравнения, заданный формулами F.24) —
F.27).
(i) Определенный формулой F.29) оператор SHn есть п-я
оптимальный информационный оператор,
г(Шп, S, T) = ±-d(n, 5, T) =
(ii) Определенный формулой F.30) алгоритм ф является
линейным, центральным, сплайновым и почти оптимальным по
сложности алгоритмом для E, Т) в УРи$ е (ф) = ' (9?„, 5, Т).
(Hi) 8-кардинальность (S, Т) в Ту выражается формулой
Ptf, S, Г, e) = min{n: е^
(iv) е-сложность E, Т) в Ч^ выражается формулой
s, S, Г, e)-F'l+fl)m(VCff S, Г, е)-1.|
Подчеркнем, что /1-й диаметр удивительно мал и чрезвычайно
быстро стремится к нулю при стремлении п к бесконечности.
Далее, даже при малых г, т. е. когда класс Зв состоит из
функций малой гладкости, е-кардинальность асимптотически равна
]/(lnl/e)/*0 , Например, если г~е~ш« 10~44, а /0==1, то
достаточно вычислить всего только десять функционалов (/, sin x),
..., (/, sin 1 Ох), чтобы решить эту задачу с точностью е, сколь
бы малым ни было значение г. Этот результат резко
контрастирует с ситуацией в предыдущих параграфах, где
е-кардинальность, равная приблизительно е~1/г, сильно зависела от г.
Мы доказали, что определенная формулой F.29) информация
Шп оптимальна. В вычислительной практике, однако, для задачи
F.26) обычно используют не эту ийформацию, а информацию
Интересно спросить, насколько хороша эта информация и как
много мы теряем, используя ее вместо n-й оптимальной
информации $1п. Из результатов работы Вайнбергера [72] легко
вывести, что для г = 2, т, е. для Tf = f,
r(®ni S, Т) = сп(е~Ч(п+1П с.6[1/3, 1].
.162 Ч. Ау гл. 6. Приложения к линейным задачам
Итак, г(Шп, S, T) = Q (е~!»/(п-{-1J), что значительно больше, чем
г($1п, 5, Т). Чтобы найти е-аппроксимацию, используя
информацию $1п, нужно выполнить
вычислений значений функции. Определяемый как отношение
кардинальности оператора' $1П(е) к е-кардинальности, е-шпграф
равен
m{4FU9S§T9B) \у ,4 in 1/8 у—"г- ПРИ
Итак, штраф как функция от е неограничен. Например, если
е = е~28, а ?0=1, то он превосходит 104! Это показывает, что
информация $1п крайне неэффективна.
Подчеркнем, что в нашей модели стоимость вычисления
значений для всех линейных функционалов предполагается
одинаковой. Таким образом, мы считаем, что затраты на вычисление
51я(/) = |/(я/(л+1)), ..., f(nn/(n+l))Y и 91Л(/)»[(Л sin*),
..., (/, sin ял;)]1 одинаковы. Обсудим, реалистично ли такое
предположение.
Для многих /, встречающихся в практике, например
многочленов, тригонометрических и некоторых специальных функций,
интегрирование (/, sin foe) можно выполнять в замкнутом виде
и стоимости вычисления (/, sin foe) и f(x) могут оказаться
сравнимыми. В этом смысле наше предположение выглядит
разумным. С другой стороны, если это предположение не выполнено
и вычисление (f, sin foe) в / раз дороже, чем вычисление f(x),
то вычисление $tjn(f) стоит столько же, сколько и вычисление
9tn(f). Так как г(Ш/п, 5, Т)=*в(е~Ч(}п)*) по-прежнему пропор:
ционально я~2, то асимптотическое поведение е-штрафа не
изменяется. Таким образом, $1п при малых е намного эффективнее,
чем $ljn. Это указывает на то, что даже в случае, когда вычисление
(f, sin foe) намного сложнее, чем вычисление f(x), все равно
следует использовать информацию Шп.
Подчеркнем, что сделанный выше вывод имеет силу лишь
в случае, когда интегрирование (/, sin foe) выполняется в
замкнутом виде. В случае когда (ft sinfot) аппроксимируется на
основе вычисленных в некоторых точках значений Д вместо
информации $1п используют информацию $lm(f) = [f(x1), /(x2),
..., f(xm)]{ при некоторых х19 х2, ..., хт и т. Тогда
погрешность любого алгоритма не меньше радиуса r($lm, S, Т), который
в свою очередь, как можно показать, не меньше G(m~2). Таким
образом, экспоненциальное убывание погрешности исчезает.
б. Линейные дифференциальные уравнения с частными производными 163
Закончим этот пункт замечанием о «глобальной» задаче,
связанной с задачей F.27). До сих пор мы интересовались
отысканием оптимальной аппроксимации функции и(х, t0) для всех
#€ [0, л] и фиксированного t0. Предположим теперь, что нам
надо найти аппроксимацию и(х, t) для всех х?[0, jtJ и всех
t?[09 л]. Иначе говоря,
F.32) Sf=*u.
Задачу F.32) можно решить при помощи алгоритма ф ($ln(f)9 х, t),
определенного формулой F.30) с t0, замененным на t.
Погрешность этого алгоритма ф определяется следующим образом:
Гс \1/а
e(q>)«sup sup (ф.О-Ф^й.х.О)^ .
f€% O<f<Jt\o /
Легко показать, что е(<р)=*@(п~г) и что n-й диаметр задачи
F.32) также равен в (п"г). Поэтому алгоритм ф почти
оптимален по точности для задачи F.32). Однако экспоненциальное
убывание его погрешности как функции от п исчезло.
При г = 2 оба информационных оператора Шп и $1п почти
оптимальны, так как
г(Щп> S, Т)~®(г(Ш„ S, Г))-вИ.
(Hi) Эллиптические дифференциальные уравнения
Конкретизируем теперь результаты (i) для случая, когда S
есть оператор решения для эллиптического дифференциального
уравнения.
Пусть Эо, 3^, 32 иГ определены, как и в п. (и). Рассмотрим
эллиптическое дифференциальное уравнение
при
F-33) и @, у) = и (я, у) = и (х, 0) ш 0 при х, у € [0, я],
и(х, л) = Дх) при х€[0, я].
где f€%. Определим оператор решения равенством
F.34) (Sf)(x)-tt(x, «/„), «/„€@, я),
т. е. S/—решение системы F.33), взятое при фиксированном
у = у<,. Как это сделано у Вайнбергера [72], методом разделения
переменных получаем, что
F.35) (Sf) (*)
164 Ч. А, гл. б. Приложения к линейным задачам
Таким образом,
и соотношения F.6), F.8) выполняются при «=1 и
с*-i (* > l) = sh (%0)/sh & я.
Из замечания 6.1 вытекает, что
Xk = (sh(ky0)/shknJ/kir.
Последовательность {Xk} убывает, и A,,fe = ^ft. Заметим, что
Учитывая замечание 6.1, заключаем, что информация
F.36) $1п(/) = [(/, sinx), (/, sin2x), ...,(/, si
есть n-я оптимальная информация, алгоритм
F.37) Ф ®ln (/)) - | ? (f, sin kx) ¦§*? sin fcx
shkn
— линейный центральный сплайновый алгоритм, а
, Т)
sh (/г+1)у0 _ te^iwg.ptl 1+0A)
Заметим, что ер—это взятие начального отрезка ряда S/. Как
и в параболическом случае, радиус является произведением двух
«хороших» сомножителей и представляет собой экспоненциально
убывающую функцию от п и г.
Проанализируем сложность этой задачи. Ясно, что е-карди-
нальность m=sm(WUt S9 T, г) равна наименьшему целому п, для
которого
1 sh(/i + l)y0 .
{п+\у sh(n+l)n ^
Отсюда получаем асимптотическое выражение
1П 1/8 V ^
В силу линейности оптимального по точности алгоритма F.37),
8-сложность (S, Т) в Wu выражается формулой
s S, Г, eJ-fo + aJmCF^ 5, Г, е)-1,
6. Линейные дифференциальные уравнения с, частными производными 165
где с±—сложность вычисления значений линейного функционала
вида (/, sin&x;), a?[l, 2]. Алгоритм F.37) почт оптимален по
сложности для E, Г) в Чи.
Подытожим эти результаты в виде следующей теоремы.
Теорема 6.3. Рассмотрим оператор решения эллиптического
дифференциального уравнения, заданный формулой F.34).
(i) Определенный формулой F.36) оператор $ln есть л-й
оптимальный информационный оператор,
г(Яя, S, T)-Td(n S Т)
(И) Определенный формулой F.37) алгоритм ср является
линейным, центральным, сплайновым и почти оптимальным по
сложности алгоритмом для (S, Т) в Ч^.
(iii) е-кардинальность E, Т) в Т^ выражается формулой
m (VU9 S, T, 8) - min {n: sh ((n + 1) */0)/(sh ((n + 1) л) (n + 1H < e}=
1П A/8) Л Г 1П 1П 1/8
Я-у0 Г 1П 1/8
(iv) е-сложность (S, T) в Т^ выражается формулой
F^, 5, Г, 8) = (c1 + a)m(^, S, Г, e)—1.
Мы показали, что n-й диаметр экспоненциально стремится к
нулю и что е-кардинальность асимптотически равна 1пA/е)(я—у0)
при каждом г. Например, если е = е~100у а г/0 = 1, то, для того
чтобы решить задачу с точностью 8, достаточно вычислить 50
значений (/, sinx), ..., (/, sin50^).
Как было отмечено в (И), n-я оптимальная информация $1п,
определенная формулой F.36), не является общепринятой в
вычислительной практике для задачи F.33). Обычно используется
информация
*.*-['Ш ¦'(¦&) '(Зг)Г-
Из результатов работы Вайнбергера [72], следует, что при г==2
г(ШпУ S, Г) = в(д-2).
Это значительно больше, чем- r($lny S, Т). Пусть п — п(е) —
наименьшее целое, для которого r($ln, S, Т) < г. Тогда _для
8-штрафа, т. е. отношения кардинальности оператора ШП(г)
к 8-кардинальности, справедливо соотношение
166 4. Ay гл. 6. Приложения к линейным задачам
Оно показывает, что информация Шп очень неэффективна. Из
проведенного в конце п. (И) обсуждения вытекает, что
информацию $1п следует использовать даже в том случае, когда
вычисление (f, sin foe) намного сложнее вычисления f (xk). Как и в п. (п),
скажем несколько слов о глобальной задаче, связанной с
задачей F.32). Она заключается в аппроксимации решения и(х, у)
уравнения F.33) для всех х, у?[0, я], т. е.
Алгоритм ф ($ln (/)) = ф ($1п (/), х, у) зададим снова формулой F.37)
с уо = у, а его погрешность Ьпределим равенством
Q\ 1/2
(и(х, у)—ф(ЭТ„(/), х, y)Jdx) .
/
Легко показать, что е(ф) = 0(/г~г) и п-й диаметр этой глобальной
задачи также равен Q(n~r). Поэтому для глобальной задачи
алгоритм ф почти оптимален по точности. Однако, как и в п. (i),
экспоненциальное убывание погрешности алгоритма как функции
от п исчезло. При г = 2 оба информационных оператора $1п и Шп
почти оптимальны, так как
(iv) Гиперболические дифференциальные уравнения
Применим результаты п. (i) к одному гиперболическому
дифференциальному уравнению. Пусть
а Н—гильбертово пространство функций на [0, я] со скалярным
произведением
п
if, g) = U(x)S(x)dx, [fl-VWrHi
о
функции ii, ?2, ... образуют ортонормированный базио в Н.
Включение f?H означает, что
/= —У^((/, smkx)smkx + (ft cos kx) cos kx)
2 ((/, sin kxJ + (/, cos kxJ) < + oo.
6. Линейные дифференциальные уравнения с частными производными 167
Пусть Р2л-1 = Р2/г = (—l)r/2 kr Vfc, где г—некоторое четное число.
Тогда
F.38)
i = {/: Д k2r ((Л sinfexJ + (f, cos?xJ) < + oo J ,
00
F.39) Tf = 2 (~я1)г/2 X kr ((/, sin fee) sin fejc + (/, cos fee) cos fee) = /<",
)
F.40) 30 =| / € 3X: 1 /<« ll2=(lL k2r Of. sinx)a+(/, cos fex)
Рассмотрим гиперболическое дифференциальное уравнение
ди(х, t) ди(х, t) о , n
F.41) IF—S-' *€R. *>0.
u(x, O) = f(x), x?R,
где f^^o- Определим оператор решения равенством
F.42) (Sf) (х) = и (х, tB), t0 > 0, x€ [0, я],
т. е. Sf—это решение системы F.41), взятое при фиксированном
*=»*,. Так как (Sf)(x) = f(x + t0), то
F.43)
со
= — 2^ {[(Л sinfe
f, sin /гх) sin kt0
со
— 2^ {[(Л sinfex)cos/г^0 — (/, cosfex) sinfe/0]sin&A; +
Отметим, что
S sin kx = cos kt0 sin kx -f- sin kt0 cos kxt
S cos kx = — sin &/0 sin &x + cos kt0 cos ^x.
Отсюда следует, что выполнено условие F.6) с и = 2, а 2x2-
матрица MV9 v = 2(fe—1), задается формулой
sin ЫЛ
„ cosfe/0J '
Так как строки матрицы Mv ортогональны, то мы получаем, что
где /—единичная матрица размера 2x2. Поэтому
и векторы
р
168 Ч. А, гл. 6. Приложения к линейным задачам
являются собственными векторами матрицы Fv. Тогда
Л2*-1 = tik-i = УШ sin kxy r\2k = l2k = У2/п cos kx
будут собственными векторами оператора /Сх.
Так как {Xk\—невозрастающая последовательность, можно
положить %i =^/j. Пусть п1=|_л/2_|, a n2 = 0 для четного п
и =(az + 1J для нечетного п. Из F.19) получаем, что
F.44) $1п(/) = [(/, sin*), (/, cos*), ..., (/, sin*!*),
(/, cosn^), (/, sinMPxKT/, %), (Г/, Лз), ..., G1/, л»)]'
есть /г-й оптимальный информационный оператор, а
гC1я, S, r) = id(n, S, Г)
Так как r(SR27l, S, Т)=г (?t2n+i, S, Т)=(д +1)-', то 2л-я
оптимальная информация является также и Bл + 1)-й оптимальной
информацией. Из F.21) вытекает, что
п
F.45) <р (%„ (/)) - -| ?{[(/, sin kx)coskt0-(f, cosfec) sin*/,]sln&e+
/г=1
+(/, cos ^*) cos &/0] cos
— линейный центральный сплайновый алгоритм,
е(<р) = гф12п, S, T) = r($l2n+U S, Г) =
Заметим, что ф представляет собой взятие начального отрезка
ряда Sf. Радиус информации не зависит от /0.
Экспоненциальные множители ехр (— (п + 1)^ /0) и ехр (— (п -f 1) (я—yo)).f
фигурирующие в выражении для е (ф) в случае параболических и
эллиптических уравнений, в гиперболическом случае отсутствуют.
Стоит, однако, отметить, что в гиперболическом случае класс 30
шире, чем соответствующий класс в параболическом и
эллиптическом случаях.
Проанализируем сложность этой задачи. Ясно, что е-карди-
нальность m = mDfi;, S, Т, г) равна наименьшему числу л, для
которого Г(п+ 1)/2]"г<е» т- е-
В противоположность параболическому и эллиптическому случаям
е-кардинальность решающим образом зависит от г. В силу
линейности оптимального по точности алгоритма F.45), е-сложность
(S, Т) в 4V выражается формулой
s, S, T, e)^(c1 + a)m(VU9 St T, е)-1,
7. Резюме и открытые вопросы 169
где сх—сложность вычисления значений линейного функционала
вида (/, sink*) или (/, cos/гл:), а?[\, 2]. Алгоритм F.45) почти
оптимален по сложности для E, Т) в Ч;а.
Подытожим эти результаты в виде следующей теоремы.
Теорема 6.4. Рассмотрим оператор решения 5 для
гиперболического дифференциального уравнения F.41).
(i) Оператор %п(/) = [(/, sin*), (/, cosx), ..., (/, sinnx),
(fr cosnx)]* задает одновременно Bя)-ю и B/z-j- 1)-ю оптимальные
информации,
±dBn9 S, T) = ±dBn+l9S9T) = (n+l)~'.
(ii) Определенный формулой F.45) алгоритм ф является
линейным центральным, сплайновым и почти оптимальным по
сложности для (S, Т) в WUf e(y) = r(%n, S, Г).
(ш) е-кардинальность (S, Т) в Wv выражается формулой
m(VU9 5, Т, e) = 2Le-^J.
(iv) 8-сложность (S, Т) в Wv выражается формулой
S, Г, eHfa + flOmOPy, 5, Г, в)—1.|
Подчеркнем, что п-е диаметры не зависят от точки ?0,
фигурирующей в F.42). Это значит, что для всех точек t0 задача F.42)
имеет одну и ту же сложность. Этим наше гиперболическое
уравнение резко отличается от параболического и эллиптического
уравнений F.26) и F.33), где сложность убывает с возрастанием /0
в случае параболического уравнения и с убыванием у0 — в
случае эллиптического.
7. РЕЗЮМЕ И ОТКРЫТЫЕ ВОПРОСЫ
Применив теоретические результаты гл. 1—5, мы отыскали
оптимальные по точности и почти оптимальные по сложности
алгоритмы, а также оптимальные информационные операторы
для ряда практически важных задач. Среди них —задачи на
интерполяцию, дифференцирование, интегрирование,
аппроксимацию и решение дифференциальных уравнений с частными
производными. Было проведено их исследование для определенных
классов 30. В большинстве случаев класс 30 определялся
оператором ограничений Т вида T = Drp, причем р обычно было равно
двум или бесконечности.
Для удобства читателей резюмируем и сравним некоторые из
полученных в этой главе результатов, касающихся
оптимальности и сложности. Для многих операторов решения были
рассмотрены информационные операторы
G.1) 91„(/) = [/(*i). /(*.), •••> /(*»)]'•
170
Ч. А, гл. 6. Приложения к линейным задачам
Для некоторых задач, например задач интерполяции и
дифференцирования, точки %i предполагались заданными заранее. Для
других задач, например задач интегрирования и аппроксимации,
были найдены оптимальные точки xh т. е. точки, для которых
радиус информации минимален.
Интерполяция: 5/=/(ДС0)
Таблица 7.1
Оператор ограничений
Т = 1
в гильбертовом
пространстве
аналитических функций C.34)
Радиус
О(п-П
(VR)n
Сложность
0(8-! tr)
0 (log 1/8)
Примечания
Х(—равноотстоящие точки
*о = 0,
Ссылки
теор. 3.1
теор. 3.3
Таблица 7.2
Дифференцирование: 5/= /' @)
Оператор ограничений
T=Di
Радиус
0 фп-Х)
Сложность
в(п)
Примечания
п нечетно
h мало
X2i=iht ^2/-! =
= — ih
Ссылки
теор. 2.2
Таблица 7.3
Интегрирование: 5/= \ f(x) dx
Оператор ограничений
T-Dr
Радиус
в(п-г)
Сложность
0 (8-1/0
0 (е-^О
Примечания
[а, &] = [0, 1]
Х( оптимальны
[а, 6] = [0, 2л]
п
гимальны
Ссылки
теор. 4.1
теор. 4.2
7. Резюме и открытые вопросы
171
Таблица 7.4
Аппроксимация: 5/=/
Оператор
ограничений
T=DL
t=dL
Радиус
Krfn/2-]-r
B/япК/Сг A+оA))
Сложность
6 (е-1/')
Примечания
*/ оптимальны
xi оптимальны
Ссылки
теор. 5.4
теор. 5.5
Информационные операторы G.1) широко используются на
практике. Для некоторых операторов решения, например в
задачах интегрирования и аппроксимации, они обладают
определенными свойствами оптимальности. В табл. 7.1—7.4собраны
результаты по оптимальности и сложности для информационных
операторов G.1) в четырех задачах при 30 = {/: ЦТ/1|^ 1} с различными
операторами ограничений.
Мы видим, что во всех случаях, когда в этих задачах
фигурирует параметр регулярности г, сложность асимптотически
равна 8-1/г, т. е. является убывающей функцией от г. Это
соответствует интуитивному представлению о том, что более регулярные
задачи решать легче. Остаются открытыми следующие вопросы:
(i) Верно ли в общем случае, что более регулярные задачи
имеют меньшую сложность?
(И) Как охарактеризовать класс операторов решения, для
которых сложность асимптотически равна е-1/' при
информационных операторах G.1) и %0=Wrp?
Для аналитических функций сложность интерполяции
асимптотически равна log 1/8. Известно также (Боянов [74]), что
сложность интегрирования для таких функций асимптотически равна
(log 1/еJ. Остается открытым вопрос:
(Hi) Каков для аналитических функций общий вид
операторов решения, сложность которых асимптотически равна
некоторой степени log 1/е?
В случае аппроксимации информационный оператор G.1) с
оптимально выбранными точками является n-м оптимальным
информационным оператором для класса #» или Н?«. Остаются
открытыми вопросы:
(iv) Справедливо ли это для задачи аппроксимации с 30 =
¦Wrp
или Wrp при произвольном значении р?
(v) Каков общий вид операторов решения, для которых п-я
оптимальная информация имеет вид G.1)?
172 Ч. А, гл. 6. Приложения к линейным задачам
Большинство приведенных выше результатов существенно
зависит от выбора конкретной нормы и класса 90. При нормах,
отличающихся от указанных выше, известно иногда лишь
асимптотическое поведение радиуса информации; точное его значение
неизвестно. В лучшем случае известны лишь почти оптимальные
информационные операторы. Важно расширить наши знания о
точных значениях радиуса информации и об оптимальных
информационных операторах при различных способах выбора нормы
и/или класса Эо.
В § 6 мы рассмотрели по одному примеру параболического,
эллиптического и гиперболического дифференциальных
уравнений. Для параболических и эллиптических задач были получены
удивительные результаты, состоящие в том, что информационные
операторы G.1) значительно отличаются от га-х оптимальных
информационных операторов, га-й радиус информации
исключительно быстро стремится к нулю, а сложность асимптотически
независима от регулярности функций из 30. Результаты § 6
собраны в табл. 7.5—7.7, где приведены га-е оптимальные
информационные операторы, их радиусы и сложности.
Эти задачи поразительно различаются по сложности. Мы не
знаем, является ли это случайным свойством выбранных нами
примеров или же так обстоит дело и в общем случае. Очень
важной представляется нам проблема
(vi) Для насколько общих параболических уравнений,
эллиптических уравнений и гиперболических уравнений сложность
асимптотически равна соответственно Klog 1/e, log 1/е, е-1/'?
Во многих случаях мы смогли установить оптимальность
информационных операторов, используя глубокие результаты из
теории аппроксимации. Особенно плодотворными оказались
взаимосвязи между га-поперечниками и n-ми диаметрами информации.
Хотя пока га-поперечники по Гельфанду или Колмогорову
известны лишь в немногих случаях, в последнее время в этой
области ведутся интенсивные изыскания. Можно предположить, что
прогресс в теории га-поперечников приведет к дальнейшему
прогрессу в теории аналитической сложности. Мы полагаем, что
исследования по теории аналитической сложности и теории
аппроксимации дадут в скором будущем как в той, так и в другой
области много новых результатов об оптимальности.
В заключение подчеркнем еще раз, что нашей главной целью
в этой главе было просто проиллюстрировать теорию
аналитической сложности на конкретных примерах. Мы ожидаем, что
для многих практически важных операторов решения проблема
нахождения оптимальных информационных операторов будет
интенсивно разрабатываться. Эти исследования должны привести
7. Резюме и открытые вопросы
173
к мощным и надежным алгоритмам, которые можно будет
использовать в практических вычислениях.
Таблица 7.5
Параболическое уравнение F.24): Sf=u(*, t0)
п-й оптимальный оператор задается формулой
Я* (/) = [(/, sin*:), ..., (/, sin /up)]*
Оператор
ограничений
г-«
а-й радиус
ехр (-(»-!)%)
Сложность
Примечания
/ нечетно
г четно
Ссылки
теор. 6.2
Таблица 7 А
Эллиптическое уравнение F.32): ?/=»(•, y0)
/2-й оптимальный информационный оператор задается формулой
*»„(/) = [(/, sin*), <.., (/, sin/«)Jt
Оператор
ограничений
п-й радиус
ехр(—(/г+1) (п—уо)) п , Л /1U
(я+1)Г
Сложность
0 (log 1/8)
Примечания
/ нечетно
г четно
Ссылки
теор. 6.3
Таблица 7J
Гиперболическое уравнение F.41): 5/==«(», t0)
п-й оптимальный информационный оператор задается формулой
У1п(/) = [(/, sin*), (/, cos*), ..., (/, sfn/ix*), (/, cosa*!*), (/, sin/z2*)]t,
где «i=Ln/2J» «2= Of если л четно, и =(/г+1)/2, если /г нечетно
Оператор
ограничений
T=Dr2
n-fi радиус
Г(п+1)/2~]-г
Сложность
0 (е-1/')
Примечания
/• четно
Ссылки
теор. 6.4
174 4. At гл. 7. Теория нелинейной информации >__
Глава 7
ТЕОРИЯ
НЕЛИНЕЙНОЙ ИНФОРМАЦИИ
1. ВВЕДЕНИЕ
В этой главе изучаются нелинейные информационные
операторы. Мы обобщим понятия кардинальности и оптимальности на
случай нелинейных информационных операторов фиксированной
кардинальности. Будет доказано, что для любого
информационного оператора кардинальности п существует нелинейный
информационный оператор с тем же диаметром и кардинальностью,
равной единице. Мы докажем также, что найти точное решение
задачи S (не обязательно линейной), зная значение лишь одного
соответствующим образом выбранного нелинейного функционала,
можно в том и только том случае, если мощность множества S (<30) не
превосходит мощности континуума.
Эти результаты показывают, что класс нелинейных
информационных операторов кардинальности единица доставляет
информацию, достаточную для точного решения многих задач. Однако
оптимальные нелинейные информационные операторы обычно не
являются регулярными и во многих случаях не являются
допустимыми. По этой причине распространение результатов гл.2—5
на нелинейные информационные операторы, хотя во многих
случаях и возможно, представляет в основном чисто теоретический
интерес.
Дадим краткий обзор результатов данной главы. В § 2
вводится понятие кардинальности нелинейной информации. В
следующем параграфе показывается (теорема 3.2), что всегда
существует нелинейный информационный оператор кардинальности
единица, для которого диаметр информации по существу так же
мал, как и n-й минимальный диаметр. Класс задач, которые
можно решить точно, зная значение одного соответствующим
образом выбранного функционала, полностью охарактеризован
теоремой 3.3. В § 4 исследуются связи между п-поперечниками
по Колмогорову и погрешностями д-мерных алгоритмов, а также
между е-энтропией и кардинальностью информационных
операторов с радиусом информации, меньшим 8.
2. КАРДИНАЛЬНОСТЬ НЕЛИНЕЙНОЙ ИНФОРМАЦИИ
Обобщим теорию кардинальности линейной информации,
развитую в § 2 гл. 2, на случай нелинейной информации. Пусть
5R—информационный оператор. Как было показано в § 2 гл. 1,
радиус и диаметр информации $1 для задачи S зависят только
2. Кардинальность нелинейной информации 175
от множеств
B.1) V(f)~V(f, Я)Н/: ЗД = ЗД и f€3J.
Это наводит на мысль, что не следует различать два
информационных оператора с одними и теми же множествами V (/)
V/3
e
Пусть Шг: Ак,—*33 и 5R2: D$k2—*3з—два информационных
оператора, причем ^oczD^ ПАк2, а Зз—линейное пространство,
не обязательно совпадающее с 33.
ОПРЕДЕЛЕНИЕ 2.1. Будем говорить, что информация Ыг
содержится в 9?2 (запись Щгс:$12)у если
V(f9 %)
Будем говорить, что Щ^ эквивалентна $12 (запись: 91Х X 91в), если
Заметим, что соотношение З^сЗ^ означает, что Щ2(/) =
= §R2(/)=»^1(/) = ^1(/) для всех /, /63О. Отношение „X" явля-
ется отношением эквивалентности. Удостоверимся, что в линейном
случае определение 2.1 совпадает с определением 2.1 гл. 2.
Лемма 2.1. Пусть 31,—линейный информационный оператор,
Dsfi. =3, при /=1, 2, а 30 — поглощающее множество в
пространстве Зх. Тогда
B'2) ^ X % & кег ЭТ2 = кег %.
Доказательство. Предположим, что Э^сЭДа, и пусть 2
Поскольку 30 — поглощающее множество, существует
положительное число c = c(h), такое что ch?$0. Далее, ch?V@, 9?2),
поскольку 0^30. Поэтому ch?V(О, Щх) и, следовательно, 9?г(сА) =
= сШг (h) = 0. Итак, h g ker 9?!, откуда следует, что кег !ЭТ2 с
Предположим теперь, что кег^сгкег^, и пусть}?V(ft
Для /i = f—/ тогда имеем 5R2 (/г) = 0, т. е. /i ^ ker 5R2 и /i
Поэтому O = 3l1(ft) = 9?,(/) — 9U/)> т. е. f€^(/, SIJ.
Следовательно, V(/, sJi2)cl/{/, 9^) и, таким образом, З^с:^.
Для доказательства второго из утверждений B.2) заметим,
что 3?! X 9J2 означает справедливость двух включений Э^сЭТа
и 9?2с9?ь а это в силу первого утверждения равносильно
равенству кег Ш2 == ker $lv I
Выведем теперь связи между радиусами и диаметрами
содержащихся друг в друге, а также эквивалентных друг другу ин-
176 Ч. Л, гл. 7. Теория нелинейной информации
формационных операторов.
Лемма 2.2. Справедливы следующие импликации:
B.3) %с:Ш2=>г(т2, S)^r(miy S) и d(m2, S)<d(^, 5),
B.4) Э^хЯ, => г (%, S) = г (911Э 5) и d (Э?2, S) =
Доказательство. Пусть ^с^. Тогда К(/, ЭТ2)сК(/, Э^)для
любого /€30. Отсюда (У (/, 0i2) = S(K(/, %))aU(f, %) =
= S(V(/, Эу) и radf/(/, ^2)<radf/(f, ЭТХ), diam(/(f, ^2)<
^diamf/^, SRj). Взяв верхнюю грань по f€30, получим B.3),
в силу соотношений B.9) и B.10) гл. 1. Импликация B.4) легко
следует из B.3). 1
Пусть
B.5) п = dim lin STC C0), 0 < п < + оо,
т. е. п—наименьшее неотрицательное целое число, для которого
найдется линейное подпространство А размерности п, содержащее
9?C0) (или бесконечность, если такого числа не существует).
Если А = lin(?/)*€/» гДе h—некоторый базис А, и мощность
множества / равна nt card(/) = n, то
B.6) Я(/)-2?/<06, Vf€3o,
где функционалы Lh вообще говоря, нелинейны. Если п = + °°
и в 33 не введено никакой топологии, то предполагается, что
для каждого / ? 30 лишь конечное число значений Lt (/) отлично
от нуля.
Покажем, что любой информационный оператор можно
представить с помощью tt = dimlin9ZC0) функционалов. Определим
информационный оператор 5ftx: Зо-^С" формулой
B.7) % (Я = [?/(/)]!•/, n-card(/),
где п и L/ заданы равенствами B.6) и B.6).
Лемма 2.3. Пусть Ш и 9^—определенные выше операторы.
Тогда
B.8) «X«i.l
Доказательство. В силу B.6), равенство Щ(/) = $У?(/)
эквивалентно тому, что L{ (f) = L/ (f) при t € /. Поэтому 9i (f) = ЭД (/) тогда
и только тогда, когда 9?i(/) = 9?i (f), чем B.8) и доказано. |
Лемма 2.3 утверждает, что любой информационный оператор
эквивалентен информационному оператору, заданному п
функционалами. Это приводит к следующему определению
кардинальности 01 в 30.
3. Оптимальная нелинейная информация 177
ОПРЕДЕЛЕНИЕ 2.2. Величину card(9i, 30), задаваемую
формулой
B.9) card (97, 30) = dimlin$ftC0),
будем называть кардинальностью информации $1 в 30.1
Удостоверимся, что в линейном случае определение 2.2
совпадает с определением 2.2 гл. 2.
Лемма 2.4. Пусть ЭТ—линейный информационный оператор,
Дя = 31, а 30—поглощающее множество в пространстве Зх. Тогда
B.10) card C1, 30)
Доказательство. Так как dim 5ft (Зх) = codim kerSft, то
достаточно доказать первое равенство в B.10). Пусть ge^^), T. e.
g = $1 (f) для f ? 3i. Существует такое положительное число с = с (/),
что с/€30 и 0l(c/N 9d(So)clin9lCo). Поэтому ?€НгШC0),
откуда 91 C0 с Нп 31 C0). Поскольку обратное включение
тривиально, мы получаем B.10). |
3. ОПТИМАЛЬНАЯ НЕЛИНЕЙНАЯ ИНФОРМАЦИЯ
В §§х4 и 6 гл. 2 были определены я-й минимальный диаметр
и п-я оптимальная информация для класса линейных
информационных операторов кардинальности не выше п и для линейных
операторов решения. Здесь мы распространим эти понятия на
класс нелинейных информационных операторов $1 с card ER, 30)^
^.п для нелинейных операторов решения. В § 6 гл. 2 мы ввели
класс ?„, состоящий из всех линейных информационных
операторов с card (Ш)^ п. Расширим теперь этот класс *?п и будем
считать, что в него входят все, линейные или нелинейные,
информационные операторы с card C1, 30) ^ п.
ОПРЕДЕЛЕНИЕ 3.1. Будем называть величину d(n, S),
задаваемую формулой
C.1) d(nf S) = inf d(dt, S),
п-ы минимальным диаметром информации для задачи S. Будем
говорить, что 9loi есть п-я оптимальная информация, если
C.2) 4(ЭД, S) = d(n9 S), ^€^.1
Как было показано, в линейном случае последовательностью
п-х минимальных диаметров может быть любая невозрастающая
последовательность. Покажем, в нелинейном случае
последовательность п-х минимальных диаметров постоянна, d(ny 5) =
aasd(l, S). Для доказательства этого довольно неожиданного
результата нам понадобится следующая теорема.
178 Ч. А, гл.7. Теория нелинейной информации
Теорема 3.1. Для любого информационного оператора 9i с
card (91, 30) = /г< + оо существует такой информационный
оператор 9tlf что
C.3) 9^ X 91 и card ERlf 80) = 1. |
Доказательство. В силу леммы 2.3, 9J X [?i> L'2, ..., /,„]* для
некоторых функционалов L). Положим
Ly(f) = j КеМ/Ь /-1- 2' ••- ">
Пусть с = [с0, cf, ...], где Cj—либо нуль, либо единица,
причем лишь конечное число величин Cj с нечетными индексами /
равно единице. Положим
со со
C.4)
Функционал Lj(f) = ^% <»ck% f2k с cktJ. = cfe%y. (/)€{0, 1} можно
представить в виде Lj(f) = g([cQt/, с1ч/] с_1%/, ...]). Располагая
функционалами Lj(/), L2(/), ...', L2%n(f)> определим функционал
L следующим образом: L(/) = g([c0, clf с-ь ...]), где ck = [cktl9
ch>2> • • •» ck* 2«] V?. Положим
C.5) %(f)-=L(f) V/e30.
Очевидно, что card (9^x, 30)= 1. Мы утверждаем, что 91хЖ9?.
Действительно, L(/) = L(/) означает, что cft(f) = cft(/) Vfe, а это
эквивалентно равецствам LI (/) —L/ (/) для /=1,2, ... , я. Итак,
9?х X [?1, ^2, • - • > ^«l1 X 9с. Тем самым C.3) доказано. | Х)
Заметим, что r($lu S) = r(9l, S) и d(9^, 5) = d(9?, S), в силу
леммы 2.2. Таким образом, теорема 3.1 утверждает, что для
информационного оператора 9i произвольно конечной
кардинальности существует функционал, который один дает в точности
ту же информацию, что и 9J.
Используя лемму 2.1, легко показать, что последовательность
П'Х минимальных диаметров постоянна.
Теорема 3.2. Для любого оператора решения S
C.6) d(n% S) = d(l, S)
Доказательство. Пусть б > 0. Выберем такой
информационный оператор 9Z, что card (9i, 30)<п и d($1, S)<d(я, S) + 6.
По теореме 3.1 существует такой оператор 9?ъ что card (91Ь Эо) = 1
1) В доказательстве теоремы содержатся некоторые (по-видимому, легко
восполнимые) пробелы,— Прим. ред, и перге,
8. Оптимальная нелинейная информация 179
п%Х\Ш. Следовательно, d(l, S)<d(Sttlf 5) = d(9i, 5)<d(n, 5)+6.
В силу произвольности б получаем, что d(l, S)^d(n9 S).
Противоположное неравенство очевидно. Тем самым C.6) доказано. |
Теперь мы хотим охарактеризовать операторы решения S, для
которых d(l, S) = 0, т. е. операторы, для которых отвечающие
им задачи можно решить точно, зная значение одного
соответствующим образом выбранного функционала.
Теорема 3.3. Равенство
C.7) d(l, S)=0
выполняется в том и только том случае, если мощность
множества SC0) не превосходит мощности континуума, т. е.
card(SC0))<©. |
Доказательство. Предположим сначала, что d(lf S) = 0. Это
значит, что для каждого положительного целого i существует
такой информационный оператор 9lh что card(9?;, 30)= I, a
d(dlh S)^2-/. Без потери общности можно считать, что 9^ (/) =
= Lt (f) для некоторого функционала Lt. Пусть / ? 30, a y = [Lt (/),
L2(/), ...]. Выберем ft$V{ff SR,)H?€3.: Li(f) = Ll(f)} и
определим функцию ф формулой
C.8) 9(j/) = |(S(fl4i)-Se при
Функция ф: ЯфССГ-^За определена корректно, так как
l|S(//+s)-S(/f)»<||S(/,+1)-5(/) 11 + 15(^-5
и ряд в C.8) сходится. Далее,
и поскольку правая часть стремится к нулю при Л-^ + оо, то
() 5(/) Отсюда
card (S C0)) = card (ф (Оф)) < card (Оф) < card (С00) = ©.
Этим завершается первая часть доказательства.
Предположим теперь, что card (S (So)) ^ ©. Это означает, что
существует взаимно-однозначное v отображение g: S C0) —> R.
1) Имеется в виду взаимно-однозначное отображение б (т. е. инъективное),
а не на (биективное).— Прим. pedt
180 Ч. Л, гл. 7. Теория нелинейной информации
Определим информационный оператор Ш формулой
C.9) 97(/)=?(S(/)).
Очевидно, card($ft, Эо) ^ 1. Для доказательства равенства d(lt
S) = 0 заметим, что алгоритм
(ЗЛО)
имеет погрешностье (ф) = 0. Поэтому d(l, S)<d (91, S)<2e((p) = 0,
что и завершает доказательство. |
Предположение о том, что card (S C0)) ^ ©, выполняется для
многих практических задач. Оно выполнено, например, если
SC0) является подмножеством алгебраической суммы А + Ву где
А—конечномерное линейное подпространство в Эо> а замыкание
множества В компактно в 32.
Покажем теперь, что если card(SC0)) > ©, то d(l, 5) может
быть даже равным бесконечности.
ПРИМЕР 3.1. Пусть йо = 31 = 32—множество всех комплекс-
нозначных функций, определенных на комплексной плоскости С,
таких что I/11 = sup/€ о |/@1 < + °°- Положим 5/ = / и покажем,
что
C.11) d(l9 S) = +oo.
Действительно, допустим противное—что существует
информационный оператор $ с card (Ш, 30)=1, для которого d(9i, S) =
= d < + оо. Без потери общности можно считать, что $l(f) = L (/),
где L—некоторый функционал. Пусть X = LC0). Для каждого
t?X выберем такую функцию fu что L(ft) — t. Тогда для любой
функции /?30 с L(f) = t имеем
C.12) I/—/tI<diamV(/t)<d(SRf S) = df
где V(/t) определено формулой B.1). Положим
Г /t@ + d + l. если t?X и l/t@|<d+l,
^ ' ' ' ^ \ 0 в противном случае.
Ясно, что /€30, так как (/К 2d+l < + <». Пусть y = L(f).
Тогда
что противоречит неравенству C.12). Следовательно, d (Щ, 5)= + оо
для любого 5R с cardER, Эо)< 1, откуда d(l, S) = 0. Тем самым
C.11) доказано.
Итак, d(n, S)= + оо Vn <^оо, в силу теоремы 3.2. Это
значит, что не существует нелинейного информационного
оператора, даже сколь угодно высокой кардинальности, который
3. Оптимальная нелинейная информация 181
давал бы информацию, достаточную для решения данной задачи
с конечной погрешностью. |
Обратимся теперь к модели вычислений. Как всегда, нужно
определить набор Р простейших операций. В гл. 5 мы
использовали идеализированную модель, в которой предполагалось, что
вычисление значения каждого линейного функционала —
простейшая операция. Здесь рассматриваются информационные
операторы, задаваемые нелинейными функционалами. Если
предположить, что вычисление значения любого нелинейного
функционала—простейшая операция, то каждый нелинейный
информационный оператор конечной кардинальности окажется допустимым.
Однако нам кажется, что это предположение нереалистично.
Рассмотрим в качестве иллюстрации пример.
ПРИМЕР 3.2. Пусть 30 = Э1 = 32—пространство всех
вещественных непрерывных функций на [0, 1] с нормой ||/|| =
= тахо < *< 11 /(t) |. Положим Sf = /. Как хорошо известно,
card(SC0)) = @, поэтому d(l, 5) = 0 по теореме 3.3. Кроме того,
из доказательства теоремы 3.3 мы знаем, что алгоритм
C.14) фДОМ-йГЧЖЙ). K(/H*(S<f)),
где g: S C0)—*R—взаимно-однозначное отображение, обладает
погрешностью е(ф) = 0 (см. C.9) и C.10)). Конкретизируем
алгоритм C.14) для нашей задачи. Пусть {w(}^—последовательность
всех рациональных чисел из [0, 1], и пусть /,.=/ О^О—^Г—оА, fi~h>
где скч i = ck% /(/)€{0, 1}. Так как мощность множества
4 = {(Ci(f), с2(/), ...): с; (/) = (..., с_1э/, c,%it cUi, ...) для /63О}
равна ©, то существует взаимно-однозначное отображение hi
А —* R. Положим
C.15) ^(/) = A((Ci(/), c2(/), ...))•
Отображение g взаимно-однозначно. Действительно, g(f)=:g(f)
влечет с? (/) = с{ (/) Vt, так как h взаимно-однозначно. Поэтому
ffarf^ffai). Поскольку множество {wt) плотно в [0, 1], а
функции /, / непрерывны и их значения совпадают в точках wit то
f=/\ Заметим, что для вычисления gi(f) = g(f) (т. е, для
вычисления значения нелинейного функционала g) нужно знать с7 (/),
т. е. значения / во всех рациональных точках отрезка [0, 1]. За
исключением тривиальных случаев, это невозможно.
Таким образом, включение операции вычисления значения
нелинейного функционала $l(f) = g(f) в набор простейших
операций нереалистично. |
182 Ч. Л, гл 7. Теория нелинейной информации
Мы надеемся, что этот пример проясняет, почему класс всех
нелинейных информационных операторов конечной
кардинальности редко вызывает практический интерес и почему даже для
нелинейных задач представляет интерес изучение класса
линейных информационных операторов и/или соответствующим образом
ограниченного класса нелинейных информационных операторов
(см. гл. 8, где обсуждаются линейные информационные операторы
и некоторые нелинейные информационные операторы для
нелинейных уравнений, а также часть В, где изучаются линейные
„итеративные" информационные операторы для нелинейных задач).
4. СВЯЗИ С ^-ПОПЕРЕЧНИКАМИ
ПО КОЛМОГОРОВУ И ЭНТРОПИЕЙ
Это—третий параграф, посвященный исследованию
взаимосвязей между теорией аппроксимации и теорией аналитической
сложности.
(i) Начнем со связи между л-поперечниками по Колмогорову
и погрешностями я-мерных алгоритмов. Напомним читателю
определение п-поперечника по Колмогорову dn(X, Э2)
уравновешенного подмножества X нормированного линейного
пространства 32:
D.1) dn(Xt 32) = infsup inf \\x-a\\,
Ап xgX ъА
где Ап—подпространство в 32 размерности не выше п. Пусть
Ап = \тAи 1%9 ..., у. Тогда infeei4|| Ц*—a| = infCl, .. .,Сп\\х —
— 2?-1с/Б/1» это—погрешность наилучшей аппроксимации
элемента х элементами из Ап. Таким образом, n-поперечник по
Колмогорову—это минимальная погрешность аппроксимации
множества X я-мерными линейными пространствами (см. статью
Колмогорова [36], где введено это понятие, а также книгу
Лоренца [66]).
Выявим взаимосвязь между л-поперечниками по Колмогорову
и погрешностями n-мерных алгоритмов. Пусть 5R—произвольный
информационный оператор (не обязательно линейный), и пусть
D.2) Ow(9fl) = {(p
есть класс алгоритмов, использующих этот информационный
оператор и имеющих множество значений размерности не выше п.
Рассмотрим
D.3) Фл=и<Р„(ЭД
т
— объединение таких классов алгоритмов по всевозможным
информационным операторам. Наконец, пусть
D.4) d.=
4. Связи с п-поперечниками по Колмогорову и энтропией 183
обозначает я-поперечник по Колмогорову множества решений
S(S0) в 3..
Теорема 4.1. Справедливо равенство
D.5) inf е(ф)«?*я. I
вФ
Доказательство. Пусть ф?Ф„. Тогда существует такой
информационный оператор Щ9 что dimlin<p(9lC0))^ft. Это значит, что
для некоторых элементов glf g2, ..., ?й из 30. Далее,
е (Ф)- sup ||S (/)-Ф (91 (/)) || > sup inf IS (/) - 2 C/g, I
> inf sup inf S(/)-2c& \=dn.
В силу произвольности ф имеем Ы{е(ф): ц>?Фп\^с1п Докажем
противоположное неравенство. Пусть Ап—линейное
подпространство размерности не выше я, такое что
sup inf || х—a||^dw + 8,
*€SC0) asAn
где 6—некоторое положительное число. Это значит, что для
каждого Sf, / € 30 существует такой элемент а = 2?-i ct ($f) h ^ An*
что
D.6)
Рассмотрим информационный оператор (вообще говоря,
нелинейный)
«tf)-MS(/». c2(S(f)h .... cn(S(f))Y
и алгоритм
t = 1
Ясно, что cardC1, Su)<ai и сНтНпф(9?C0)Хя. Следовательно,
Ф^Фге. В силу D.6), е(ф)<с(Л + б. Поскольку 6 произвольно,
получаем, что Ы{е(ф): ф€Фп}^^Я1 чем и завершается
доказательство. |
Теорема 4.1 утверждает, что погрешность любого я-мерного
алгоритма не меньше дг-поперечника по Колмогорову множества
решений. Более того, эта оценка снизу точна. Как уже упоми-
184 4. А, гл. 7. Теория нелинейной информации
налось в § 5 гл. 3, этот результат был получен многими
авторами для различных конкретных линейных задач, обычно для
класса линейных алгоритмов.
(и) Обсудим теперь связь между е-энтропией множества
решений 5C0) и кардинальностью информационного оператора Ш
с радиусом г (ЭД, S) < е.
Напомним читателю определение е-энтропии подмножества X
нормированного линейного пространства 32. Пусть k обозначает
минимальное число подмножеств Ul9 U2, ..., Uk пространства 3>2,
образующих е-покрытие X (т. е. диаметр каждого из множеств Ut
не превышает 2е и эти множества покрывают X: X(J?/)
Тогда г-энтропия X определяется как
D.7) Н (8, X) = l
где log—логарифм по основанию 2 (см. статью Колмогорова [55],
где введено это понятие, а также книгу Лоренца [66]).
Покажем теперь, как, зная е-энтропию множества S(X), где
ХсЗо, можно иногда оценить снизу кардинальность
информационного оператора с радиусом r($l, S) < е. Пусть S—линейный
или нелинейный оператор решения, а $1—линейный или
нелинейный информационный оператор с г(!ЭТ, 5) < е. Разумеется,
5R = 9t(e). Без потери общности можно считать, что
для некоторых (вообще говоря, нелинейных) вещественных
функционалов Ll9 L2, ..., Ln, где п = сагс1(ЭТ, 30). Допустим, что для
подмножества X в 30 существует такое вещественное число
Л1 = М(е), что
D.8) $Я(Х)с[— М9 М]п.
Тогда, как известно, Я(е, 3t(X))^nlog(M/eI}. Так как, по
предположению, г (Ш, S) < е, то существует алгоритм <р,
использующий $1, с е (ф) < е. Положим
D.9) К = К(г)= sup ЦфЫ-фЫ[|,
(ft. У г) 6 У
где Y—множество всех пар (уи #2), у^Ш(Х)у таких что
f #i—#2lU^S2e. Таким образом, К (г) в некотором смысле
характеризует свойство непрерывности алгоритма ф. Если
ф—Липшицев оператор, то /С(е)<С(ф)8 Vs > 0. Будем предполагать, что
К (г) конечно. Мы подготовлены к тому, чтобы доказать
следующую теорему.
Х) Предполагается, что диаметры множеств покрытия вычислены в
метрике, задаваемой нормой \\-\\ж.—Прим. перев.
4. Связи с п-поперечниками по Колмогорову и энтропией 185
Теорема 4.2. Пусть Ш—информационный оператор, такой что
n = card(9t, 30) и г (91, 5)<е, и пусть М (е) и /С (е) определены
формулами D.8) и D.9). Тогда
Доказательство. Пусть L^, t/2, ...., (/Л образуют е-покры-
тие 91 (X). Тогда ?<(Л1/е)я в силу D.8). Заметим, что ?/,гШ(Х)
непусто. Пусть #,€ ?//fl9t(X), a V,- = {x: ||х—Ф (*//)!<?[, где
? = е + К(е). Покажем, что Vu V2, •••> У* образуют ?-покрытие
множества S(X). Достаточно доказать, что S(X)cUi^/. Для каж*
дого /?Х существует такое yh что |91(/)—У/[^2е. В силу D.9)
и неравенства б(ф)<е, имеем
115 (/)-Ф {Уд\ < II5 (/)-Ф Eft (Щ + i Ф (JR (/))-Ф (у()\\
Таким образом, S(/)€ V/, откуда следует, что S(X)cU*VV
Следовательно, #(?, S(X))^log^^nlogM/e. Тем самым D.10)
доказано. |
Для нелинейных информационных операторов может случиться,
что /С(е)/е стремится к бесконечности при стремлении 8 к нулю.
Действительно, предположим, что card (S C0)) ^ © и Я (в,
SC0))/log(l/e) стремится к бесконечности при стремлении 8 к нулю.
Как было показано в § 3, существует (нелинейный) функционал
Lu который дает информацию, достаточную для точного решения
задачи 5. Далее, можно обеспечить, чтобы Ьг C0) лежало в
некотором конечном интервале, а это значит, что D.8) выполняется
с положительной константой М, не зависящей от 8. Нами был
также построен алгоритм ф, использующий Lx\ с ?(ф) = 0. Так
как л = card(91, 30)=1, то из D.10) с Х = 30 следует, что
К(е)/е—* + оо при 8-^0. Таким образом, ср не является липши-
цевым оператором.
Эту ситуацию стоит сопоставить со случаем линейных
информационных операторов, для которых D.8) и D.9) часто
выполняются с Л1 = 1 и /С(е)<Се. Действительно, пусть $l = [LuL2i ...,
LJ*—линейный информационный оператор. Предположим, что Lt
непрерывны на некотором выпуклом уравновешенном множестве X.
Тогда без потери общности можно считать, что 1Ь{\Х=\, откуда
9?(Х)с[—1, 1]п. Итак, D.8) выполнено при М=1. Пусть ф —
произвольный алгоритм, использующий Sft, с е(ф)^8. Тогда
186Ч. А, гл. 7. Теория нелинейной информации
где 9l(/:1) = f/1, 9t(/2) = #2 и f1? /2?Х. Положим
G(e)= sup inf{||S(/1)-5.(y|:/1J26X,^(/J = i/
II г/i —halloo <2e
Заметим, что G зависит от S и 9i. Если G (г) <сх8, то D.9)
выполняется с
К(г) = B + с1)е = с2е.
Для многих множеств S(X) справедливо соотношение
#(A+с2)е, S(X)) = #(e, S(X))(l+o(l)). В таком случае
теорема 4.2 утверждает, что кардинальность любого
информационного оператора с радиусом, меньшим е, должна удовлетворять
неравенству
DЛ1> п>н&т))^1+0^ для малых 8-
Проиллюстрируем теорему 4.2 и оценку D.11) следующим
примером.
ПРИМЕР 4.1. Пусть З^С00—пространство бесконечно
дифференцируемых вещественных функций на [—1, 1] и 30 = '30(^) —
подмножество тех функций / из 3^ которые продолжаются до
аналитической функции в ??, ограниченной по модулю единицей.
Здесь область ?? комплексной плоскости—это внутренность
эллипса с фокусами ±1 на вещественной оси и с суммой
полуосей ?> 1.
Пусть Sf = f—оператор аппроксимации, а
где Xy = cos(B/—1)я/B/г)), /= 1, 2, ..., п. Из результатов
Осипенко [72] следует существование линейного оптимального по
точности алгоритма ср, удовлетворяющего условию D.9) при
/((е) = 0(8), с погрешностью
Заметим, что 9iC0) = [—1, 1]п и, таким образом, D.8)
выполняется для X = 30 при М = 1. Для обеспечения неравенства
г (?t, S) < е нужно, чтобы
D-12) ">тёт^A+0A)) при малых 8-
Витушкин [59] нашел е-энтропию множества S(90):
D.13) A^У)J
/. Введение 187
Таким образом, из теоремы 4.2 следует, что кардинальность
любого информационного оператора с радиусом, меньшим 8, для
которого Л1 == 0 A) и /((е) = О(е), удовлетворяет неравенству
Заметим, что правые части D.12) и D.13) различаются
множителем 1/2. Это доказывает, что кардинальность информации,
состоящей из значений функции в чебышёвских точках, близка к
оптимальной. |
В теореме 4.2 рассматривается энтропия множества 5(Х), а
не SC0). Причиной тому является тот факт, что во многих
практических задачах 30 = Л + ?, где А—линейное подпространство
конечной разности, а В—ограниченное множество. Часто
оказывается, что SC0) и ЭДC0) неограниченны (здесь dl—линейный
информационный оператор кардинальности п с радиусом,
меньшим е). В таком случае Н(е, SRC0)) = //(e, SC0))= +oo Ve>0,
и теорема 4.2 неприменима. Полагая, однако, Х = В, часто можно
обеспечить выполнение условий D.8) и D.9) и, применив
теорему 4.2, найти оценку снизу на п.
Заметим в заключение, что, теорему 4.2 можно использовать
для получения оценок сверху на энтропию S(X). Действительно,
если известны кардинальность п информационного оператора Щ
с радиусом, меньшим 8, и числа М (е), /С(е), то D.10) можно
переписать следующим образом:
Н(8 + К (в), S(X)) <n\ogM (8)/е.
Идея использовать 8-энтропию множества решений, чтобы
установить число вычислений, необходимых для отыскания е-аппрок-
симации, встречается в ряде работ для различных операторов
решения. В качестве примера упомянем статьи Бабушки и
Соболева [65] и Бахвалова [62а] (см. также книгу Витушкина [59],
в которой в терминах 8-энтропии множества решений изучаются
задачи оптимального кодирования для заданного класса функций).
Вычисление е-энтропии многих множеств, представляющих
практический интерес, можно найти в работах Витушкина [591,
Колмогорова [55], Колмогорова и Тихомирова [59], Лоренца [66].
Глава 8
ПРИЛОЖЕНИЯ
К НЕЛИНЕЙНЫМ ЗАДАЧАМ
1. ВВЕДЕНИЕ
Мы покажем в этой главе, как применить развитые в гл. 1—-7
идеи для решения некоторых задач при использовании тех или
иных линейных или нелинейных информационных операторов.
188 Ч. А, гл. 8. Приложения к нелинейным задачам
В §§ 2—5 обсуждается нелинейное уравнение / = 0, где
/—скалярная функция (в §§ 2—4) или оператор (в § 5). В §§ 6 и 7
обсуждается вопрос о поиске максимума унимодальных функций.
В § 7 гл. 2 было доказано, что адаптивная линейная
информация для линейных задач не сильнее неадаптивной линейной
информации. В противоположность этому адаптивная линейная
информация, как мы покажем, может экспоненциально
превосходить неадаптивную линейную информацию для рассматриваемых
в этой главе задач.
Обычно нелинейные уравнения решают с помощью
итерационных алгоритмов, используя итеративную информацию. Такая
информация изучается в части В. Здесь мы продемонстрируем, что
нелинейные уравнения можно решать также методами,
обсуждаемыми в части А.
Кифер своей работой [53] положил начало исследованиям по
оптимальному поиску максимума унимодальной функции. Мы
показываем, что «информация Кифера» не оптимальна в классе
адаптивной линейной информации, использующей п линейных
функционалов, и высказываем предположение (гипотеза 7.1), что
минимальный радиус информации в этом классе равен ф—а) 2~("+1),
где [а, Ь]— начальный интервал неопределенности. Для
сопоставления укажем, что Кифер получил величину (b—a)/BFn)9 где Fn
обозначает n-е число Фибоначчи.
В гл. 6 были построены линейные оптимальные по точности
алгоритмы для многих линейных задач. Комбинаторная сложность
таких алгоритмов всегда пропорциональна п, где
п—кардинальность информационного оператора, используемого алгоритмом.
Для рассматриваемых в этой главе нелинейных задач мы построим
несколько оптимальных по точности алгоритмов, комбинаторная
сложность которых пропорциональна log я (или даже постоянна),
т. е. существенно меньше кардинальности информационного
оператора.
Дадим краткий обзор результатов настоящей главы и несколько
ссылок на весьма обширную литературу.
В § 2 мы находим n-ю оптимальную неадаптивную линейную
информацию для решения нелинейного уравнения / (х) = 0, где /
принадлежит классу непрерывных вещественных функций на [а, 6],
таких что f(fl)<0, /F)>0 и / имеет в точности один нуль в
[а, Ь]. Этой п-й оптимальной информацией является $l(f) =
= [/(*i), .-., /(*„)]', где *,==* + * (ft-a)/(/i+l), и r($ltS) =
= ф—аIB{п+\)). Указывается также использующий 91
интерполяционный центральный алгоритм, комбинаторная сложность
которого пропорциональна log п. Этот алгоритм асимптотически
оптимален по сложности.
В § 3 рассматривается адаптивная линейная информация для
того же оператора решения, что и в § 2. Известно, что
/. Введение 189
а, S) = (Ь—а) 2~(п+1> для адаптивной информации $1* (/) =
[/(ii) •-., /(»„)]',' где у{ = У({Уи fUti), ..., ftiti-i)) — Центр
наименьшего интервала, содержащего нуль функции /.
Показывается, что этот алгоритм бисекции является интерполяционным
центральным и почти оптимальным по сложности алгоритмом.
Высказывается гипотеза, что информация 9?а есть п-я
оптимальная информация в классе ?а адаптивных линейных
информационных операторов кардинальности не выше п.
В § 4 рассматривается решение нелинейных скалярных
уравнений при помощи нелинейного информационного оператора. Этот
информационный оператор состоит в вычислении п—2 значений
функции, а также оценок снизу и сверху для /' на интервале,
содержащем нуль функции /. Приводится основанный на работе
Миккелли и Мирэнкера [75] интерполяционный центральный
алгоритм, комбинаторная сложность которого пропорциональна log п.
Этот алгоритм асимптотически оптимален по сложности.
В § 5 обсуждаются нелинейные операторные уравнения в
банаховых пространствах (конечномерных или бесконечномерных). Мы
показываем, что один шаг некоторых известных и широко
используемых итерационных методов является «асимптотически»
оптимальным по точности алгоритмом.
Работ, которые посвящены решению нелинейных уравнений
при помощи неитерационных алгоритмов и в которых найдены
оптимальные (или близкие к оптимальным) алгоритмы, весьма
много. Вот некоторые из них: Айхьхорн [68], Бут [67, 69], Гросс
и С. Джонсон [59], Кифер [57], Миккелли и Мирэнкер [75],
Сухарев [75, 76], Черноусько [68], Яфиль [77]—скалярный случай;
Зонневенд [77], Майстровский [72], Тодд [76]—случай многих
переменных.
В §§ 6 и 7 обсуждается проблема поиска максимума для класса
скалярных унимодальных функций. В § 6 мы имеем дело с
неадаптивными линейными информационными операторами.
Доказывается, что информация 5R(/) = [/(лгх), f(x2)f ..., /(#„)]* для
специальным образом выбранных точек х{ близка к м-й
оптимальной информации с радиусом, равным приблизительно (Ь—а)/п.
Приводится использующий информацию 9i интерполяционный
центральный алгоритм, комбинаторная сложность которого
пропорциональна log п. Этот алгоритм асимптотически оптимален по
сложности.
В § 7 рассматривается адаптивная информация Кифера,
использующая п значений функции в точках, определяемых при помощи
последовательности Фибоначчи. Мы модифицируем конструкцию
Кифера таким образом, чтобы получить интерполяционный
центральный алгоритм, обладающий линейной комбинаторной
сложностью. В силу линейности комбинаторной сложности этот
алгоритм обладает в некотором смысле свойством оптимальности по
190 Ч. Л, гл. S. Приложения к нелинейным задачам
сложности. Излагается классический результат Кифера [53] об
оптимальности его информации в классе адаптивной линейной
информации, основанной на вычислении п значений функции.
Показывается, что информация Кифера не оптимальна -в более
широком классе YJ адаптивной линейной информации, основанной на
вычислении значений п линейных функционалов. Выдвигается
гипотеза о величине минимального радиуса информации для
класса Yjj.
Результат Кифера дал толчок многочисленным исследованиям,
касающимся оптимального поиска максимума функции,
принадлежащей 80 (для различных классов 30). Укажем для примера
следующие работы: Адамский, Корытовский и Митковский [77],
Айхьхорн [68], Афанасьев [74], Афанасьев и Новиков [75], Бимер
и Уайлд [69—71], Ганшин» [76, 77], Гэл [72], Данилин [71],
Джонсон С. [56], Жилинскас [75], Зализняк и Лигун [78], Зонне-
венд [77], Иванов [72а], Карп и Мирэнкер [68], Кифер [57], Кро-
лак [66, 68], Кролак и Л. Купер [63], Кузовкин и Тихомиров
А. Ю. Левин [65], Моцкус [72], Ньюмэн [65], Пиявский
Стронгин [78], Сухарев [71, 72, 75], Тарасова [78], Уайлд
67],
72],
64],
Файн [66], Черноусько [70а, Ь], Эвриэл и Уайлд [66], Юдин и
Немировский [76а, Ь, 77].
2. ОПТИМАЛЬНАЯ НЕАДАПТИВНАЯ ЛИНЕЙНАЯ ИНФОРМАЦИЯ
ДЛЯ НЕЛИНЕЙНЫХ СКАЛЯРНЫХ УРАВНЕНИЙ
В этом параграфе мы будем заниматься решением нелинейного
уравнения
B.1) /(*)-0,
где функция f: [a, b]—+ R принадлежит классу
B.2) 90 = {/: /непрерывна, /(а)<0, f(b)^O,
f имеет ровно один нуль на [а, Ь]}.
Таким образом, оператор решения задается формулой
B.3) Stf) = ri@).
Рассмотрим сначала неадаптивный линейный информационный
оператор
B.4) 9U/)=*[/(*i)> .... /(*•)]'. Х; = а + 1ф-а)/(п+1),
i = 1, 2, ..., /г.
Пусть / = / (ЭТв (/)) — такой индекс, что
2. Оптимальная неадаптивная линейная информация 191
где хо = а и хп+1 = Ь. Определим алгоритм ср формулой
B.5) фC4я(/))-| ^ если/(х{)=0 (i=j или /=/+1).
Ясно, что если f(Xj)f(xJ+1) фО, то нуль функции / лежит в
интервале (Xj, Xj+1)y и любая точка этого интервала может быть
нулем f. Этим доказано, что алгоритм ф является
интерполяционным и центральным, так как (xf + x/+l)/2 есть центр
интервала U(f)=*(Xj, ху+1) (см. § 2 гл. 1). Кроме того,
B.6) ,(ф)^г(ЭДп,5) ^^ |
Покажем теперь, что информация B.4) есть п-я оптимальная
информация в классе неадаптивных линейных информационных
операторов кардинальности не выше п. Точнее, пусть Ч^—класс
неадаптивных линейных информационных операторов вида
Щ/) = [М/)> Lt(f), ..., ?„(/)]*, где Lly L2, ...,
^-вещественные линейные функционалы. Будем говорить, что
информационный оператор ЭД5 задает п-ю оптимальную неадаптивную линей-
ную информацию, если .
г(Ш1 S) = r(n, S)= inf r(SR, S), ЭГпеЧп.
Мы готовы к доказательству следующей теоремы.
Теорема 2.1. Определенная формулой B.4) информация $1п
является n-й оптимальной неадаптивной линейной информацией, и
B.7) г (Шп, S) = г (пу S) - F—а)/2 (п + 1). |
Доказательство. Пусть $l = [Lly L2, ..., Ln]b. Введем функции
О, если *?[*,, xi+1],
X — Xjt еСЛИ X ^ [Xi> *"i\ »
Xt+i—x, если х€[?/, ^/+i],
f==0, 1, ...,n, где Zj=*{Xj + xJ+1)/29 a X/ = a + j(b — a)/(n +1)
при / = 0, 1, ..., n+l. Пусть h — ^i^aghi. Выберем а,- так,
чтобы h g ker $1. Поскольку последнее включение означает, что
2?=о^у (А/)— 0, /= 1, 2, ..., л, то мы получаем п. линейных
однородных уравнений с п+ 1 неизвестными. Такая система имеет
ненулевое решение, и можно предположить, что max 1^1=1 и
ао = а1=...=а^1 = О, ak > О
для некоторого целого /г. Пусть Sg(O, ji/3), где ^ = F—а)/(п+ 1),
а а = л;л+1 — б. Рассмотрим функцию
\ —а) при
\ х—а, при
192 Ч. Л, гл. 8. Приложения к нелинейным задачам
Ясно, что f непрерывна, /(а)<0, / (Ь) > 0 и у / имеется ровно
один нуль а. Таким образом, /€30. Пусть fx (x) = f(x) +h (x).
Так как А(а) = А(Ь) = О, то ^(а)<0 и h(b)>0. При x^xk
имеем h(x) = 0 и f1(x) = f(x) < 0. Для *€[xft, гЛ] получаем,-что
fi(x) = ak8(x—a)/(|u,—26) + аЛ(л:—xk), и у /\ имеется ровно один
нуль * = xft + 8. При x?[zk, а] имеем f1(x) = ak8(x—a)/((i — 26)+
+ fl*(^+i—^)- Так как б < |ш/3, то М*)<0 и h(x)>fi(*) =
= аЛб>0. Далее, /1(д:) = д:—а + А (л:) >fl{a) при х? (а, 6], чем
доказано отсутствие у fx нулей в [zk, b]. Итак, у Д ровно один
нуль в [а, 6], и ЛбЗо. Так как A?ker$W, то 9{ (Л) = 51 (/) и
S^J-^+x—б—х*—6 = F — a)/(n+l) —2в.
Таким образом,
Ввиду произвольности б заключаем, что
г (Я, S)>(ft-a)/B(/i+l))
для любого неадаптивного линейного информационного
оператора $1 с card (Щ) ^п. Отсюда и из B.6) вытекает B.7). 1
Проанализируем теперь сложность задачи B.3).
Если нужно решить нелинейное уравнение B.1) с
погрешностью, меньшей е, используя неадаптивный линейный
информационный оператор, то мы должны гарантировать, что
r(n,S)<B.
Как и в гл. 5, определим е-кардинальность т(Фиу S, е) задачи S
в классе 4fi/=U*=,xFn как наименьшее целое п, такое что
г (/г, S)< е. Из теоремы 2.1 получаем, что
B.8) т (VU9 S, е) = L Ф—а)/2е) J .
Обсудим комбинаторную сложность центрального алгоритма ф,
определенного формулой B.5). Для вычисления Ф (9Zrt (/)) нужно
найти индекс j = j($ln(f))t для которого /(ху)<0 и f(xJ+1)^O.
Очевидно, что это можно сделать, совершив flogn"] операций
сравнения и П0^! арифметических операций. Если операция
сравнения и арифметические операции считаются простейшими,
то комбинаторная сложность пропорциональна log n:
B.9) sup comp (ф (91п (/))) = в (log n).
Заметим, что при больших п комбинаторная сложность ф
значительно меньше кардинальности информационного оператора 97„.
Мы видим, что здесь ситуация совсем иная, чем в случае
линейных задач, для которых комбинаторная сложность линейных
3. Адаптивная линейная информация для нелинейных уравнений 193
оптимальных по точности алгоритмов пропорциональна п (см.
гл. 5 и 6).
Из B.8) и B.9) вытекает, что е-сложность задачи S в
классе Чу (см. определение 3.2 гл. 1) выражается формулой
B.10) compD%S, г)=(с1+оA)) L(b—a)/2sJ,
где сх — сложность вычисления одного значения функции.
Заметим, что сложность алгоритма ср, использующего информационный
оператор $1п с n = mC?Uf S, е), также представима в виде B.10).
Далее,
Будем называть алгоритм фаос асимптотически оптимальным
по сложности для S в Ч^, если он удовлетворяет условию B.11).
Подытожим полученные результаты в виде следующей теоремы.
Теорема 2.2. Рассмотрим задачу решения нелинейного урав*
нения B.1) для 30, заданного формулой B.2).
(i) Определенная формулой B.4) информация Щп является я-й
оптимальной неадаптивной линейной информацией,
г (% S) = г (п, S) = (Ь-а)/B (п + 1)).
(ii) Определенный формулой B.5) алгоритм ф является
интерполяционным центральным и асимптотически оптимальным по
СЛОЖНОСТИ ДЛЯ S В Ч^, ?(ф) = Г(Щп, S).
(Hi) е-кардинальность S в^ выражается формулой
(iv) е-сложность S в Ту выражается формулой
3. АДАПТИВНАЯ ЛИНЕЙНАЯ ИНФОРМАЦИЯ
ДЛЯ НЕЛИНЕЙНЫХ СКАЛЯРНЫХ УРАВНЕНИЙ
Как было доказано в § 7 гл. 2, адаптивные линейные инфор*
мационные операторы дают не больше сведений о линейных
задачах, чем неадаптивные. Покажем, что для нелинейной задачи
B.3) некоторый адаптивный информационный оператор 315 с
card(?{?XAi дает значительно больше сведений, чем я-й
оптимальный неадаптивный линейный информационный оператор, т. е.
А именно, положим
C.1) Ш
7 № 664
194 Ч. А, гл. 8. Приложения к нелинейным задачам
где yi = yi(J (j/i), ..., /((//_!)) определяются индуктивно
следующим образом.
Пусть ао = а и bQ = b. Предположим, что a/t bj уже
определены для / = 0, 1, ..., 1—1. Тогда
= i fl'-lf если ^^)>°» ь =j *'-*'
( ' flf \ У/, если / (у,) < О, *' \ у„
если /(*/,.)
Заметим, что [a,, ftf]—это отрезок, содержащий нули функций
из 30, совпадающих с / в точках уи у2, ..., yt. Далее
(ft—aJ-', если /(j/y)#0, /=1,2, ...,ff
О в противном случае.
Ясно, что алгоритм бисекции, определяемый формулой
C.3) Ф ($1п (/)) = (ап + ftJ/2,
является интерполяционным и центральным, а
C.4)
Мы получили экспоненциальное улучшение, так как
минимальный д-й радиус неадаптивного информационного оператора равен
(Ь—а)/B(п + 1)). Для отыскания е-аппроксимации теперь
достаточно вычислить п значений функции, где п=п(г)= |_ logF—а)/г J .
Информационная сложность оператора 9^{е) (см. C.4) гл. 1)
выражается формулой
где ct—сложность вычисления одного значения функции, а
сложность каждой из операций сложения, деления и сравнения
принимается равной единице. Заметим, что комбинаторная
сложность алгоритма бисекции равна двум. Отсюда заключаем, что
8-сложность задачи 5 при использовании информации %l%it) (см.
определение 3.1 гл. 1) выражается формулой
сотр(Э1й(е)э 5, е) = (сг+3)L \og(b—a)/z J +au
где ах€[—1» 1]. Тем самым доказано, что сложность алгоритма
бисекции отличается от е-сложности 5 при 9??г(е) не более чем
на два.
Подытожим полученные результаты в виде следующей теоремы.
Теорема 3.1. Рассмотрим задачу S и информацию 9^,
заданные формулами B.2), B.3) и C.1).
(i) Определенный формулой C.3) алгоритм бисекции является
интерполяционным и центральным. Этот алгоритм по существу
4. Нелинейная информация для нелинейных скалярных уравнений 195
оптимален по сложности для S при 9^(8), так как его сложность
отличается от 8-сложности 5 при 9?й(е> не более чем на два.
(и) Радиус информации выражается формулой
(iii) е-сложность S при !ЭТй(8) выражается формулой
сотр(Ял(в>. S, 8) = (c1 + 3)LlogF-a)/eJ +аг. |
Естественно задаться вопросом, оптимален ли определенный
формулой C.1) оператор Ш„ в классе адаптивных линейных
информационных операторов. Известно, что он оптимален в классе
информационных операторов вида 9Г{а (/) = [/ (л:3), f(x2), ..., f (хп)]{,
где x^Xjif (хг), ..., fiXj^J)—произвольная функция (см.
например, Кунг [76]). Нам представляется правдоподобным
предположение, что Шп остается оптимальным даже в случае, когда
допустимы любые адаптивные информационные операторы. Точнее,
пусть Ч/?—класс адаптивных линейных информационных
операторов вида
№ (/) - [L, (/), L2 (f; Ц (/)), ...,L*(t\Lx(f)9... )]fc,
где Lt линейно зависят от своего первого аргумента. Мы
выдвигаем следующую гипотезу.
Гипотеза 3.1. Определенная формулой C.1) информация $1%
является гс-й оптимальной адаптивной линейной информацией
в Ya т. е
inf г (Я S) - г (9t{jf 5) = ф—а) 2~<*+1>. |
4. НЕЛИНЕЙНАЯ ИНФОРМАЦИЯ
ДЛЯ НЕЛИНЕЙНЫХ СКАЛЯРНЫХ УРАВНЕНИЙ
Дадим пример нелинейного информационного оператора для
решения нелинейного скалярного уравнения. Этот пример
основан на работе Миккелли и Мирэнкера [75]. Пусть
$х—пространство абсолютно непрерывных вещественных функций
/: [a9b]—>R, таких что /'^L^, и пусть Мо—два заданных
числа, 0 < т0 ^ Мо < + °°- Положим
D.1) ЗоН/еЗг /(<0<of !Ф)>о, /'weК,м0]
для почти всех х€[а, Ь]}.
Заметим, что каждая функция из 30 имеет ровно один нуль
в [а, Ь]. Поэтому оператор решения
D.2) S/-/-40)
7*
196 Ч. Л, гл. 8. Приложения к нелинейным задачам
определен корректно. Пусть «^4 и
xi+1*=a + i(b—a)/(n—3)9 i = 0, I, ... п — 3.
Рассмотрим информационный оператор
D.3) 9?„ (/) = U (*0. / (*.). ¦ • ¦. / (*„-.), /я (/), М (/)]*,
где
D.4) m(/)s= infess /' (х), М(/) = sup ess /'(*),
[Л [ ]
f(xj)^Q> f{xj+iO^Q- Этот оператор нелинеен, так как m(f) и
M(f) зависят от / нелинейно. Информация Щп является
адаптивной, так как отрезок [x/t x/+1], фигурирующий в определении
m(f) и M(f), зависит от вычисленных значений /(х^,..., f(xnmmt).
Вследствие D.1) имеем т (f) ^ т0 > 0 и М (/) ^ Мо < -f oo.
Мы хотим найти центральный алгоритм и радиус информации.
Для f=s 1,2, ...,д—3 положим
Далее,
М -
пусть
¦{
м0
M(f
при
) при
при i=ft
) при i =
Zj = xi+l—б„ г, =
где
причем предполагается, что 0/0 = 0. Ясно, что г,-, г]-€[^/
Для любого i€[b л —2] и любого x€[^i-i.""^/+i] (где л:0 = д
и хл_1 = й) имеем
Отсюда
D.5) HxXf(xXT(x) ^л:€[а, 6],
где
при x^[xh z(]y
при x?[zh xi+1],
при x?[xiy г,],
при х? \ziy xi+1].
Заметим, что / и / принадлежат 30 и $ln(f) = $ln(f) = dln(f).
Пусть а1 = а1@г„(/))—нуль функции /", a а2 = а2(Э(„(/))--нуль Д
4. Нелинейная информация для нелинейных скалярных уравнений 197
Очевидно, ах и а2 принадлежат отрезку [х/9 х/+1]. Из D.5)
вытекает, что для любой функции / из 30, такой что 9?„(/) = 9?п(/),
и любая точка отрезка [a1}a2] может быть значением S(f). Поэтому
алгоритм
D.6)
есть интерполяционный центральный алгоритм.
Локальная погрешность ф (см. B.3) гл. 4) равна
D.7) е(Ф, fl = rad([(*!, а2])--~(аа—ах).
Можно проверить, что
и существует функция / из Эо> для которой в D.8) имеет место
равенство. Отметим, что для регулярных / из оценки D.8)
следует в некотором смысле «квадратичная» оценка н^погрешность
центрального алгоритма ф. А именно, если /'—липшицева
функция на [xj, xJ+l], то
Чтобы найти радиус информации, заметим, что (М (/) —
— m(f))/(M(/) +тф) <(М0~т0)/(М0+т0). Так как существует
функция / из Эо, для которой m(/) = m0 и М^^Мо, то мы
заключаем, что
V**' r\Jin> О) М0+т0 2(п-3)'
Проанализируем сложность этой задачи. Для отыскания е-ап-
ироксимации нужно вычислить п—2 значений функции, где
D-Ю) -"М
и значения двух нелинейных функционалов D.4). Пусть
сг—сложность вычисления одного значения функции, а с2—сложность
вычисления значения одного из нелинейных функционалов m(f)
и M(f). Тогда информационная сложность $1п (8) выражается
формулой comp(9^(e)) = c1(n(e) — 2) + 2c2. Предположим, что
арифметические операции и операция сравнения считаются
простейшими. Как и в § 2, легко проверить, что комбинаторная сложность
198 Ч. А. гл. 8. Приложения к нелинейным задачам
определенного формулой D.6) алгоритма ф пропорциональна
logn(e). Таким образом, сложность ф выражается формулой
сотр (ф) = сг (п (г) — 2) + 2с2 + в (log n (г)).
Отсюда заключаем, что е-сложность задачи S при использовании
информации $1п{е) выражается формулой
е), S, г) = (с1 + о(\))п(г)+2(с2 —cj.
Этим также доказано, что алгоритм ф асимптотически оптимален
по сложности для S при Шп{е) (см. B.11)).
Подытожим полученные результаты в виде следующей теоремы.
Теорема 4.1. Рассмотрим задачу S и информацию ЩП9
заданные формулами D.1)—D.4).
(i) Определенный формулой D.6) алгоритм ф есть
интерполяционный центральный и асимптотически оптимальный по
сложности алгоритм для 5 при 91л(е).
(и) Радиус информации выражается формулой
г /о* сч __ ^о—то ь~а
Г[Лп, OJ- мо+то 2(/х-3)'
(iii) е-сложность S при $1п{е} выражается формулой
comp(%(8), S, г) = (с1 + оA))п(г) + 2(с2—с1),
где п (в) задается формулой D.10). |
5* НЕЛИНЕЙНЫЕ ОПЕРАТОРНЫЕ УРАВНЕНИЯ
В этом параграфе мы покажем, что один шаг некоторых
известных итерационных методов является «асимптотически»
оптимальным по точности алгоритмом. Пусть
E.1) /: DcBr-,B2,
где D = {x: Jjc|<2gj, a Bl9 В2—банаховы пространства
размерности т над вещественным или комплексным полем, m=dim (Bx)=
= dim(B2), l<m<+oo. Пусть Зх—класс всех k раз
дифференцируемых в смысле Фреше на D операторов /, k^2. Возьмем
E.2) 30 = 30(Л2> Л*) = {/: /€3i и существует а = а(/),
такое что /(а) = 0,
для всех x?D> 9
где постоянные А2 и Ak удовлетворяют условию
E.3) 2kAkCq)k-1+2A2q < 1.
5. Нелинейные операторные уравнения 199
Задача решения нелинейных уравнений в 30 описывается
оператором
E.4) 5(/) = ГЧ0), где Ш
Покажем прежде всего, что оператор S определен корректно.
Достаточно показать, что для всякого /€30 уравнение /(#) = 0
при [*[<</ имеет единственное решение а = /ж1@). Пусть
E.5) R, (х, у; f) = SP iy+t (x-y)) (х~Уу(-^^Ш
для х, y?D и / ^к. Тогда
E.6) / (х) - f (а) + /' (а) (х-а) + Rt (xt щ f),
и уравнение /(#) = 0 эквивалентно уравнению
х-а Г (a)-1 R*(x9 a; /).
Заметим, что |а|<д. Из E.2) и E.5) вытекает, что для
В силу E.3), 2A2q < 1, откуда следует, что * = а. Поэтому
оператор S равенством E.4) определен корректно, и a = S(/)
удовлетворяет нелинейному уравнению /(х) = 0.
Зададим информационный оператор формулой
E.7) 9l(f) = [y<fh f(y(f))> ••-.
где y=*y{f)—некоторое приближение к решению a = S (/), ly\\<q.
Мы хотим найти d(?t, S)—диаметр информации $1 для задачи S.
Лемма 5.L Справедлива оценка
E.8)
Доказательство. Из равенства ЭТ (/) = ??(/) следует, что
= 0, 1, ..., fe—1 и f, /6 30, а потому
f(x)—J(x)=Rk(x, y\ f—ft.
Так как уравнение f(x) = O эквивалентно уравнению /(*) =
= ^й(^» У"» /—f)» а / удовлетворяет равенству E.6), то мы
получаем
E.9) x^H(x)ta + f'W{Rk(x, y\ t—f) — R%(x, a;
200 Ч. Л, гл. 8. Приложения к нелинейным задачам
Покажем, что Н—сжимающее отображение на */ = {jt: \х—а
"" /—а||/2[. В самом деле,
в силу E.2) и E.3). Далее,
\Н' {x)l^2kAk\x-y f-1 + 2Л,|д:-а|<2М»C^)*-.1 + М 2q<l,
в силу E.3). Поэтому уравнение E.9) имеет единственное решение
а, ||а—аЦ г^|| г/—а|/2^^. Положим х — а в E.9). Тогда ||а—а||!
а—а||а, откуда
чем E.8) и доказано. |
Покажем теперь, что в отношении члена ||у (/)—S(/)f оценка
E.8) является в общем случае неулучшаемой.
Лемма 5.2. При стремлении y(f) к a
E.10) d(% S)^2Aksup\\y(f)-S(f)\\*(l+o(l)).§
fe3
Доказательство. Из E.9) при x = a вытекает, что
E.11) \\*-*\d
Поскольку |а—a|| = O(||f/(/)—а|*), то E.11) можно переписать
в виде
Так как эта оценка точна, то E.10) доказано. |
Лемма 5.2 утверждает, что диаметр d(Sft, S) по порядку
оценивается величиной
2Aksu^\\y(f)-S(f)ik>
где k—номер первой отсутствующей производной в информации
E.7).
Найдем асимптотически оптимальный по точности при стрем*
лении y(f) к а алгоритм для задачи S. Пусть
E.12) ^
5. Нелинейные операторные уравнения 201
Ясно, что ЭТ (/) = 9Z (/). Известно (Трауб и Вожьняковский [77Ь
(ЗЛО)], что
Известно также, что f имеет единственный нуль а, такой что
||а||<<7. Поэтому /€30(Л2(*/), 0) и Л2 (</)+ 0 (||{/—а||). Определим
алгоритм ф формулой
E.13) <P0t(/)) = Stf);
иными словами, Ф (9i (/))—это единственное в шаре {х: |х|| < q)
решение нелинейного уравнения /(х) = 0. Алгоритм E.13) известен
в литературе как интерполяционная итерация lk\ он
рассматривался Траубом и Вожьняковским [76Ь, 77а, Ь]. Заметим, что при
& = 2 мы получаем один шаг итерации Ньютона, так как /(#) =
= f(y)+f'(y)(x-y) и v®Hf)) = i=Hy)-f'(y)-4(y).
Лемма 5.3. При стремлении y(f) к а = S (/) алгоритм ф
асимптотически оптимален по точности, т. е.
F.14) e(V)-M9l.S) A+оA))-Л» sup
/6 So
Доказательство. Повторяя часть доказательства леммы 5.1,
находим, что для Rk(x, y\ f—f) из E.9) при функции /, заданной
формулой E.12), справедлива оценка || Rk(xty\ f—7
Аналогично показывается, что
На основании леммы E.2) заключаем, что
A))
, S) (l+o(l)).
k
Известно, что алгоритм EЛЗ) имеет максимальный порядок
сходимости среди всех итерационных методов, использующих
информацию E.7) (см. Трауб и Вожьняковский [76а], а также
часть В). Лемма 5.3 утверждает, что этот алгоритм
асимптотически оптимален по точности на классе 30.
Сложность алгоритма E.13) и его зависимость от k подробно
рассмотрены в статье Трауба и Вожьняковского [77Ь].
202 Ч. Л, гл. 8. Приложения к нелинейным задачам
6. ПОЧТИ ОПТИМАЛЬНАЯ НЕАДАПТИВНАЯ ЛИНЕЙНАЯ ИНФОРМАЦИЯ
ПРИ ПОИСКЕ МАКСИМУМА УНИМОДАЛЬНЫХ ФУНКЦИЙ
В этом и следующем параграфах рассматривается задача
поиска максимума в классе скалярных унимодальных функций /:
[а, Ь] —* R. Напомним читателю, что функция f называется
унимодальной, если существует такая точка а = а(/) ?[а, Ь], что для
любых х, у?[а, Ь]
F n
Заметим, что унимодальная функция / не обязана быть
непрерывной. Пусть
F.2) 30 = {/: f унимодальна на [а, Ь]\.
Нас интересует оператор решения
F.3) S (/) = *(/),
где а = а(/)—точка, удовлетворяющая условию F.1).
Рассмотрим сначала неадаптивный линейный информационный
оператор
F.4)
где а = хо<л:1<х2 <...< *„<*„+, =&.
Заметим, что если !(х^^!(х(+1),то a^xi+ly если же !(х()^
^/(^•+i)» то а <*/+!• Пусть /a=s/Cln(/))—минимальный индекс,
такой что f(x/) = max1<i<nf(xi). Тогда а принадлежит отрезку
[а19 Ь±], где
(*y-i, если f
F.5) ах= j
U/, если f
Определим алгоритм ф формулой
F.6) ф(«.(/))-(
Ясно, что любая точка интервала (aif йх) может быть решением
нашей задачи. Отсюда следует, что алгоритм <р является
интерполяционным и центральным. Кроме того,
F.7) е (ф) = г (ЖпУ S) = max ((хи1-х()/2).
Мы хотим найти точки xlt х2, ..., хп1 минимизирующие радиус
информации F.7). Предположим сначала, что п нечетно, n = 2k —
— 1. Тогда yjLj (x2i—х2(/-1) = &—а. Следовательно, (
— *2</-n) = (o—d)/k и, в силу F.7),
F-8) г№
2k
в. Почти оптимальной неадаптивная информация при поиске максимума 203
Укажем точки хи ..., хп, для которых r($ln, S) =*F—a)/2k.
Положим
F.9) Xi=*a + ((b-a)/(n+l))i, *=1, 2, ..., п.
Тогда xi+1—xi_l = 2(b —a)/(n+l) = (b—a)/ky откуда видно, что
минимальный радиус информации для нечетных п равен (b—a)/2k.
Предположим теперь, что п четно, n = 2k. Очевидно, что
F.10) inf г(«я, 5)> min гC1я+1, S)~
b— a b—а
-2(*+1)-2Г(л+1)/2Т
Докажем, что в F.10) имеет место равенство. Выберем
произвольное положительное б < (Ь — а)/(п + 2) и положим
F.11) *2/ = а + ?=|2;, xti^^xu-69 i = l, 2,
Тогда
и из F.7) вытекает, что в F.10) имеет место равенство. Итак,
в силу F.8) и F.10),
Естественно задать вопрос, является ли информация F.4)
п-п оптимальной информацией в классе у?а неадаптивных
линейных информационных операторов вида 51(/) = [^(/), ..., Ln (/)]*,
где Ll9 L2, ...-, Ln—вещественные линейные функционалы,
определенные на каждой унимодальной функции.
Хотя ответ на этот вопрос нам не известен, мы можем
показать, что
F.13) г (л, S)= inf r Cd, S)
удовлетворяет оценкам
Справедливость правого неравенства в F.14) следует из F.12).
Для доказательства левого воспользуемся теоремой 2.1. Пусть
3^—подмножество в 30, состоящее из всех таких функций /, что
производная /' непрерывна, /'(а)^0, /'(&)<0 и/' имеет ровно
один нуль на [а, Ь]. Тогда a = S(J) является единственным
решением уравнения /'(х) = 0. Заметим, что множество G0 = {g:
g = — f для /?3J совпадает с B.2), а задача F.3) для /?30
совпадает с задачей B.3) для g?G0. Пусть Sx(g) = S(f) для
404 Ч. А, гл. 8. Приложения к нелинейным задачам
?= —/'€G0. Тогда, очевидно, г(Щ, 5)> г ($1, SJ для любого
информационного оператора $1 из ?„. Из теоремы 2.1
вытекает, что
г(9?,
чем левое неравенство в F.14) и доказано.
Нижняя и верхняя оценки в F.14) довольно близки: верхняя
превосходит нижнюю не более чем в два раза. Тем самым
установлено, что информационный оператор вида F.4) с точками xh
определяемыми по формуле F.9) для нечетных пи по формуле
F.11) с малым б для четных п, задает «почти что» п-ю
оптимальную информацию.
Проанализируем сложность задачи F.3). Для возможности
отыскания 8-аппроксимации нужно гарантировать, что г (п, S) < г.
Пусть т{^и, S, е) есть е-кардинальность, определяемая так же,
как и в § 2. Из F.14) вытекает, что
т (9U9 S, е) = L fli (Ф-а)/2в) J, а, <Е [1, 2].
Мы доказали, что определенный формулой F.6) алгоритм
является центральным. Оценим его комбинаторную сложность.
Для вычисления ф(9?п(/)) нужно найти индекс / = /(^„(/))- Эт°
можно сделать, используя в (log n) сравнений и арифметических
операций. Итак, сложность алгоритма ср и 8-сложность S в Wa
выражаются формулой
сотр С?ц, 5, е) = сотр (ср) A + о A))
,(F—a)/2e)J при в —О,
где с±—сложность вычисления одного значения функции. Таким
образом, алгоритм <р асимптотически оптимален по сложности
для S в Чц.
Подытожим полученные результаты в виде следующей
теоремы.
Теорема 6.1. Рассмотрим задачу F.2) — F.3) поиска
максимума для класса унимодальных функций.
(i) Заданная формулой F.4) информация Щп с точками xh
определяемыми по формуле F.9) для нечетных п и по формуле
F.11) с малым б для четных я, является п-й почти оптимальной
неадаптивной линейной информацией,
где бп = 0 для нечетных пи =8 для четных п.
(ii) Заданный формулой F.6) алгоритм ф является
интерполяционным центральным и асимптотически оптимальным по
сложности для S в WU9 е(у) = гф1П} S).
7. Адаптивная линейная информация при поиске максимума 205
(Hi) е-кардинальность S в Ч^ выражается формулой
m(VU9 S, e)= L*i(*—fl)/2ej.
(iv) е-сложность S в tPy выражается формулой
Fj,, S, 8) = (c1
7. АДАПТИВНАЯ ЛИНЕЙНАЯ ИНФОРМАЦИЯ ПРИ ПОИСКЕ
МАКСИМУМА УНИМОДАЛЬНЫХ ФУНКЦИЙ
В этом параграфе мы продолжаем рассматривать задачу
F.2)—F.3). Будет показано, что для этой нелинейной задачи
существует адаптивный информационный оператор 9?„, card (91?)^л,
который значительно эффективнее любого неадаптивного
информационного оператора Ш кардинальности /г, т. е. г (9t%, S)<^r (ny S)
при больших д.
В своей классической статье [53] Кифер поставил и решил
задачу отыскания точек yh в которых следует адаптивно
вычислять значения f. Однако Кифер дал лишь неявные правила
выбора точек yt. Мы модифицируем правила Кифера так, чтобы
получить алгоритм малой комбинаторной сложности.
Положим
GЛ)
где точки #/ = *//(/(*/i), ..., f(yt-i)) определяются следующим
образом. Пусть \Fn\—последовательность Фибоначчи, FO = F1=1,
Fw = /V-i + /V-2, я = 2, 3, ..., и пусть
G.2) g(x)=*f(a + x(b-a)/FJ, *€[0, FJ.
Пусть, далее, б—заданное положительное число, 6^1.
Для п = 2 мы полагаем х'2=1—б, х2=1 и вычисляем1}
g(x!2) и g(x2), так что
G.3) 0! = а + A— 6)(Ь—а)/29 у2 = а + ф-а)/2.
Тогда решение S(f) лежит в интервале [с, d], где
с = а, d=*yt9 если g{x2) >g(x2),
G.4) с=*уи d = y2f если g(x't)=g(x%)9
с = Уи d = b, если g(x'2) <g(x2).
Для п^З мы определяем последовательности {#;}, {Ь(}, {хс\
и {zi) приводимыми ниже формулами G.5) и G.6) (мотивировка
которых дается вслед за ними), полагаем а2 = 0, bz = Fny x =Fn_2f
22 = Fn_i и вычисляем g(x2) и g(z2). Упомянутые четыре
последовательности определяются так: для i = 2, 3, ..., п—1, если
В качестве / {ух) и / (уг).— Прим. ред%
206
Ч. Af гл. 8. Приложений, к нелинейным задачам
9D}
9D)
—i-
ч
II
--*
Ч
Ч
и
Рис. 5
g(Xi)>gBi), TO
G.5) ai+1 = ah
а если g
G.6)
/), то
Мотивировка формул G.5) и G.6) такова. Предположим, что
для данного i < п интервал \ah b(] содержит максимум функции
g и а( < xt < г/ < й,-. Заметим, что для *' = 2 это так. Зная
значения #(*/) и ^(г,-), определим новый интервал, содержащий
максимум g. Предположим сначала, что g(*/) >?(*,•)> как п0"
казано на рис. 5. Тогда \ah z{] будет искомым новым
интервалом, а #/+1==а/ + /'1и_1_1—следующей точкой, в которой
вычисляется значение функции g. Этим пояснены формулы G.5).
Предположим теперь, что g(*/)^g(z/), как показано на
рис. 6. В этом случае новым интервалом служит [xh &,-], а
следующей точкой, в которой будет вычислено значение функции
g,—точка Z/+i = */ + /V-/. Это поясняет формулу G.6). Отсюда
также следует, что если g(^i)^g(zi)i то [*/> ЭД есть
наименьший замкнутый интервал, с гарантией содержащий максимум g.
Если g(xi) = g(zi)y то уже интервал [*/f г;] заведомо содержит
максимум g. Для простоты и в этом случае вместо bi+1 = zi мы
полагаем й/+1 = &/. Отметим, что в результате такого упрощения
радиус информации не меняется, поскольку существуют такие
функции g, что g(xi) при каждом i отлично от g(zt).
Индукцией легко показать, что для / = 2, 3, ..., п
G.7)
7. Адаптивная линейная информация при поиске максимума
207
з(ч)
г
at
I
I
1
щ
и
Ч
и
Рис. 6
Далее, при i^n— 1 мы имеем х(<гь и значения функции g
вычисляются в х{ или г,-. Для точек хп и zn получаем
хп_ъ если g(xnmmX)> g(zn^1)t
г„_1э если g(^K?(Vi)-
Итак, мы знаем значение g(zn) = g(xn). Это показывает, что для
вычислений по формулам G.5) и G.6) требуется п — 1 значений
функции g. Возьмем в качестве я-й точки, в которой
вычисляется значение g, точку х'п — хп—6. Заметим, что хп — ап+\ и
Укажем теперь точки yh в которых вычисляются значения
функции / (см. G.1)). Из G.2), G.5) и G.6) вытекает, что
G.8) yt=*a+((b—aW,№h
где Ъх = Рп_%, l% = Fn-b
\ */+i. если 8(*i)>g(*t)>
/+1""\ г/+1, если г^Хг^,), / = 2, 3, ..., л—2,
и ln=zxen. Тогда решение S(/) лежит в интервале [с, d], где
G.9) c^a + ttft-aV^^+i, d = a + ((ft-a)/FeNB+i,
^+i = ««, 6л+1=ая+1, если g(x;) >g(xn),
ая+1 = ая-Ь1— б, &л+1==ая+1, если ?(*;) = ?(*„),
eB+issfle+|-б» bn+i=bny если g(x;)<g(xj.
Определим алгоритм ср следующим образом:
G.10) ф(915 (/)) = i
208 Ч. Л, гл. 8. Приложения к нелинейным задачам
где с, d задаются формулами G.4) для п = 2 и формулами G.9)
для /г^З. Так как [с, d] содержит решение S(f) и любая точка
из (сf d) может быть решением, мы видим, что
ф—интерполяционный центральный алгоритм. Далее,
G,11) е(ф) = г($Яг, 5)
8иР ^ (ba)
Напомним, что минимальный n-й радиус г (/г, 5) неадаптивной
информации равен (ft—a)/B(n +1)). Поскольку l/F^Ox
X,(B/1^5" + 1))"), мы получили экспоненциальное улучшение.
Для отыскания е-аппроксимации достаточно вычислить
M = tt(e) значений функции, где п—наименьшее целее, такое что
G.12) Fe>((ft_fl)
Так как
то мы заключаем, что
G.,3) „(t).,ogOi«
Сложность центрального алгоритма G.10) выражается формулой
G.14)
где сх—сложность вычисления одного значения функции, а
операции сложения, вычитания, умножения, деления и сравнения
считаются простейшими. Очевидно, что е-сложность задачи S при
использовании информации 9^(8) также имеет вид GЛ4).
Подытожим эти результаты в виде следующей теоремы.
Теорема 7.1. Рассмотрим задачу F.2)—F.3) поиска
максимума для класса унимодальных функций.
(i) Определенный формулой G.10) алгоритм является
интерполяционным и центральным. Этот алгоритм в некотором смысле
оптимален по сложности для S при 9Й(8): е^о сложность
равна 0(comp9^(8), S, г).
(и) Радиус информации выражается формулой
МЭД1, S)~((b-a)/2Fn)(\+6).
(Hi) е-сложность S при 9Йсе) выражается формулой
где п(г) определяется из условия G.12) и удовлетворяет
соотношению G.13). |
7. Адаптивная линейная информация при поиске максимума 209
Естественно поставить вопрос об оптимальности определенной
формулой G.1) информации din в классе адаптивных линейных
информационных операторов. Кифер [53] доказал, что (в нашей
терминологии)
G.15) inf r($l*, S) = (b-a)/2Fn;
здесь ?* — класс адаптивных линейных информационных
операторов вида
где */ = x,-(/(*i), • ••, /(X/.i))—произвольные функции.
Заметим, что радиус информации G.1) отличается от G.15)
множителем 1+5. Так как б может быть выбрано произвольно
малым, мы заключаем, что информация Щ почти оптимальна
в Vj.
Обсудим теперь вопрос об оптимальности 91% в классе УР%
адаптивных линейных информационных операторов вида 91(/)=
=[М/), L*if\ M/)). •¦-. Ln{f\ Li{f), ...)]', где функционалы
Lt линейно зависят от первого аргумента. Заметим, что
определенный в § 3 класс Ч^ и класс *?% различаются областями
определения функционалов Lit L2t ..., Ln. Для 4^j_ функционалы
определены на непрерывных функциях, для 4TJ—на
унимодальных.
В свете результатов § 3 не вызывает удивления тот факт, что
информация din № оптимальна в классе Wn. Чтобы показать это,
предположим на время, что / имеет непрерывную первую
производную и /' (а) ^0, /' ф) < 0. Тогда а = 5 (/)—единственное
решение уравнения //(^) = 0. У информации
G.16) 9Щ) = [ГШ.ГШ ГШЬ
где точки у( задаются формулами C.2), в которых надо заменить
f(y() на —f'dfi), радиус равен (Ь—аJ~{п+1). Для класса
унимодальных функций информация G.16) не является корректно
определенной, так как/', вообще говоря, не существует. Поэтому
вместо G.16) положим
G.17) %(/) = [/(</!> «), /0/2, б), ,.., f(yni в)Р,
где / (у/, в) = / (У/)—fdJt—6))/в—первая разделенная разность, а
б—достаточно малое положительное число. Точки у? определяются
следующим образом. Пусть ао==*а и Ь0=*Ь. Предположим, что
210 Ч. А. гл. 8. Приложения к нелинейным задачам
a/t bj уже определены для i = 0, 1, ..., i — 1. Тогда
_/ ui~u если
(/.1») а<-\ у „б, если f(yh б)>0,
6/_i, если f(y0 б) > О,
yh если f{yt б)<0
(ср. с C.2)). Ясно, что \ah bf\ содержит все элементы решения
для тех функций / из 30, которые дают такую же информацию,
как /. Далее,
Ь1—а$ < (ft/-j—fl/.i)/2 + б < (b—a) 2-*+ 26 A — 2~0
и существует функция /63О, для которой это неравенство
превращается в равенство. Отсюда получаем радиус информации:
г
Поскольку б может быть сколь угодно малым,
G.19) inf r
Это показывает, что информационный оператор Кифера не
оптимален в ??.
Истинное значение inf$«€^r (9i, S) неизвестно.
Представляется правдоподобным, что в G.19) имеет место равенство.
Гипотеза 7.1. Справедливо равенство
inf r($l 5) = (й—аJ
Очевидно, что из утверждения гипотезы 3.1 следует
утверждение гипотезы 7.1. Кроме того, inf^ € у* г ($1, Sx) <! infg? e ^ /- (9^ 5),
где Sx обозначает оператор B.2) —B.3) решения нелинейных
уравнений.
Как и в § 6 гл. 6, мы хотим прокомментировать
предположение о том, что стоимость вычисления значения каждого
линейного функционала равна единице. При этом предположении
сложность вычисления f(yh б) в G.17) та же, что и сложность
вычисления /(#,). Допустим, что это предположение не
выполняется и вычисление / {у.у й) в с раз дороже, чем вычисление
/ {уд- Отвлекаясь от двух арифметических операций, примем,
что с? [1, 2]. Тогда стоимость вычисления Щ приблизительно
равна стоимости вычисления 9^ сш= \_сп J . Так как г (91^, S) =
f=0(B/(J/5+1))c"),to г(Щ, S) меньше г (%, S) при больших п
/. Введений 211
и малых б в том и только том случае, когда
G.20) с< I/log (A/1+1)/2)« 1.44.
Этим показано, что информационный оператор Щ эффективнее
Шп, даже если вычисление / (yif б) дороже вычисления / )
при условии что с удовлетворяет условию G.20).
Глава 9
ИЕРАРХИЯ СЛОЖНОСТИ
1. ВВЕДЕНИЕ
Задачи можно расположить иерархически в зависимости от
их сложности. Подчеркнем, что иерархия сложности задач
существенно зависит от класса допустимых информационных
операторов. Различные классы информации обычно порождают
различные иерархии сложности.
В настоящее время мы можем дать лишь частичное описание
иерархий. Ожидаем, что в результате дальнейших исследований
это описание будет расширено.
Заметим, что в итеративной информационной модели части В
встречаются лишь два типа функций сложности (см. ч. В, § 11).
Коротко о результатах этой главы. В § 2 определяются
сложностные отношения и перечисляются фигурирующие в
иерархии задачи. В §§ 3—7 строятся иерархии сложности для пяти
классов информационных операторов. В § 8 мы строим иерархии
сложности, фиксируя задачу и варьируя классы информации.
В заключительном параграфе дается таблица, подытоживающая
наши результаты.
2. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Пусть S, Si и S2—операторы решения, а "V—класс
допустимых информационных операторов. Напомним, что comp^, S, е)
обозначает е-сложность задачи 5 в классе W (см. C.9) гл. 1).
ОПРЕДЕЛЕНИЕ 2.1. (i) Будем говорить, что Sx сложнее S2
в классе Ф для множества Л, и писать Sx^> S2f если
B.1) comp pP, Sly e) > comp (?, S8, е) Ve ? Л.
(ii) Будем говорить, что Sx и S2 имеют одинаковую
^-сложность в классе Y, и писать Sx X S2, если
B.2) comppF, Slt г) = 9 (comp (W, Sa, e)) при e — 0.
Si 2 V. А, гл. 9. Иерархия сложности
(iii) Будем говорить, что St существенно сложнее S2 в классе
W, и писать Sl>S2> если
B.3) compPF, S2, е) = о (comp (W, Siy г)) при е-^0. I
Итак, St > S2 означает, что отыскание е-аппроксимации в
задаче 5Х при всех е из множества А труднее, чем в задаче 52,
если используются информационные операторы из класса W.
Обычно А — это интервал @, е0) при некотором положительном е0.
Далее, 5XXS2 означает, что xomp(T, Sx, e) и сотр(Т, 52, е)
различаются лишь положительным постоянным множителем при
всех малых е. Наконец, SX>S2 означает, что comp Dя, Sl9 г)
стремится к бесконечности при стремлении г к нулю значительно
быстрее, чем comp^, S2, e). Отметим, что «X» есть отношение
эквивалентности, a S1>S2, S2>53=>51 >S3. Заметим также,
что для установления справедливости соотношения Sx > 52
достаточно знать асимптотическое поведение е-сложности для задач
St и 52.
Отношение «>» интересно не всегда, так как оно может
зависеть от второстепенных деталей задачи. Рассмотрим например,
две задачи интегрирования SJ = Jьа f (x) dx и S2 (/) = fdc f (x) dx,
где f^S0=U7^, a T—класс информационных операторов,
сводящихся к вычислению значений функции. Так как е-сложность
зависит от длины интервала интегрирования, той—с>6—a^S2>Si
для любого интервала Л = @, е0). Таким образом, по существу
идентичные задачи Sx и 52 занимают различные позиции в
иерархии сложности по отношению «>». Разумеется, S± X S2, так как
их сложности отличаются лишь постоянным множителем. Поэтому
Sx и S2 занимают одну и ту же позицию в иерархии сложности
по отношению «X».
По этой причине мы будем использовать главным образом
отношения X и > и только иногда отношение >.
В гл. 6 и 8 был проанализирован ряд операторов решения
для различных классов допустимых информационных операторов.
Мы имели дело со следующими операторами:
DIF(r) оператор дифференцирования для 30=IFL
(г нечетно и >3), изученный в п. Bи) гл. 6;
INP(r) оператор интерполяции для 3O = 1F^,
изученный в п. Ci) гл. 6;
ШР(Л) оператор интерполяции для класса 30
аналитических ограниченных функций,
изученный в п. (Зи) гл. 6;
1NP (//) оператор интерполяции для класса 30
аналитических ограниченных функций,
содержащегося в гильбертовом пространстве с
воспроизводящим ядром, изученный в п. (Зш),
гл. 6;
3. Иерархия сложности для класса Y rtfrt
INT(H??) оператор интегрирования для 30 = fl7?,
изученный в п. Di) гл. 6;
INT (Wrp) оператор интегрирования для 30 = №?,
изученный в п. Dп) гл. 6;
АРР (Wr2> L2) оператор аппроксимации для 30= Wr2 и 32=L2>
изученный в п. EП) гл. 6;
АРР (W2t L2) оператор аппроксимации для 30 = W2 и 32 = L2,
изученный в п. Eiii) гл. 6;
АРР (W^oo, С) оператор аппроксимации для 30 = №» и 32=С,
изученный в п. Eiv) гл. 6;
АРР (Wroo, С) оператор аппроксимации для 30= W^ и 32=С,
изученный в п. Ev) гл. 6;
PAR (г) параболический оператор для класса 30
нечетных функций /, таких что ||/(г) ||2 ^ 1 (г четно),
изученный в п. Fii) гл. 6;
ELL(r) эллиптический оператор для класса 30
нечетных функций /, таких что ||/(г)||2 ^ 1 (г четно),
изученный в п. Fiii) гл. 6;
HYP (г) гиперболический оператор для $0=W2 (r четно),
изученный в п. Fiv) гл. 6;
NON оператор решения нелинейного скалярного
уравнения для класса 30, изученный в §§ 2
и 3 гл. 8;
UNI оператор поиска максимума для класса 30
унимодальных функций, изученный в §§ 6
и 7 гл. 8.
Будем обозначать любую из задач интерполяции INP(r),
ШР(Л), ШР(Я) через INP. Аналогично INT (Wrp) и INT(^)
будем обозначать через INT, а АРР (#?, L2), АРР (Wr2, L2),
АРР(Ггоо, С) и АРР(И^, С)—через АРР.
Мы даем описание иерархии сложности для нескольких
классов V информационных операторов. Предполагается, что набор
простейших операций определен таким образом, что класс ?
допустим, и для каждого информационного оператора из Ч?
существует допустимый оптимальный по точности алгоритм.
Предполагается также, что информационная сложность каждого
информационного оператора W?W с card (?{) = п равна пс19 где
сг зависит только от класса Ч?.
3. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ КЛАССА Ч^0"
Пусть Ч70П—класс всех неадаптивных информационных
операторов вида 9?"оп(/) = [/(д:1)> f(x2)t ..., f(xn)]{ для некоторого п
и заранее заданных попарно различных точек х19 х2> ..., хп.
214 Ч. Л, гл. 9. Иерархия сложности
Задачи дифференцирования и интерполяции для класса Ч70П
тривиальны. Действительно, из соотношения B.20) гл. 6 следует,
что г (Шп DIF(r), D^) может быть сколь угодно малым при
малых h. Это означает, что
C.1) [compOFfnon, DIF(r), г) = {с1 + а)г—1 Ve,
где а?[1, 2]. Что же касается задачи интерполяции, то
достаточно заметить, что оператор $l(f) = f(x0) принадлежит классу
4?$™ и имеет радиус, равный нулю. Поэтому
C.2) compOPp, INP, 8) = cx Ve = 0.
Из C.1) и C.2) вытекает, что
C.3) DIF(r)>INP
для множества А = {г: е>0}.
Как было доказано в гл. 6, е-сложность задач
интегрирования INT (Wrp) и \NT(Wp"), а также задач аппроксимации
АРР(Й^^, С) и APPiW^y С) в классе 4>"?оп асимптотически равна
8-i/r Отсюда следует, что эти четыре задачи имеют одинаковую
в-сложность.
Мы не знаем, какая из этих задач сложнее (см. определение
2.1 (i)), так как точное значение е-сложности известно не при
всех значениях риг. Для р= + оо, однако, можно показать,
что существует такое положительное е0, что
C.4) АРР (W?., С) > АРР (W», С)
для множества Л = @, г0). Кроме того, при г^З
C.5) АРР (#;, С) > INT (#«)
для множества Л = @, 0.5), если сг^ 19/A5 — 8{/2я).
В гл. 8 было, показано, что е-сложность оператора решения
нелинейного скалярного уравнения NON и е-сложность
оператора поиска максимума UNI асимптотически равны в.
Следовательно,
C.6) NONXUN1.
Заметим, что при г^2 сложность этих двух нелинейных
операторов решения существенно выше, чем у любого из
приведенных ранее линейных операторов решения.
Подытожим все эти результаты.
Теорема 3.1. Для класса неадаптивных информационных
операторов Ч*}10" имеет место следующая иерархия сложности:
NON X UNI X INT (Wlp) X INT (Wlp) X АРР (WL, С) X АРР {WlC)
> INT (W'p) X INT (Wrp) X APP (#;, C) X APP (W., C)
>DIF(r)XlNP V/->2. |
4. Иерархия сложности для класса У/ 215
4. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ КЛАССА Ч?)
Пусть Т?—класс всех адаптивных информационных
операторов вида
для некоторого пи точек x—x^x^f {х^)9 ...,/(*/_ J), t"=2, 3, ..., п.
Как было показано в § 7 гл. 2, в случае линейных задач 5
адаптивные информационные операторы не могут помочь делу.
Точнее, было показано, что для каждого адаптивного
информационного оператора ЭД} существует такой неадаптивный
информационный оператор $1™п, что d(9#, S)>dERSon, S). Отсюда
вытекает, что г (SRJ, S) >O,5rad (ЭД}011, 5). В силу определения
ЭД!0П, из 9Й6^ следует, что ЭД}ОП€Ч7ОП. Поэтому
compD7on, S, е/2)<сотр(^, S, 8)<compDfp, S, е)
для каждого линейного оператора решения S. Поскольку
compD7on, S, е/2) = в(сотр(Ч7оп, 5, е)
для всех рассматриваемых в этой главе линейных операторов
решения S, мы заключаем, что
comp(?j?, S, e) = B(compDr?on, S, е)).
Это значит, что для всех линейных задач иерархия сложности
в классе Ч) та же, что и в классе ?]?оп.
Мы показали в гл. 8, что е-сложность каждого из
нелинейных операторов решения NON и UNI резко различается для
двух классов Ч^00 и Vf:
nf NON, 8) = 9(comp(Ч70П, UNI, 8))==в(е-1),
comp(^, NON, е) = в(сотр(??, UNI, e) = B (log 1/e).
Итак, задачи NON и UNI, обладающие в классе Wf™
существенно наибольшей среди других рассматриваемых задач
сложностью (см. теорему 3.1), имеют в классе *Р| чуть ли не
наименьшую сложность среди тех же задач (см. теорему 4.1).
Из результатов §§ 3 и 7 гл. 8 легко следует, что существует
такое положительное е0, что
UNI > NON
для множества Л=@, е0).
Подытожим эти результаты в виде следующей теоремы,
216 Ч. А, гл. 9. Иерархия сложности
Теорема 4.1. Для класса адаптивных информационных
операторов W* имеет место следующая иерархия сложности:
XlNT(^)XAPP(lFe, С)ХАРР(П, С)
> INT (Wrp) X INT TO X APP (if;, C) X APP (W'w, C)
>NONXUNI
>DIF(r)XlNP Vr>2. |
Замечание 4.1. е-сложность задачи NON в классе Ч^
асимптотически равна log l/e. Иными словами, сложность отыскания
е-аппроксимации нуля уравнения f(x) = O при каждом /?30
асимптотически равна log 1/е. Здесь класс 30—это определенный
формулой B.2) гл. 8 класс непрерывных на [at b] функций /,
таких что /(«)<0, f(b)^O и f имеет на [а, Ь] ровно один нуль.
Заметим, что алгоритм бисекции, являющийся
интерполяционным и центральным, сходится глобально, т. е. нам не нужно
знать хорошего начального приближения к решению.
В части В мы будем изучать локально сходящиеся алгоритмы
для намного более общего класса 3„ нелинейных уравнений.
Локальная сходимость означает, что нам известно достаточно
хорошее начальное приближение к решению. Сложность локально
сходящихся с порядком выше 1 алгоритмов очень низка и
асимптотически равна log log l/e. Предположение о локальной
сходимости весьма существенно. Недавно Васильковский [79] показал,
что любая глобально сходящаяся итерация, использующая
линейный информационный оператор конечной кардинальности,
обладает бесконечной сложностью даже для класса
полиноминальных уравнений с простыми нулями. |
5. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ КЛАССА Y?on
Пусть ^Е011 — класс всех линейных неадаптивных
информационных операторов вида 9№пф = [Цф, L2(f), ..., /,„(/)]' при
некотором п и некоторых линейных функционалах Lit L2, ..., Ln.
Так как ^рс^Г1, то comp (?fnon, 5, е)< сотр (^оп, S, е)
для каждого оператора решения S. Заметим, что задача
интегрирования INT в классе Ч^011 становится тривиальной, поскольку
gi?on{f)=*faf(t)dt принадлежит классу ТЦ00 и гф1и ШТ) = 0.
Поэтому
comppF?on, INT, e)»c,.
В § 5 гл. 6 было показано, что е-сложность задач
аппроксимации АРР(^, L2), АРР(НР'2, L2), APP(^, С) и kPPiW'., С)
в классе Wior равна в(е~1/г). Таким образом, они имеют
одинаковую 6-сложность. Далее, легко показать, что существует
в. Иерархия сложности для класса 4*1 217
такое положительное е(И что
APP(WZ, Lt)>kPP(W29 L%)
для множества Л = @, е0).
Что касается операторов решения дифференциальных
уравнений с частными производными PAR (r), ELL(r) и HYP (г), то
в § 6 гл. 6 мы доказали, что
comp (??<>", PAR (г), e)==0(Vlog l/e),
E.1) comp (ГЦ0», ELL (г), е) = 0 (/logT/e),
\ HYP (г), е) = в(8-1/0
для каждого четного г. Можно показать, что E.1) выполняется
также и для нечетных г. Следовательно,
HYP(r)>ELL(r)>PAR(/-) Vr.
Для нелинейных операторов решения NON и UNI в §§ 2 и
6 главы 8 было показано, что
comp^E0", NON, б)==в(сотр(ЧгЕоп, UNI, е))^В(в^).
Итак, NONXUNI. Подытожим эти результаты в виде
следующей теоремы.
Теорема 5.1. Для класса линейных неадаптивных
информационных операторов Ч^п имеет место следующая иерархия
сложности:
, L2)
X АРР (Wl, С) X АРР (Wlt С) X HYP A)
^, С)
iW^ С) X HYP (г)
>ELL(r)
>PAR(r)
> DIF (r) X INP X INT Vr > 2. |
в. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ КЛАССА WaL
Пусть x? = 4ri—класс всех линейных адаптивных
информационных операторов вида ^(/)=-[^ (/), L2(/; L, (/)), ..., Ln(f\
U(f)> •••)?. Как и в § 4, имеем compel, 5, е) = в (comp (Т?°п^
S, е)) для всех рассматриваемых в этой главе линейных
операторов решения S.
218 Ч. А, гл. 9. Иерархия сложности
Для нелинейных операторов решения NON и UN1 нам
известно лишь, что
,fi n comp (Wi; NON, e) = 0 (log 1/e),
к ' comp(YaL, UNI, e)-0(log 1/8).
Если гипотезы 3.1 и 7.1 гл. 8 верны, то оценки F.1) точны,
т. е. О в них можно заменить на в. В таком случае
F.2) NON X UNI X ELL (г).
Так или иначе, мы знаем, что задачи аппроксимации АРР и
гиперболическая задача HYP (r) существенно сложнее, чем NON
и UNL
Подытожим эти результаты в виде следующей теоремы.
Теорема 6.1. Для класса линейных адаптивных
информационных операторов ?? имеет место следующая иерархия
сложности:
АРР {W't9 L2)XAPP (W29 I,)XAPP (W'.9 QXAPP (W'.
>ELL(r)
>PAR(r)
>DIF(r)XlNPXlNT Vr.
Кроме того,
HYP (r) > NON и HYP(r)>UNI Vr. |
7. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ КЛАССА
Пусть ^Fnon—класс всех нелинейных информационных
операторов 9? кардинальности единица, т.е. 9{(/) = ?.(/), где L —
некоторый нелинейный функционал.
Как мы доказали в § 3 гл. 7, информационный оператор Щ
из ^Fnon с г(Ш, S) = 0 существует в том и только том случае,
если мощность множества 5(Q0) не превосходит ©. Заметим, что
для всех рассматриваемых в этой главе операторов решения S
множество SC0) обладает этим свойством, т. е. его мощность не
превосходит ©. Поэтому каждую из задач S можно решить точно,
используя один соответствующим образом выбранный нелинейный
функционал. Следовательно,
comp^NON, 5, е) = const,
и все задачи S имеют одну и ту же в-сложность. Это снова
показывает, что класс ^Fnon настолько «богат», что все задачи S
становятся тривиальными. Подытожим сказанное.
8. Иерархия сложности для фиксированной задачи S 219
Теорема 7.1. Для класса нелинейных информационных
операторов Ynon
DIF (г) X INP X ШТ X АРР X PAR (г) X ELL (г)
XHYP(r)XNONXUNI. |
8. ИЕРАРХИЯ СЛОЖНОСТИ ДЛЯ ФИКСИРОВАННОЙ ЗАДАЧИ 5
В предыдущих параграфах были описаны иерархии
сложности для различных задач при фиксированном классе
информационных операторов. Здесь мы рассмотрим иерархию
сложности для различных классов информационных операторов при
фиксированной задаче S.
ОПРЕДЕЛЕНИЕ 8.1. Пусть ?г и ?2—два класса
информационных операторов. Будем говорить, что эти классы @-эквива-
лентны для задачи S, и писать Чг X Ч*2> если
comp(Vlf S, е) = в(сотрAР2, S, е)) при 8 — 0.
Будем говорить, что у?1 существенно эффективнее ?а для задачи 5,
и писать Vt>V29 если
compos, S, e) = o(comp(?2, S, е)) при 8 — 0. |
Итак, YjX^ означает, что 8-сложность задачи S
асимптотически одна и та же в обоих классах 1?1 и W2, а Ч^Ч^-— что
8-сложность S в классе Ч^ существенно меньше, чем е-слож-
ность S в классе ?2.
Результаты гл. 6 и 8 позволяют построить иерархии сложности
для всех рассматриваемых в этой главе задач. Правда, мы не
обсуждали такие задачи, как ELL (г) и PAR (r), для случая
классов Ч^оп и 4% но можно сравнительно легко показать, что
их 8-сложность равна 0(8~1/г)-
Подытожим получающиеся результаты в виде следующей
теоремы.
Теорема 8.1. (i) Пусть S—это DIF(r) или INP. Тогда
Wxt™ ^ W? ^ Wnon u\Jfa\j шпоп
* NON л-ч *L r^ ^L ^ * / г\ * / •
(ii) Пусть S — это INT. Тогда
X ^?on > 4ff X
(iii) Пусть 5—это АРР или HYP (г). Тогда
^non > VI X ЧГ > Т? X Ч70П.
(iv) Пусть S—это ELL(r) или PAR (г). Тогда
> VI X ТГ > Т| X ^Г-
220
Ч. Л, гл. 10. Другие модели аналитической сложности
(v) Пусть 5—это NON или UNI. Тогда
Заметим, что, поскольку нам неизвестна s-сложность задач
NON и UNI в классе ЧГ1. мы не знаем, являются ли в-эквива-
лентными классы ЧГ? и ?* и будет ли ^Pnon существенно
эффективнее ??. Если, однако, гипотезы 3.1 и 7.1 гл. 8 верны, то
9. РЕЗЮМЕ
Для удобства читателя результаты этой главы, касающиеся
0-сложности, собраны в табл. 9.1.
Просматривая ее по столбцам, получаем иерархии сложности
классов информационных операторов для фиксированной задачи,
а просматривая по строкам,— иерархии сложности задач для
фиксированного класса информационных операторов.
Таблица 9.1
U/поц
\ул
ш«>
DlF(r)
INP
1
I
I
i
i
Глава 10
INT
e-'A
«-*
l
l
l
ЛРР
HYP(r)
e-'A
?-'A
1
ELL(r)
«-'A
.-«A
log l/e
log l/e
I
PAR(r)
6-'A
e-'A
VuiglTi
v/log l/e
1
NON
UNI
log l/c
.-•
?
I
ДРУГИЕ МОДЕЛИ
АНАЛИТИЧЕСКОЙ СЛОЖНОСТИ
1. ВВЕДЕНИЕ
До сих пор изучалась модель наихудшего случая для
аналитической вычислительной сложности. В этой главе мы кратко
обсудим четыре другие модели: среднего случая, с
относительной погрешностью, с возмущениями и асимптотическую.
2. Модель среднего случая 221
Дадим обзор результатов главы. В § 2 излагается постановка
вопроса об анализе модели среднего случая. В следующем
параграфе показывается, что модель с относительной погрешностью
не представляет интереса для линейных задач, а также вкратце
обсуждается модель с относительной ^-погрешностью. В § 4
приводится пример, показывающий, что некая информационная
модель с возмущениями ничуть не полезнее нашей модели, не
учитывающей ошибок. В заключительном параграфе мы вводим
понятия, необходимые для описания асимптотической модели, и
перечисляем возникающие в рамках этой модели интересные
задачи.
2. МОДЕЛЬ СРЕДНЕГО СЛУЧАЯ
Обсуждавшаяся до сих пор модель—это модель наихудшего
случая в отношении элементов задачи из заданного класса.
Следовало бы определить и изучить вероятностную модель—модель*
среднего случая.
Наша гипотеза состоит в том, что если S—линейный
оператор, а $1—линейный и неадаптивный оператор, то для модели
среднего случая получатся такие же или почти такие же
результаты, как и для модели наихудшего случая. Эту ситуацию
интересно сопоставить с ситуацией в других разделах теории
сложности, например в теории сложности комбинаторных задач, где
результаты для среднего и наихудшего случаев различаются очень
сильно.
Как было показано выше, класс линейных адаптивных
информационных операторов позволяет узнать о линейных задачах не
больше, чем класс неадаптивных линейных информационных
операторов. Это значит, что для каждого неадаптивного
информационного оператора существует элемент задачи, применительно
к которому адаптация не приносит пользы. Важно знать, какова
в данном классе доля элементов задачи, применительно к
которым адаптация окажется полезной. Если эта доля велика, то
в модели среднего случая для линейных задач адаптация может
дать значительный эффект.
Было бы также интересным исследовать модель среднего
случая для нелинейных операторов решения и нелинейных
информационных операторов.
3. МОДЕЛЬ С ОТНОСИТЕЛЬНОЙ ПОГРЕШНОСТЬЮ
Мы занимались все время анализом модели, в которой мини*
мизируется абсолютная погрешность е ((p)=sup/e30||S (/) — ф (ЭТ(/))||
алгоритма <р. Напрашивающееся возражение против этой модели
222 Ч. Л, гл. 10. Другие модели аналитической сложности
заключается в том, что во многих случаях желательно
минимизировать относительную, а не абсолютную погрешность
алгоритма, т. е. нас интересует «относительный радиус»
,3.,) *,*.*>
(мы считаем, что 0/0 = 0).
Покажем, что, по крайней мере в линейном случае, это не
приводит к интересной модели. А именно, докажем, что для
линейных операторов 5 и $1 и для уравновешенного выпуклого 30
@, если г (9(tf S) = 0,
C.2) ге1^М,
Действительно, если г(Щ, S) = 0, то существует алгоритм ф,
для которого е(ср) = О; отсюда следует, что ф(9?(/)) = 5/ V/g80
и relr(?l, 5) = 0. Предположим теперь, что r(dl, S) > 0, и
возьмем произвольный алгоритм ф. Заметим прежде всего, что если
ф@)=5^=0, то, полагая / = 0?30, получаем ||0—<р @)||/||0| = +оо.
Поэтому пусть ф@) = 0. Тогда из того, что г (ЭД, S)>0, следует,
что существует /?ker9in30, для которого S/=^0t Ясно, что
IS/—ф @)||/||S/||= 1, откуда вытекает, что rel r (% S)^ 1. Выбирая
Ф(*){(/))= 0, убеждаемся, что ге1г(ЭД, S)=l. Тем самым C.2)
доказано.
Итак, за исключением тривиального случая r Eft, S) = 0,
невозможно найти для элементов решения аппроксимацию с
относительной погрешностью, меньшей единицы, сколько бы линейных
функционалов ни привлекалось для вычислений.
Можно возразить, что относительная погрешность,
определяемая формулой ||5 (/)—ф (Ш (f))\\/\\S (/)||, не является разумной мерой
погрешности, поскольку такое определение налагает требование
малости относительной погрешности даже для тех элементов /,
для которых величина |S/|| исключительно мала. Поэтому
рассмотрим другую меру относительной погрешности, которая уже
приводит к полезной модели.
Пусть г\ > 0—заданное (малое) число. Предлагается модель
с относительной погрешностью, в которой минимизируется величина
C.3) 15(/)-фEК(/))«/A|5(/)« + г1).
Если норма |S(/)|| велика по сравнению с т|, то величина C.3)
близка к относительной погрешности, если же норма ||5/|| мала
по сравнению с г), то величина C.3) близка к абсолютной
погрешности. Определим относительный радиус формулой
C.4, «rKS.*-^
Зш Модель с относительной погрешностью 223
Предполагая S и Ш линейными, а 30 уравновешенным и
выпуклым, докажем, что
<3'5) rfff) + 2Y]<rel/>(^ S> Ti)<min(l, r(91, 5)/л).
Действительно, полагая ф(ЭД(/))=0, получаем, что rel rC7, S, г))<;1.
Далее,- пусть б—произвольное положительное число и ср—такой
алгоритм, что е(ф)<>(9?, S) + 6. Тогда
(г C1,
чем доказано правое неравенство в C.5).
Докажем левое. Пусть f ? ker Щ П 30 и
sup |SA|—б = 1й(й, S)—б.
Для произвольного алгоритма ф имеем
откуда || 5 (с/)—ф @) || ^ || 5/1|, где с = — 1 или -f 1. Поэтому
В силу произвольности б и ф, получаем левое неравенство в C.5).
Из C.5) вытекает, что
(i) если Ti^dfSR, S), то
rel г (91, 5, г))~1;
(ii) если 2r|<d(9l, S), то
rel г (91, S, ч)€[0.5, 1];
(iii) если d(91, S).^t| и г (% S) = d(9l, S)/2, то
Это означает, что если 2т] меньше или сравнимо с d($l9 5),
то относительная погрешность имеет величину порядка единицы.
Если у\ значительно больше d(9l, 5) и г (9?, S) = d(% S)/2
(а в большинстве практически важных случаев это так), то
величина rel r (dl, S, ц) приблизительно равна радиусу информации,
поделенному на т). Ясно, что для линейных задач теория,
развитая для модели с абсолютной погрешностью, справедлива,
с соответствующими видоизменениями, и для моделей с
относительной ^-погрешностью, надо только всюду г (9Z, S) заменить
на г (97, S)h\.
Было бы интересно исследовать модель с относительной
погрешностью для случая нелинейных S или Ш.
224 Ч. А, гл. 10. Другие модели аналитической сложности
4. МОДЕЛЬ С ВОЗМУЩЕНИЯМИ
Некоторые авторы отмечают, что в практических вычислениях
значение $1 (/) информационного оператора $1 не может быть
известно точно. Поэтому они исходят из предположения, что им
известен лишь элемент у> такой что \\у—9ГС(/)||^б, где
б—наперед заданное малое положительное число.
Мы решили рассматривать информационные операторы «без
возмущений», т.е. при 6 = 0, по трем причинам: A) задачи с
информационными операторами без возмущений легче поддаются
анализу; B) даже в этом случае существуют сколь угодно
сложные задачи; C) [эта причина самая важная] нам представляется,
что модель с б > 0 для приложений полезна ничуть не более,
чем модель без возмущений.
Чтобы мотивировать нашу точку зрения, рассмотрим
следующий пример. Предположим, что 3О = Ц7?—это класс
определенных на [а, Ь] скалярных функций с абсолютной непрерывной
( 1)й й ||fir)\ < 1^1 З 3
[ ] р фу рр
(г — 1)-й производной и с ||fir)\р < 1, г^1. Заметим, что 30 не-
ограничено, т.е. sup/€3o||/||/?= +cx>, так как любой многочлен
степени г — \ принадлежит 30. Пусть 9i(/)==[/(*i), f(x2)9 ...,
f(xn)][ для попарно различных точек xh и пусть (SR (/)!==
=тах {| /(Х/)!: /== 1, 2, ..., п}. Итак, элемент у=[уи y2, ..., уп]{
удовлетворяет условию
D.1) |#/-/(*/)l<S V/?30 Vf€[l, n].
Отсюда следует, что независимо от того, каково значение нормы
9?(/), мы знаем его приближенно с абсолютной погрешностью,
не превосходящей б. Однако, даже приняв нереалистическое
предположение о том, что единственным источником погрешности
является представление f(x{) в арифметике с плавающей
запятой, мы в лучшем случае имеем ^ — A +Л*)/(*/) с |г]/К2"/,
где t—число битов мантиссы. Поэтому
Уг— /(**)-Л//(*/).
и \у{—f(Xi)\ может быть порядка 2mmf\f(xi)\. Так как величина
\f(x;)\ неограниченна на 30, то даже в этой весьма
благоприятной ситуации условие D.1) нарушается.
Этот пример, как мы надеемся, свидетельствует в пользу
того, что предположение о точном знании информации 9? (/) и
предположение о знании элемента г/, для которого ||#—ЭТ(/)||^б,
одинаково пригодны для приложений.
Хотя мы не собираемся анализировать здесь эффекты
наличия ошибок в информации 9i(/), приведем некоторые
соображения, показывающие, как можно подступиться к решению этой
проблемы. Ошибки в информации Ш (f) следует изучать совместно
с ошибками реализации алгоритма. Действуя в духе используе-
$. Асимптотическая модель 225
мой в вычислительной линейной алгебре модели типа Уилкин-
сона, нужно ввести понятия числа обусловленности и
устойчивости алгоритма. Число обусловленности—это мера
чувствительности задачи к малым изменениям элементов задачи. Устойчивость
алгоритма гарантирует, что погрешность реализации алгоритма
вызывает погрешность решения, пропорциональную произведению
числа обусловленности на норму погрешности информации. Нам
кажется, что наличие свойства устойчивости алгоритма можно
установить для многих задач.
5. АСИМПТОТИЧЕСКАЯ МОДЕЛЬ
В нашей модели предполагается, что для аппроксимации
оператора решения S используется один информационный
оператор Ш. Здесь мы рассмотрим асимптотическую модель
аналитической сложности, в которой предполагается, что для
аппроксимации S используется последовательность информационных
операторов. Мотивировкой для этой модели служит следующий
пример.
ПРИМЕР 5.1. Пусть Зо^З^—класс скалярных функций на
[О, 1] с непрерывными вторыми производными, и пусть
1
E.1) Sf~lf(t)dt, %(f) = [f(x,), fix,), ..., f(xn)f,
О
где */=*(/—\)h9 h=l/(n—1), f=l, 2, ..., п. Поскольку
оператор ограничений Т равен здесь 0, то
r'QRn9 S)«sup{|Sft|: ft € ker 9U «= + оо Vn.
Это означает, что не существует использующего $1п алгоритма
с конечной погрешностью.
Несмотря на то что радиус информации бесконечен, мы можем
при фиксированном / поступить следующим образом.
Аппроксимируем 5/, пользуясь алгоритмом (формулой) трапеций:
E.2) ФЯ(ЯЯ (/))=* A tf@) + /(l))/2 + h S
i
i =i
Известно, что
E.3) S/-9B(^e(/)) =
где l?{0, 1). Тот факт, что величина |/"EI может быть сколь
угодно большой, объясняет, почему
8 № 564
226 Ч. Ау гл. 10. Другие модели аналитической сложности
Однако при каждом фиксированном / последовательность
{q>n($ln(f))} сходится к S/, причем скорость сходимости
пропорциональна п"%. Это значит, что при фиксированном / можно
сколь угодно точно аппроксимировать Sf последовательностью
алгоритмов ф„, используя последовательность информационных
операторов Шп.
Заметим, что в случае оператора ограничений 77 = /"
хорошая аппроксимация для 5/ получается при каждом f из класса
{/: |1П-<1}; а именно,
Если Г = 0, как в нашем примере, то мы получаем хорошую
аппроксимацию для 5/ при фиксированном f лишь при
стремлении п к бесконечности.|
Этот пример подводит к изучению следующей модели
аналитической сложности.
Пусть ф = {фп}—некоторая последовательность алгоритмов фп,
а Ш = {$1„\— последовательность линейных информационных
операторов §1п с card(9tj = я. Будем писать ф?Ф(91), если ф=={фп}
и каждый алгоритм ф„ использует информацию $1п. Пусть S —
оператор решения. Определим
E.4) e(Vn9f) = lS{f)-<pn&ta(f)n
как погрешность уп на элементе /. Мы интересуемся, для
фиксированного элемента /, поведением е(<рв, /) при стремлении п
к бесконечности.
Будем называть <р ^Ф (Ш) асимптотически сходящейся
последовательностью алгоритмов для задачи S, если
E.5) Нте(Ф,Л) = 0
Будем называть 9tf = {9irt} асимптотически сходящейся
последовательностью информационных операторов для задачи S, если
существует асимптотически сходящаяся для S
последовательность ф?Ф(91).
В примере 5.1 последовательность $1п> заданная формулой
E.1), асимптотически сходится для S, хотя г ($ln, S)= +oo Уд.
В случае когда последовательность ф ? Ф ER) асимптотически
сходится для S, интересно знать, насколько быстро сходится
к нулю последовательность {е(уп, /)}.
Будем говорить, что функция р = р(!ЭТ, ф) есть мера асимто-
тической скорости сходимости последовательности
если для каждого / ? Эо
E.6) е(фл,/) = О(р(>0) при п-^ + оо
5* Асимптотическая модель 227
и для некоторого / оценка E.6) является точной, т. е.
E.7) е (фя, /) = в (р (п)) при п — + оо.
Заметим, что если /—произвольная дважды дифференцируемая
функция, то для последовательности формул трапеций р(п) = п~2
(см. E.2)). Чтобы подчеркнуть зависимость от 9? и ф, будем
иногда писать р(п) = р($1, ф, п).
Как всегда, нас интересуют оптимальные алгоритмы. Здесь
они определяются следующим образом. Будем называть ф*=
={фл}€Ф(^О асимптотически оптимальной последовательностью
алгоритмов для задачи S, если для каждой последовательности
E.8) рA, ф% п)*=О(р(Ш, ф, л)) при п-юо.
Пусть 4е—некоторый класс последовательностей
информационных операторов $1 = {$1п\. Тогда $1* = {№„}?4 называется
асимптотической оптимальной в ? последовательностью
информационных операторов для задачи S, если для любых 91 ?*? и
E.9) Р(Ш*,Ф*, п) = О(р(Ш9ч,п)) при п-* + оо.
Здесь ф*—асимптотически оптимальная последовательность
алгоритмов, принадлежащая Ф(91*).
Асимптотически сходящиеся алгоритмы широко используются
в численном анализе. В качестве примера укажем квадратные
формулы Гаусса, Ромберга и составные квадратурные формулы.
Однако если асимптотически сходящиеся алгоритмы применяются
к задаче с бесконечным радиусом информации, то никогда нельзя
быть уверенным, решена ли задача с какой бы то ни было
точностью в данном классе элементов задачи. При каждом
фиксированном п разность 5 (/) — ф„ (91„ (/)) будет по модулю сколь
угодно велика для некоторых элементов из 30.
Подчеркнем, что асимптотическую модель можно
использовать и для задач с малым радиусом информации. В этом
случае асимптотически оптимальная последовательность алгоритмов
Ф„ может давать аппроксимации, для которых разность S(f) —
— ФЛ^Л/)) мала (по модулю) для каждого п и каждого /(Е<30.
Перечислим некоторые интересные задачи, возникающие
в связи с этой асимптотической моделью.
(i) Для каких задач S существует асимптотически
сходящаяся последовательность линейных информационных операторов?
(и) Как получить для данной задачи S асимптотически
оптимальную последовательность алгоритмов и асимптотически
оптимальную последовательность информационных операторов?
8*
228 Ч. А, гл. 10." Другие модели аналитической сложности
(Hi) При заданной функции р, каков класс операторов
решения, для которых р есть мера асимптотической скорости
сходимости асимптотически оптимальной последовательности
алгоритмов, использующей асимптотически оптимальную
последовательность информационных операторов?
Оценку сложности для описанной модели можно провести
следующим образом. Допустим, что мы хотим найти 8-аппрокси-
мацию_для S(f) при каждом /?30. Пусть последовательность
ф?Ф(91) асимптотически сходится для задачи S и р = р(ЭД, ф)
есть мера асимптотической скорости сходимости ср. Предположим
дополнительно, что р —взаимно-однозначная функция и р""х(ся)=
=в(р~1(я)) для каждого фиксированного положительного с при
я—*<х>. Пусть n=*n(ft г)—наименьшее целое, такое что
?(Фи>/)<8- Так как e(q>n, f)=*O(p(n))9 то, в силу наложенных
на р требований,
E.10) п (/, е) - О (р~* (8)) при 8 — 0,
причем эта оценка является точной, т. е. существует такой
элемент /?30, что О можно заменить на в. Если сложность
вычисления ф„ (9^я (/)) пропорциональна кардинальности Ша> то
E.11) сотр (/, 8) = О (p-i (е)) при 8 -* 0.
Заметим, что постоянная, неявно фигурирующая в E.11),
зависит от / и может быть сколь угодно большой для некоторых
элементов /\
Нам кажется, что дальнейшее развитие описанной
асимптотической модели приведет к богатой теории.
Часть В
Модель с итеративной
информацией
1. ВВЕДЕНИЕ
Эта часть книги посвящена исследованию итеративной
информационной модели аналитической сложности. В настоящем
введении мы сопоставим понятия и результаты частей А и В.
В ч. А была рассмотрена общая информационная модель
аналитической сложности. В частности, было показано, что
заданный информационный оператор может быть недостаточно
«сильным» для того, чтобы обеспечить получение решения задачи
о желаемой точностью е. Может, однако, оказаться, что при
помощи этого информационного оператора удается вычислять
лучшее приближение, исходя из некоторого уже имеющегося.
Повторяя эту процедуру, возможно удастся в конце концов
решить задачу с точностью е даже при сколь угодно малом 8.
Это неформальное описание итеративного информационного
оператора и итерационного алгоритма будет формализовано в § 2.
Часть В основана на исследованиях последних 20 лет по
теории итеративной сложности, начатых работами Трауба [61, 64].
В ней представлены как обобщения ранее полученных
результатов, так и новые результаты и проблемы. На основании
собственного опыта мы можем утверждать, что материал части В
с точки зрения понятий и методов сложнее материала ч. А.
Всюду в этой части мы ограничиваемся рассмотрением
итеративной линейной информации, и вот по каким причинам.
1. Наши результаты по линейной теории весьма сильны.
В некоторых случаях удается полностью ответить на
поставленные вопросы.
2. На практике часто можно получать лишь линейную
информацию.
3. Класс нелинейной информации слишком велик (см, гл. 7
ч. А), и большинство задач становятся тривиальными.
230 Ч. В. Модель с итеративной информацией
Как было указано в обзоре содержания книги, в нашей
теории используются две математические модели аир. По
упомянутым там причинам рассмотрению модели а уделено много
места в обеих частях А и В. Напомним читателю, что
устанавливаемые для модели а отрицательные результаты тем более
сильны, что они не зависят от модели вычислений. Обсудим
теперь некоторые из результатов данной части, относящиеся
к модели а.
Наиболее глубокий вопрос, изучаемый в ч. В,— это вопрос
о том, какие задачи можно решить итеративно, используя
итеративную линейную информацию. По традиции одни задачи
решают итеративно, другие—нет. Например, нуль скалярной
нелинейной функции аппроксимируют с помощью итераций,
использующих вычисленные значения функции; приближенное
значение определенного интеграла от скалярной функции
вычисляют без помощи итераций. Так и должно быть? Точнее, для
каких задач класс итерационных алгоритмов (понимаемый в
самом широком смысле, принятом в данной книге) пуст? Для
одноточечных стационарных итераций, использующих
итеративную линейную информацию, мы даем решение этой задачи,
показав, что указанный класс пуст, если «индекс» задачи
бесконечен. Выдвигается некая гипотеза, характеризующая все задачи
с конечным индексом. Если эта гипотеза верна, то по существу
итерациями можно решать только нелинейные уравнения.
Как уже и ранее отмечалось в этой монографии, выявление
центральной роли информации приводит к большой общности и
вместе с тем к замечательной простоте. Мы показываем, что
максимальный порядок любого алгоритма, использующего
заданную информацию, есть «порядок информации». Этот
максимальный порядок не зависит от гладкости, структуры или каких-либо
других характеристик алгоритма. Алгоритмы максимального
порядка играют роль, аналогичную роли оптимальных по
точности алгоритмов в ч. А. Порядок же информации играет роль,
аналогичную роли радиуса (или диаметра) информации, поскольку
обе характеристики служат мерой «силы» информационных
операторов.
Как и в ч. А, мы заинтересованы в том, чтобы определить
наиболее «подходящую» информацию для данной задачи. Для
класса итеративных линейных информационных операторов на
этот вопрос дан полный ответ.
Опишем теперь понятия и результаты, относящиеся к
модели р. Оптимальным по сложности алгоритмам ч. А
соответствуют здесь «алгоритмы минимального индекса сложности». В § 3
пояснено, почему нас больше интересуют алгоритмы,
минимизирующие индекс сложности, а не саму сложность.
В ч. А было доказано, что оптимальный по точности алго-
L Введение 231
ритм почти оптимален по сложности, если его комбинаторная
сложность мала или сравнима с информационной сложностью.
В данной части устанавливается аналогичная взаимосвязь между
алгоритмами максимального порядка и алгоритмами
минимального индекса сложности.
В ч. А было доказано, что сложность задачи может быть по
существу любой функцией и что существуют даже линейные
задачи сколь угодно большой сложности. В противоположность
этому мы показываем, что в постановке данной части сложность
есть бесконечность, в (log 1/е) или 0 (loglog 1/е). Так, если задача
решается каким-то итерационным алгоритмом ср порядка выше
единицы, то сложность ф ведет себя при 8, стремящемся к нулю,
как z (loglog 1/е) A -f о A)), где г—индекс сложности алгоритма ср.
Итак, при малых е минимизация сложности ср эквивалентна
отысканию алгоритма с минимальным индексом сложности.
Преимущества от использования алгоритмов минимального
индекса сложности ограниченны. Отношение сложности алгоритма
минимального индекса сложности к сложности любого
итерационного алгоритма порядка выше единицы асимптотически равно
отношению их индексов; оно не зависит от 8. Это отношение,
однако, может быть очень большим. В некоторых случаях оно
стремится к бесконечности (см. Трауб и Вожьняковский [77Ь,
Мы изучаем локальную сходимость итерационных алгоритмов,
т. е. предполагается, что начальное приближение достаточно
хорошо аппроксимирует решение. Совсем недавние результаты
Васильковского [78, 79] показывают, что в случае итеративной
линейной информации и нельзя с конечной сложностью добиться
большего, чем локальная сходимость. Он доказал, что для
задачи решения нелинейных уравнений класс итеративных
линейных информационных операторов слишком беден, чтобы даже
для сравнительно простых классов элементов задачи (таких как
класс комплексных многочленов, у которых все нули просты)
можно было с конечной сложностью получить глобально
сходящуюся стационарную итерацию или глобально сходящуюся
нестационарную итерацию.
Мы уже сталкивались с трудностями, возникающими в
постановке ч. А при анализе адаптивной информации для
нелинейных задач (см., например, гипотезы 3.1 и 7.1 гл. 8 ч. А).
В данной части адаптивной информации соответствует
многоточечная итеративная информация. С нею связана выдвигаемая
нами гипотеза 10.2. Нам кажется, что для получения глубоких
результатов (скажем, для решения вопроса, верна ли
упомянутая выше гипотеза) для многоточечной (т. е. адаптивной)
информации необходимы новые методы. С другой стороны, неадаптивной
информации соответствует одноточечная итеративная информация,
232 Ч. В. Модель с итеративной информацией
и здесь, мы располагаем гораздо более мощными методами, чем
в случае многоточечной информации.
Дадим обзор основных понятий и результатов данной части.
§ 2. Вводятся основные понятия: оператора решения 5,
итеративной информации $1 и итерационного алгоритма <р.
Определяются: d ER, S)—предельный диаметр информации 9? для
задачи S и4 p($l, S)—порядок информации 9i для задачи S.
Доказывается, что р(ЭТ, 5) служит верхней границей для порядка
любого алгоритма. Этой верхней границы достигают
«интерполяционные» алгоритмы.
§ 3. Описывается модель вычислений, состоящая, как и
в ч. А, из простейших операций, допустимой информации и
допустимых алгоритмов. Развивается методология анализа
сложности и показывается, почему желательно минимизировать индекс
сложности.
§ 4. В §§ 4—8 рассматриваются линейные информационные
операторы. В данном параграфе определяется кардинальность
card(9f) линейной информации 91. Показывается, что линейную
информацию конечной кардинальности п можно представить
с помощью п линейно-независимых линейных функционалов.
§ 5. В §§ 5 и 6 изучается вопрос о том, когда класс
итерационных алгоритмов пуст. В данном параграфе вводится
понятие итерационного алгоритма и доказывается, что класс
итерационных алгоритмов, использующих информацию 91, пуст, если
предельный диаметр d($l>S) положителен.
§ 6. Определяется ind E)—индекс задачи S и доказывается
(теорема 6.1), что если card (9?) меньше, чем ind(S), то
предельный диаметр й(Ш> S) положителен. В этом случае класс
итерационных алгоритмов, использующих 9J, пуст. Ввводится
основная информация 9J*, кардинальность которой равна индексу
задачи S, а предельный диаметр й(Ш*> S) равен нулю. Кроме
того, в теореме 6.3 доказано, что из равенства d(9i, S) = 0
следует, что Щ «содержит» 9i*.
§ 7. Для заданного т изучается вопрос о том, когда класс
итерационных алгоритмов порядка т пуст. Определяется /п-й
индекс задачи S и доказывается (теорема 7.1), что если
кардинальность информации меньше m-го индекса, то порядок
информации меньше т. Отсюда следует, что класс итерационных
алгоритмов порядка т пуст. Вводится m-я основная информация
$1*т, кардинальность которой равна m-му индексу 5, а порядок
информации не меньше т. Показано также, что из р(Ш, S)^m
следует, что информация Щ содержит Ш^ (теорема 7.3).
§ 8. Конкретизируется для линейного случая модель
вычислений. Выводятся оценки снизу и сверху на индекс сложности
и на n-й минимальный индекс сложности. Показано также, как
2. Диаметр и порядок информации 233
находить п-й максимальный порядок для задачи 5 и n-й
максимальный порядок информации для задачи S (теоремы 8.1 и 8.2),
§ Р. Дается определение информации с памятью и соответ-
ственно обобщаются понятия и теоремы, относящиеся к
предельному диаметру и порядку информации, интерполяционным
алгоритмам и индексу сложности.
§ 10. Приводятся некоторые дополнения и формулируются
некоторые открытые проблемы. Выдвигается гипотеза 10.1,
дающая описание задач, которые можно решать при помощи
итерационных алгоритмов, используя одноточечную линейную
информацию конечной кардинальности. Если эта гипотеза верна, то
с помощью таких итераций можно решить по существу только
лишь нелинейные уравнения. Далее, в обобщение гипотезы
Кунга—Трауба выдвигается гипотеза 10.2, согласно которой
максимальный порядок многоточечных итераций, использующих
для решения скалярных нелинейных уравнений информацию
кардинальности п, не превосходит 2п~1 для итераций без памяти
и не превосходит 2п для итераций с памятью.
§ 11. Проводится сравнение результатов частей А и В,
касающихся предельного диаметра и порядка информации, а также
асимптотической зависимости сложности от г.
Добавление. Доказывается (лемма Д.1), что при весьма
слабых предположениях наше определение порядка алгоритма
согласуется с «классическим».
2. ДИАМЕТР И ПОРЯДОК ИНФОРМАЦИИ
Рассмотрим, как и в ч. А, линейный или нелинейный
оператор решения
B.1) 5: 3e-+3lf
где 30—некоторое подмножество линейного пространства 3i над
полем вещественных или комплексных чисел, а
Э2—нормированное линейное пространство над полем вещественных или
комплексных чисел. Мы хотим аппроксимировать элемент решения
а==5(/) для всех элементов задачи f?30. Пусть х0—начальное
приближение к решению а, а е', б'?@, 1),— заданное
вещественное число. Говоря о решении (или апроксимации решения)
задачи S, мы имеем в виду, что ищется е'-приближение y = (f)
3 к элементу а, удовлетворяющее условию
B.2)
Чтобы найти такое приближение, нужно что-то знать об
элементе задачи /. Пусть
B.3) Ж:
234 Ч. В. Модель с итеративной информацией
— итеративный информационный оператор' (не обязательно
линейный); предполагается, что (f,x)?Dyt для всех/?30 и всех х,
достаточно близких к a = S(/);33—некоторое заданное
пространство. Мы называем Ш итеративным информационным оператором,
так как значения Ш (/, л:) вычисляются для азличных х и
каждое следующее приближение xk+1 основывается на информации
9I(/, xk)y k = 0, I, ... . Для краткости будем иногда называть $1
просто информационным оператором. Так определенная
информация 9] есть стационарная информация без памяти в смысле
Трауба [64]. Для большинства задач информационный оператор $1
не является взаимно-однозначным и значение $1 (f,x) не
определяет однозначно решения a = S(f). Это значит, что существует
много различных f?30 с одинаковой информацией 9i(/, x). Для
заданного f множество всех элементов задачи f(x), таких что
f(x)€%o и 9?(f(x), x) = $t(f, x), задает «неопределенность»
информационного оператора 9L Отметим, что ] = ](х) есть функция
от ху которая при каждом х, достаточно близком к а, дает ту
же информацию, что и элемент задачи /. По техническим
причинам надо предполагать, что функция f «регулярна» в точке а.
Это понятие формализуется в виде понятия «равенства
относительно 9Ь.
ОПРЕДЕЛЕНИЕ 2.1. Будем говорить, что функция f: Dj с
с32—»30 равна f относительно 9{, если
(i) f?W, где W—некоторый заданный класс, и существует
такое Г == Г (/) > 0, что
||<Г}?>7, где
(ii) SR(f(*); x) = $l(f, x) j
Для краткости будем в таком случае писать f?V(f), т. е. V(f)
обозначает множество всех функций f, равных / относительно 9t. |
Класс W описывает регулярность функции f, и его
определение зависит от регулярности оператора решения S. Всегда
предполагается, что постоянная функция f(x) = f принадлежит W.
Предельный диаметр информации мы определяем как
максимальное расстояние между значениями 5 на двух элементах
задачи с одинаковой информацией в х при х, стремящемуся
к a = S(/). Как мы покажем в § 5, для того чтобы задачу S
можно было решить итеративно при произвольно малом е',
предельный диаметр линейного информационного оператора должен
быть равен нулю.
ОПРЕДЕЛЕНИЕ 2.2. Предельным диаметром информации^
для задачи S будем называть величину d(!W, S), задаваемую
2. Диаметр и порядок информации
235
С *f J
s
формулой
B.4)
Рис. 7
sup limsup||S(/1 (*))—S(?,
Будем называть информацию ЭТ сходящейся для задачи S, если
B.5) ОД S) = 0,
и расходящейся, если d(9?, 5) > 0. |
Заметим, что предельный диаметр информации Щ. совпадает
с диаметром информации $1, введенным в ч. А, для
информационных операторов, не зависящих от х, т. е. таких что
8t(M)-.0itf).
Дадим геометрическую интерпретацию условия B.4).
Предположим, что отображение S(f(x)) непрерывно в точке а при
любом f?V(f). Тогда
B.6) й(Ш, S) = sup sup
f<=5» 7,7* 6
Рассмотрим U(/) = \S(f(a)): f?V(J)}—множество всех решений
5(/(а)) при той же информации в окрестности а, как и у /,
Из B.6) следует, что
B.7)
, SHsupdiam(t/(f)),
f 6 %
где diam ([/ (/)) обозначает диаметр множества U (f) (см. § 2
гл. 1 ч. А). Ситуация представлена схематически на рис. 7.
Информация ЭТ является сходящейся для S в том и только
том случае, если множество V (/) содержит только один элемент
a = S(/). Таким образом, на рис. 7 изображен расходящийся
информационный оператор, т. е. оператор, для которого
d(% S)>0.
236 Ч. В. Модель с итеративной информацией
Проиллюстрируем понятие предельного диаметра информации
на примере.
ПРИМЕР. 2.1. Пусть ft* — класс аналитических операторов
f: DfdB^-^ 52, где Вг и В2— банаховы пространства, причем
dim (i^) — dim (В2). Пусть 30—класс аналитических операторов
с единственным простым нулем, г. е. /?30, если и только если
f^Si и существует единственное a?Df, такое что /(а) = 0 и
оператор Г(а)-1 существует и ограничен. Положим
B.8) StfWM), 3,<
Таким образом, а==5(/) есть решение нелинейного уравнения
f(x) = O. Пусть, далее,
B.9)
где /—некоторое неотрицательное целое число, а /^ обозначает
/-ю производную по Фреше. В этом примере f(x)=J(x, • )—
аналитический по второму аргументу оператор. Пусть W = C/+1—
класс всех /+1 раз непрерывно дифференцируемых в а
функций /. Примером функции /, принадлежащей !/(/), может служить
функция
Fix, /)={
f(t) + c в случае />0,
f(t) + L(t—хJ в случае / = 0,
зом выбранный э
ператор. Легко пр<
оо в случае / > О,
где с—соответствующим образом выбранный элемент из
a L—некоторый билинейный оператор. Легко проверить, что
B.10) d(% 5)-, п
v 7 v ' ( 0 в случае
Итак, в случае / = 0 имеем сходящуюся информацию. |
Замечание 2.1. В части А мы определим радиус г(Щ, S)
информации ЭТ для задачи S, г(ЭТ, SN[d(^, S)/2, й(Шу S)]. Так
как здесь наше внимание привлечено к сходящимся
информационным операторам для которых d@t, S) = r(9?, S) = 0, то
рассматривать предельный радиус информации нет нужды. |
Будем решать задачу B.2) при помощи алгоритма ср,
определяемого как следующее отображение:
B.11) <р: Офс32хЩО*)-+ 32
(см. также определение «допустимого алгоритма» в § 3).
Напомним, что х0 обозначает у нас начальное приближение к
решению a = S(/). Отправляясь от х0, алгоритм ср порождает
последовательность приближений
B.12) *,+1 = ф(*,; Я (Л xt)), Ы0,19 ....
2. Диаметр и порядок информации 237
Таким образом, ср—стационарный алгоритм, а поскольку xi+i
зависит только от последнего предыдущего приближения х{, то
Ф—алгоритм без памяти в смысле Трауба [64]. В § 5 мы наложим
некоторые условия на ф и получим понятие итерационного
алгоритма. Информационные операторы с памятью и стационарные
алгоритмы с памятью будут рассмотрены в § 9. Анализом
нестационарных алгоритмов мы здесь заниматься не будем.
Обозначим через Ф(91, S) класс всех алгоритмов вида
B.11) —B.12). Пусть ф?Ф(91, S). Исследуем сходимость
последовательности {х{\ к а. Так как ф—стационарный алгоритм, то
достаточно выяснить, как xt зависит от х0 и стремится ли х$
к а при стремлении х0 к а. Напомним, что алгоритм использует
информацию 91(/, я). Пусть f?V(f)9 что означает полное
совпадение информации для a = S(f) и a = S(j(x)). Тогда любой
алгоритм ф даст одно и то же -приближение к элементам
решения а и а. Поскольку мы не можем отличить f(x) от /, то
алгоритм ф должен давать аппроксимацию не только для элемента
решения а, но также и для элемента решения а. Этим
мотивировано
ОПРЕДЕЛЕНИЕ 2.3. Будем называть величину е(ф),
задаваемую формулой
B.13) efa) = sup sup limsup|q>(x, 91 (f, x))— S(f(x))l
предельной погрешностью алгоритма ф. Алгоритм ф называется
сходящимся, если е(ф) = 0. |
Докажем, что d(9i, S)/2 служит оценкой снизу на е(ц>) для
любого алгоритма ф из класса Ф(91, S).
Теорема 2.1. Для любого алгоритма ф€Ф(9?, S)
B.14) eD)>d(%9 S)/2.|
Доказательство. Пусть a = S(/). Для произвольных fx и f2
из V (J) имеем
Km | S (/, (х)) -S (f2 (x)) I < Hm (|| q> (x9 91 (/, x)) -S <ft (x))\\
Взяв верхнюю грань по / и по ft, f2, получим, в силу B.4),
неравенство d($l, S)^2e(y), чем B.14) и доказано. |
Теорема 2.1 утверждает, что d (91, 5)/2 является неустранимой
ошибкой информации 9J для любого алгоритма ф. Это
утверждение представляет особый интерес в случае расходящейся
информации 9i(d(9t, S) > 0): в этом случае, к каким бы ухищрениям
238 Ч. В. Модель с итеративной информацией
ни прибегать, невозможно построить алгоритм с погрешностью,
меньшей d($ft, S)/2. Как показано в примере 2.1, бывает даже,
что d($l, S) = + оо.
А теперь докажем, что d (ЭД, S) оценивает сверху погрешность
«интерполяционных алгоритмов», которые определяются
следующим образом.
ОПРЕДЕЛЕНИЕ 2.4. Будем говорить, что ф1 ?Ф{$1, S)
является интерполяционным алгоритмом, если
B.15)
для некоторого /?(/)
Это означает, что по информации $1 (f, х) отыскивается элемент
задачи f(x) с той же информацией в х, что и /, и в качестве
следующего приближения принимается решение задачи S(f(x)).
На практике выбирают J {х), которое «проще», чем /. В
некоторых случаях оговаривается еще, как выбрать единственное / (х).
Примерами интерполяционных в этом смысле алгоритмов служат
алгоритмы Ньютона, секущих, а также любые
интерполяционные алгоритмы /Д| s решения нелинейных уравнений (см. Трауб
[64] и Вожьняковский [74]).
Теорема 2.2. Для любого интерполяционного алгоритма
еФДО, S)
B.16) е^Х^ЭТ, 5). |
Доказательство. Возьмем произвольное f ? 30. Имеем
ф1 (х, 5i(/, х)) = S G0 (х)) для некоторого fo? V(f). Следовательно,
S)
для любого f?V(f). Взяв верхнюю грань по / и }, получим, что
A)^^^ 5)
Из теорем 2.1 и 2.2 вытекает
Следствие 2.1. Сходящийся алгоритм имеется в Ф(ЭТ, 5)
в том и только том случае, когда информация 01 сходится для
задачи S, т. е. когда d(9J, S) = 0.|
Для сходящихся информационных операторов 5 (/ (х))
стремится к a=t=5(/) при стремлении х к а для всех J^V(f). Введем
понятие «порядка информации», служащего мерой скорости
сходимости S(f(x)) к S(f) в наихудшем случае. Пусть множество
2. Диаметр и порядок информации 239
вещественных чисел А определено равенством
B.17) Л= {<?: <7>1 и (/€30) a = Stf), /eV(/), л > 0)
ЦАТ-ОСП^
ОПРЕДЕЛЕНИЕ 2.5. Величину p($i, S), задаваемую
формулой
если А пусто,
v ' ч ' \ sup Л в противном случае,
назовем порядком информации $1 для задачи S. |
Заметим, .что для расходящихся информационных операторов
7, S) = 0. Легко удостовериться, что р(Ш, S) является целым
числом для достаточно регулярных функций S(f(x)). Грубо
говоря, порядок р~р($1, S) показывает, сколь быстро S(f(x))
стремится к S(f): ||S(/"(*))—S(/)|| = O(||x—a\\P) для всех/?!/(/).
Мы докажем, что порядок любого алгоритма из Ф (9?, S) не выше,
чем порядок информации. Это существенно упрощает анализ
сложности, так как максимальный порядок алгоритма не зависит
от «структуры» алгоритма, а зависит лишь от используемой
информации (см. § 3). Проиллюстрируем понятие порядка
информации на примере.
ПРИМЕР 2.2. Рассмотрим задачу решения нелинейных
уравнений, обсуждавшуюся в примере 2.1. Возьмем стандартную
информацию
B.19) 91 (f, х) = [/ (*), /' (х), ..., /<«-*> (*)], п > 2,
и пусть W = Сп—класс всех п раз непрерывно дифференцируемых
в а функций f. Тогда f?V(f) означает, что J(J) (x, t) |f=Jf = /(y)(*)
при / = 0, 1, ¦.., п— 1, где через f1^ обозначена /-я
производная Фреше по второму аргументу. Далее,
1
Fix, 0-/@=
откуда при /=--=a получаем, что f(xy ot) = О(|]д:—а\п). Так как
0 = f (^, 5) = f(x, a)+f'(x, a)E-a) + 0(||a-ap), a f (x, a)
стремится к оператору /'(a), являющемуся обратимым, то мы
заключаем, что
240 Ч. В. Модель с итеративной информацией
Эта оценка точна, поэтому
Впервые порядок информации для нелинейных уравнений был
определен и изучен Вожьняковским [75]. Стандартная
информация исследовалась Траубом и Вожьняковским [76 с, 77 a, b]. I
Следствие 2.1 гарантирует существование для сходящейся
информации сходящихся алгоритмов. Пусть ф.—алгоритм из
Ф(91, S). Мы хотим изучить скорость сходимости ф(#, $l(f, х))
к a = S(/) при стремлении х к а. Пусть множество вещественных
чисел В определено равенством
B.20) B=\q: q^\ и (f$39, a = 5(f), fSVif), ц > 0)
_, lim U<?(x,4)l(f,x))-S(I(x))\l n\
^—^ 111 11 ———^——^—^——^^——————— —— \J \ #
* -> a \\ % — &11 )
ОПРЕДЕЛЕНИЕ 2.6. Величину р(ф), задаваемую формулой
0, если В пусто,
B.21) р(ф)-1 D
7 7 ( sup В в противном случае,
назовем порядком алгоритма ф. |
Заметим, что для расходящегося информационного оператора
9t порядок любого алгоритма ф из Ф (Ш, S) равен нулю. Данное
определение порядка /?(ф) отличается от «классического»
определения порядка, в котором ф(#, 9?(/, х)) сравнивается только
с a==S(/). В добавлении в конце этой части мы покажем, что
для всех алгоритмов, представляющих практический интерес,
классический порядок равен /?(ф).
Пусть г(х) = ф(х, 9t(/, x))—S(f(x)). Тогда из B.20) следует,
что gr</>(a)s=0 для / = 0, 1, ...,^, где /? = р(ф)—1, если р(ф) —
целое число и = L Р (ф) J в противном случае. Если р(ф) =
= + оо, а функция g аналитична в окрестности а, то g(x) = 0
и, следовательно, ф(#, ЭТ(/, х)) = S (/"(а:)) = а для х, близких к а.
Итак, задачу S можно решить за один шаг. Поэтому в случае
р(ф) = +°° будем называть ф прямым алгоритмом.
Докажем теперь, что порядок информации служит верхней
границей для порядка любого алгоритма ф и что каждый
интерполяционный алгоритм достигает этой границы.
Теорема 2.3. Для любого алгоритма ф€Ф(!ЭТ, S)
B.22)
Доказательство. Предположим сначала, что В=*0. Тогда
)Q^$tt S). Поэтому без потери общности можно счи*
2. Диаметр и порядок информации 241
тать, что Вф 0. Пусть q— произвольный элемент из В, и пусть
/€30, a f19 J%eV(f). Тогда
IIS (?i (*))-S (f2 (x)) КIФ (х, Я (/, х)) -5 (/, (х)) I
, 91 (/, х))S (/2 (*))|| = о (||*—а||^) Vn > 0.
Этим доказано, что q?A (см. B.17) и ВаА. Поэтому
^Л, а значит, /?(ф) ^p($l, S). |
Теорема 2.3 утверждает, что никакой алгоритм не может
дать аппроксимации S(J(x)) более высокого порядка, чем
порядок информации р (9J, S). Покажем, что порядок любого
интерполяционного алгоритма достигает границы р(% 5).
Теорема 2.4. Для любого интерполяционного алгоритма
Ф^ФДО, S),
B.23)
Доказательство. Без потери общности можно считать, что
Л =#= 0. Пусть q б Л. Тогда
B.24) ||5 (Д (х)) -S (h (х)) Н о (|| х- a p-n) Vt| > 0
для любых /€30 и LJ^Vif). Так как Фт (х9 f
для ^0€^(/)» то при J^V(f) получаем из B.24)
Этим доказано, что q?B и Л с б. Поэтому sup Л ^ sup В и
($1 5)^(х) На основании теоремы 2.3 заключаем, что
p(p) p№)
Из теорем 2.3 и 2.4 вытекает
Следствие 2.2. Всякий интерполяционный алгоритм ф1
достигает в классе Ф(ЭД, S) максимального порядка p($l, S):
= sup я(Ф).|
Ф(Я, S)
Проблема алгоритмов максимального порядка была впервые
поставлена Траубом [61] для нелинейных уравнений. В случае
скалярных уравнений она была решена для одного конкретного
класса нестационарных итераций, использующих стандартную
информацию, Брентом, Виноградом и Вулфом [73]. Теоремы 2.3
и 2.4 для нелинейных уравнений были установлены в полной
общности Вожьняковским [75] и использовались многими
авторами для доказательства максимальности порядка определенных
итерационных алгоритмов и/или для сравнения различных
информационных операторов с точки зрения вычислительной сложно-
рти (см., например, Васильковский [77], Вожьняковский [72,
242 Ч. В. Модель с итеративной информацией
74, 76], Кацевич [75, 76а, Ь], Трауб и Вожьняковский [76Ь]).
Отметим также недавние статьи Вершульца [77а, Ь], где
информационные операторы 9] (/, h) использованы для численных
квадратур и дифференцирования.
3. СЛОЖНОСТЬ ИТЕРАТИВНОЙ ИНФОРМАЦИИ
В этом параграфе мы опишем нашу общую модель
вычислений; она весьма похожа на модель ч. А. В контексте этой модели
обсуждается вопрос о сложности информации и выводятся оценки
на «индекс сложности».
Модель вычислений
(i) Предположим, что вычисления производятся на машине
с произвольным доступом к памяти (см. Ахо, Хопкрофт и
Ульман [74, гл. 1]. Пусть р—простейшая операция. Примерами
простейших операций служат арифметические операции,
вычисление квадратного корня или интеграла. Пусть сотр
(р)—сложность (полная стоимость) р\ величина сотр (р) должна быть
конечной. Предположим, что Р—заданный набор простейших операций.
Выбор Р и сотр(р), р?Р, произволен и может зависеть от
конкретной задачи.
(и) Пусть Ш—информационный оператор. Будем говорить,
что ЭТ—допустимый по отношению к Р информационный
оператор, если существует программа, которая вычисляет 9i(/, к) для
всех рассматриваемых (/, я), используя конечное число
простейших операций из Р. Пусть сотр(ЭТ(/, х)) обозначает
информационную сложность вычисления Э?(/, х). Мы предполагаем, что
если Щ([, х) требует выполнения простейших операций ри р2,
..., рк9 то
k
comp(9t(/, x))=* 2 сотр (р,).
ы\
(Hi) Пусть ф—алгоритм, использующий допустимую
информацию 91. Для вычисления <р(91(/, #)) мы
(a) вычисляем y = $l(f, x)9
(b) вычисляем ср(%, у).
Сложность вычисления у была определена в (И). Будем
говорить, что ф — допустимый по отношению к Р алгоритм, если
существует программа, которая вычисляет ф(х, у) для всех
рассматриваемых (х, ЭТ(/, х)), используя конечное число простейших
операций из Р. Пусть сотр(ф(х, у)) — комбинаторная сложность
вычисления ф (х, у). Мы предполагаем, что если ф (х, у) требует
3. Сложность итеративной информации 243
выполнения простейших операций qlf q2i ..., qf, то
/
comp (ф (xt у)) = 2 comp
Пусть 97—сходящийся допустимый информационный оператор
с порядком информации р(Ш, S), большим единицы, и пусть
Ф—сходящийся допустимый алгоритм из класса Ф(9'(, S) порядка
р = р(ф)) большего единицы. Проанализируем сложность
отыскания с помощью алгоритма ф приближения y = y(f) к решению
a = S(/), /?30, где
(ЗЛ)
для заданных начального приближения х0 и числа е' ? @, 1).
Проводимый ниже анализ основан главным образом на работах
Трауба и Вожьняковского [76а, 77Ь], где изучается задача
решения нелинейных уравнений.
Предположим, что ф порождает последовательность xt ~
( Щ/ */-i))» i=l, 2, ..., k, такую что
C.2) e, = G/e?-i, e~||^-a[|, /=1, 2, ..., k9
где Gt — Gid) удовлетворяет условию
C.3) 0<G<G/<G< + oo,
и алгоритм ф заканчивает работу после k шагов. В силу C.2),
C.4, .,-(i)'4., где 1-<оГ1вГ...О,)вд'".,
Заметим, что (^о03/I"'7 есть среднее геометрическое чисел Gu
G2, ..., G/# Кроме того, е( < ^0, если и только если а>/ > 1.
Из C.3) следует, что
C.5) 1/@ = (GI^-1)^ < 1/со,. < (GI/**-1)^ JL 1/ю.
Предположим, что (о > 1. При заданном е' пусть
^—наименьший индекс, для которого ek^.e'e0. Определим е^е' из условия
C.6) ек = ее0.
В силу C.4) и C.6),
C.7) (l/a)ft/-i=-6 и k=*g(®k)/logp9
где
C.8) ^H-lo
Все логарифмы вплоть до конца этой части берутся по
основанию 2.
244 Ч, В, Модель с итеративной информацией
Пусть сотр = сотр (ф, /) есть сложность вычисления xk при
начальном приближении х0. Мы не рассматриваем сложность
отыскания х0. См. по этому поводу работу Кунга [76]. Стоимость
1-го шага равна compER(/, х/)) + сотр(ф(х/, ffl(ff *,))). Для
простоты предположим, что информационная и комбинаторная
сложности не зависят от х{. Тогда стоимость каждого шага равна
с(ф, /) = сотр(ЭТ(/, х)) + сотр(ф(л:, ОД(/, *))) и сотр (ф, /) =
= йс(ф, /). Из C.7) получаем
C.9) сотр(Ф, /)
где
Эта величина z называется индексом сложности ф для /.
Назовем индексом сложности алгоритма ф величину
C.11) г(ф)
Замечание 3.7. Мы рассматривали случай р==р(ф)>1. Для
полноты изучим случай /7=1^ при дополнительном предположении,
что G/<1, /=1, 2, ..., й. Тогда б/ = A/со/)/ео с 1/со/==
=s (GjlG, .•. G/I'*. Следовательно, 1/0/ есть среднее
геометрическое чисел Glf G2, .,., G/, Допустим, что ek~ee0. Тогда
fe = (log l/e)/logcoft и сложность сотр (ф, /) вычисления хк задается
формулой
сотр(ф, /) = *1og(l/e),
где г = г(ф, /, е) = с(ф, /)/(logcofe); величина г(ф, е)=г$ир2(ф, /, е)
называется индексом сложности для р=1. Предположим, что
1/со < 1/о)/< 1/со с со> 1. Тогда
с(Ф, /)/(^ю)<г(ф, Л е)<с(ф, /)/(logco).
Мы не будем в дальнейшем заниматься случаем р=\ и до конца
данного параграфа будем считать, что р> 1. |
Проанализируем сложность сотр (ф, /), задаваемую
формулой C.9). Функция g(co) монотонно убывает, поэтому из C.5)
вытекают следующие оценки:
C.12) zg (со) < сотр (ф, f) < zg (со).
При 8—^0 имеем g (со) си log / и сотр a* z log /. Далее,
предположив, что
C.13) 2<a><co<*,
получаем из C.12)
г (log /—log log t) < сотр (ф, /)< z log A +1)
3. Сложность итеративной информации 245
(см. теорему 3.1 из работы Трауба и Вожьняковского [76а]).
В этом случае z\ogt будет хорошей мерой сложности. Однако
если G)ft в C.9) близко к единице, то множитель g доминирует
и для фиксированного 8 имеем comp ~ zloglog(oft. Таким
образом, при соЛ ^ 1 нельзя пренебрегать влиянием коэффициентов
погрешности G{ и начальной ошибкой е0.
Замечание 3.1 и оценки C.12) показывают, как сложность
comp (ф, /) асимптотически зависит от е. Используя введенное
Кнутом [76] обозначение 0 (см. § 1 гл. 6 ч. А), мы можем
записать
C.14) comp (,,/)-{ еAо§1о8A/е))дляР(Ф)>1.
Этот факт интересно сопоставить с теоремой 2.2 гл. 5 ч. А, где
доказано, что сложность линейной задачи может быть
«произвольной» убывающей функцией от е.
Мы хотим минимизировать сложность вычисления xki т. е.
найти допустимый алгоритм ф минимальной сложности. Сделать
это мы не можем, так как не знаем значения g{(ok) в C.9).
Однако если выполняется C.13) или е достаточно мало, то любой
алгоритм минимального индекса сложности имеет сложность,
близкую к минимальной. Поэтому будем искать алгоритм с
наименьшим индексом сложности.
Проведенным обсуждением мотивируется следующее
определение.
ОПРЕДЕЛЕНИЕ 3.1. Величину г (91,5), задаваемую формулой
C.15) г (91, S) = inf{*(<p): q>€Фрвт ДО. S)\,
где ФрегтДО» S)—класс всех допустимых алгоритмов10, будем
называть индексом сложности задачи S при использовании
информации 91.
Будем называть алгоритм сртс ? Фрегт (ЭТ, S) алгоритмом мини*
мального индекса сложности 2), если
C.16) z(cpmc) = 2OR, S).|
Пусть
C.17) comp (91) «= sup comp (91 (/,*))
(f. x)<D
есть информационная сложность 9t. Каждый алгоритм ф,
использующий •&, должен для отыскания очередного приближения
совершить определенное число простейших операций. Точнее,
Х) Индекс perm — от английского permissible (допустимый).— Прим. ред.
2> Индекс тс —от minimal complexity (минимальная сложность).— Прим.
pedt
246 Ч. В. Модель с итеративной информацией '
положим
C.18) т(% S)= inf sup comp (<p (x, Stt(/=, x)))9
где D, DczD^i обозначает множество «трудных задач», т. е.
(/, x)?D означает, что compER(/, х)) = сотр(Щ). В общем
случае m(!?t, S) зависит от полного числа «независимых частей»
информации 91 по крайней мере линейно. См. ниже §§ 4 и 8,
где вводится понятие кардинальности информации Ш и
обсуждается ее влияние на комбинаторную сложность ф.
В теоремах 2.3 и 2.4 показано, что порядок /?(ф)
произвольного алгоритма ф из класса Ф (?{, S) не превосходит порядка
информации p($R, S) и что существуют алгоритмы, для которых
р(ф) = /?(9?, S). Отсюда и из C.14), C.17), C.18) получаем оценку
снизу на индекс сложности
/q,Q\ 9 /Q? ОЧ -> СОПф (%) + **(%» S)
C.19) г(У{, S)>
Далее, если существует допустимый алгоритм ф максимального
порядка (/?(ф) = р(9?, S)), для которого сотр(ф(х, ЭТ(/ ^
^(?t) при всех (/, х)?Ом, то
Соотношения C.19) и C.20) объясняют наш интерес к
информационной сложности сотр(9сг) и порядку информации /?(9?, 5).
Предположим, что задачу a = S(/) можно решить, используя
различные информационные операторы из некоторого заданного
класса W. Мы хотим знать, какой информационный оператор
в наибольшей степени подходит для задачи a = S(/).
Проведенное обсуждение показывает, что таким оператором будет
информационный оператор минимального индекса сложности.
ОПРЕДЕЛЕНИЕ 3.2. Будем говорить, что информационный
оператор 9^ в большей степени подходит для задачи S, чем
информационный оператор 9?2, если
C.21) z(9tl9 S)<z(%, S).
Будем называть информационный оператор $1° € Y оптимальным
е классе Wt если
C.22) г Cd0, 5) = inf z(% 5). |
кечг
В § 8 мы изучим оптимальные информационные операторы
для линейного случая.
Итак, мы сравниваем информационные операторы по их индексу
сложности и называем информационный оператор с минимальным
4. Кардинальность линейной информации 247
индексом сложности оптимальным. Отметим, однако, что
сложность алгоритма, использующего оптимальный информационный
оператор, зависит также от коэффициентов погрешности G( и
от начального приближения. Как было замечено ранее,
минимальный индекс сложности может иногда оказаться неудачной
мерой сложности. Обсуждение этого вопроса можно найти в
работе Трауба и Вожьняковского [76а].
4. КАРДИНАЛЬНОСТЬ ЛИНЕЙНОЙ ИНФОРМАЦИИ
Пусть 91—информационный оператор вида
D.1) Ж: ЗхХХ-^3,,
где X—открытое подмножество в 32. В этом и следующих трех
параграфах мы будем заниматься информационными операторами,
линейными по первому аргументу, т. е. такими что при каждом
х
D.2) 97(cJt + c2f2, x) = cjfl (Л, х) + с& (f2, x)
для любых элементов f19 f2 из 32 и любых констант cit с2. При
фиксированном х мы можем рассмотреть ядро линейного
оператора Ш(-9 x)
D.3) кегЭТ (¦,*) = {/: Я (Л *) = 0}.
Как мы увидим в § 5, ядро оператора 91 играет существенную
роль в нашей теории.
Пусть ЭТХ: ЗхХХ-^Зз и Щ2: ЗгхХ -+$'г—два
информационных оператора, причем пространство 3i не обязательно
совпадает с За.
ОПРЕДЕЛЕНИЕ 4.1. Будем говорить, что 9^ содержится
в 9?2 (запись: 9^с:^2), если kerJRa(-f x)aker%(-, х) \/х?Х.
Будем говорить, что Ш1 эквивалентно 9f2 (запись: З^Х^г)»
если kerSRit-, х) = кегStt2(•. *) VjcgX. I
Отметим, что Л = кег91(-, х) является линейным
подпространством в Зх. Напомним, что в Зг существует такое линейное
подпространство Л1, что
D.4) 31==ЛфЛ1;
Л1 изоморфно факторпространству З^Л, и
D.5) codim Adi == dim /U = dim З^Л.
Подпространство Л1 называется алгебраическим дополнением
к Л.
Для упрощения дальнейшего анализа предположим, что
множество X выбрано так, чтобы codim ker§ft(», x) ssconst! x^Xf
248 Ч. В. Модель с итеративной информацией
ОПРЕДЕЛЕНИЕ 4.2. Назовем кардинальностью информации
величину card (9?), задаваемую формулой
D.6) card(9?) = codimker9t(«, х), х?Х. |
В качестве примера рассмотрим информационный оператор Щ,
определенный равенством
D.7) 9l(/f x) = [Lt(f, х), ..., Ln(ft x)l
где Ly. ЗхХХ—>C—линейный по первому аргументу функцио
нал, /=1, 2, ..., п. Предположим, что для каждого х?Х
линейные функционалы L2(-, х), ..., Ln(-f x) линейно-незави
симы.
Лемма 4Л. Пусть $1 определено посредством D.7). Тогда
D.8) card (9t) =/i. I
Доказательство. Заметим, что А (х) = ker 9? (•, л:) = {/: LAf,
*) = 0 при /=1, 2, ..., п\. Пусть Зх = А (хH Л (jc)J- и
lin (Б1Э gt, ,.., lm)czA(x)^t где ^, ga> ..., ^линейно-независимы.
Пусть, далее, / = S^=i^ySy» f € Л (хI. Мы хотим найти такое
c = [^, c2f ..., сш]*, что f?A(x) (напомним, что индекс t
обозначает операцию транспонирования). Заметим, что условия
?/ (/, х) == 2I/L iCyL/ (gy, л:) = 0, i = 1, 2, ..., п, эквивалентны
системе однородных линейных уравнений
D.9) Мс=0,
где Af = (,(g/ ))
Для доказательства равенства D.8) допустим, что т > п.
Тогда D.9) имеет ненулевое решение [с1э с2, ..., ст]1 и /=
=.2Г=1СУ^/^ ^ (^НП Л (л:). Поэтому /==0, что противоречит
линейной независимости 1и ..., 1т. Следовательно, cardER)^n.
Чтобы доказать, что card (Ш) = п, достаточно теперь заметить,
что L](-, x), ..., ?„(-, х) линейно-независимы в том и только
том случае, если система M*d = 0 имеет единственное решение
d = 0, что выполняется тогда и только тогда, когда т = п. |
Покажем, что любой информационный оператор Ш можно
представить при помощи линейных функционалов.
Лемма 4.2. Пусть ЭТ—линейный информационный оператор
и n = cardSR< + oo. Тогда существуют Llf L2, ..., Ln> такие что
(i) L/. ЗххХ-^С, /=1, 2, ..., п,
(ii)Lx(-, a:), ..., ?„(•> ^)—линейно-независимые линейные
функционалы и 91X^1» где 5R1 = [L1, L2, ..., Ln]. |
Доказательство. Пусть Зх = Л (х) фЛ (яI, где Л (х) = ker ЭТ(-,
^). Тогда Л (x)-L == lin(ii (x), ..., LW)» где |f. (л:) — линей-
4. Кардинальность линейной информации 249
но-независимы. Для каждого элемента /€3Х существует
единственное представление в виде / = /0(*) + 1j?=i?/ (/, x)%i(x) при
некотором fQ(x)?A(x) и некоторых линейно-независимых,
функционалах L/, таких что Ь((^(х), х) = 8/у.. Тогда для
информационного оператора 9^ = [/,!, L2, ..., Ln] имеем
-, x) = {f: L;(/, *) = (U=1, 2, ..., п} = Л (*)
Этим доказано, что §Rx9ii-l
Пусть Л (З^ —класс всех линейных подпространств
пространства 31в Рассмотрим отображение
D.10) Л: ХсЗв — Лф!);
Л (л:) при каждом х^Х есть линейное подпространство в Л (Зх).
Укажем связь между отображениями Л и линейными
информационными операторами.
Лемма 4.3. Пусть Л: Хс:32—>ЛC1) и codimЛ(#) = я V#?
?Х. Тогда существует линейный информационный оператор
D.11) gitf, *)-[!!(/, х), ..., ^(/, хI
такой что
D.12) ker«R(., ^)-=Л(х),
где^(-,л:), ...,LB(«,x)—линейно-независимые линейные
функционалы. |
Доказательство. Пусть 32 = Л (^) ф Л (х)J- и Л (лс)^ = Нп
EiW, •-., LW), где ^(х), ..., %п(х) линейно-независимы.
Тогда для каждого элемента /€3Х существует единственное
представление
D.13) /~М*)+2*/(Л *NyW.
где fo(x)?A(x), а су(/, х)—линейный по / функционал, удов*
летворяющий условию Су (?/(#)» х)~^/у- Положим
D.14) Ly(/, x)=*cj{f% х) для /=1, 2, ..., п.
Очевидно, что Lx{-, х)у ... , ?„(-, #) линейно-независимы и
kerЭТ(•, *) = {/¦• ^/(Л ^) = 0, /=1,2, ..., п}=А(х). I
В последующих параграфах мы будем рассматривать
«регулярные» информационные операторы, определяемые следующим
образом.
Пусть /: DycQa—>$<,, где 30c3i. Предположим, что Зх —
нормированное линейное пространство. Будем говорить, что J
принадлежит классу Lip (k), k^O, если k-я производная Фреше от
250 Ч. В. Модель с итеративной информацией
f существует при каждом элементе решения а ? S C0) и
удовлетворяет условию Липшица. Иными словами, /?Lip(&), если для
любого а ? S C0) существуют Г = Г (а, /) > 0 и q — q(ay /),
такие что
I/(*4*i)-f(*4*.)K?l*i--M при Ц^-^КГ.
Пусть L: ЗхХХ—*С—линейный по первому аргументу
функционал. Будем говорить, что L ? Lip (?), если L (ft, •) ? Lip (k) для
любого A?3i. Теперь определим, как понимать включение
Я 6 Lip (Л).
ОПРЕДЕЛЕНИЕ 4.3. Будем говорить, что линейный
информационный оператор Щ принадлежит классу Lip (k) (запись:
9i?Lip(&)), если существуют линейно-независимые линейные
функционалы L/. ЗгхХ —> С, /=1,2, ..., я = card (9?), такие что
(i) кет91(.,*)НА: Мй, х) = 0, /=b2f ... , n} Vx^X,
(ii) Ly€Lip(*), /=1, 2, ... , п. |
Итак, $l?Lip(k) означает, что линейные функционалы,
которые задают ядро $1, k раз дифференцируемы и k-e производные
удовлетворяют условию Липшица.
Лемма 4.4. Предположим, что $1: 3,хХ—>Зз принадлежит
классу Lip (k) и ft = card(?J). Пусть go? ker SR (•, а). Тогда
существует функция h: X —* Зх, такая что
(i) 9t(h{x), x) = 0 Vx?X,
(ii) ft 6 Lip (k)9
(iii) h(a) = g0. |
Доказательство. В силу определения 4.3, имеем
x) = {g: Lyte, л:)==0, /=1, 2, ... , п) х?Х,
где Ly ^ Lip (й) и Lt (-,*), ... , Lrt(-, a^)—линейно-независимые
линейные функционалы. Пусть 1г(х), ... , 1п(х)—такие элементы
из Зх, что Ljdtix), x) = Si/ для i, / = 1, 2, ... , п и ^6Lip(^).
Положим
D.17) й(*) = *о-2?/<?о, хП{(х).
i =1
Имеем Ly (ft (#), x) = Ly (g0^)— 2?=iL/feo, x) 6,7 = 0, т. е. ft(A:)^
€ ker9i(-, a:) Va:^^- Очевидно, что ft ? Lip (/г). Наконец, ft(a) = g0,
так как из включения g0 g кегЭТ(-, a) следуют равенства
М?о, a)=^0, i^l, 2, ... , л. |
5. Когда класс итерационных алгоритмов пуст? 251
5. КОГДА КЛАСС ИТЕРАЦИОННЫХ АЛГОРИТМОВ ПУСТ?
Напомним, что оператор решения S переводит Зо^с^) в 32.
До конца этой части будем предполагать, что
E.1) Зх—нормированное линейное пространство;
E.2) 30 открыто, т. е. для любого /?30 существует такое
положительное число 6 = 6(/), что / + /*63О для
каждого й€3х с ||Л||<6;
E.3) 32 — банахово пространство;
E.4) 5—Липшицев оператор при каждом /?30, т. е. ||5(/х) —
— 5(/2)К<7E, /IА—/2[I Для всех^ и /2, достаточно
близких к /.
Пусть 9J— информационный оператор. Напомним, что
функция /: Df-+3Q принадлежит множеству V(f) и V(f)czW (см.
определение 2.1). Предположим, что W—класс функций f,
таких что
E.5) ||/>)_/||<8(/);
E.6) f—липшицева функция в окрестности a = S(/), т. е.
где х, xiy x2 принадлежат шару J = {х: \}x—а|^Г} достаточно
малого положительного радиуса Г = Г(/).
Замечание5.1. Так как оператор$1 линеен, то$l(f{x)—/,х) = 0.
Это значит, что h (x) = f(x) — f принадлежит множеству ker Щ (•, я).
Кроме того, ||f(^i) — /4*2)ll = flM*i)—л(^2I и, согласно E.5),
E,6), [Л(х)||<8 и функция /г липшицева в точке а. Из леммы 4.2
мы знаем, что включение h (x) ? ker9?(-, х) эквивалентно
равенствам Li(h(x), #) = 0, /=1, 2, ... , fl = card(9{), при некоторых
линейных функционалах ^(-,х), ... 9 Ln(-, х). Итак, h = h(x)
должно удовлетворять п однородным уравнениям. |
Мы будем иметь дело с итерационными алгоритмами, которые
определяются следующим образом. Напомним, что под
алгоритмом ф мы понимаем отображение 32 х$1 (Ди)—> 32 (см. B.3)).
ОПРЕДЕЛЕНИЕ 5.1. Будем говорить, что ф — итерационный
алгоритм (или, кратко, итерация), если для любого /€30
существует такое положительное число Г = Г(/), что для каждого
xQ?j = {x: \\х— а К Г}, гдеа==5(/г), последовательность xi+1 =
= ф(лг/, dl(ft х()) корректно определена и
E.7) lim^^a,
E.8) a = Ф (а, Ш (/,«))¦
252 У. В. Модель с итеративной информацией
Условия E.7) и E.8) означают, что если начальное
приближение принадлежит шару «/, то алгоритм ф порождает
сходящуюся последовательность и ее предел а является неподвижной
точкой отображения ф. Пусть IT (91, S) обозначает класс всех
итерационных алгоритмов, использующих информационный
оператор 91. Для каких информационных операторов Щ класс IT (9i, S)
непуст? Мы покажем, что эта проблема связана с определенным
формулой B.4) предельным диаметром информации d(9t, S). Нам
понадобится следующая лемма.
Лемма 5.1. Предположим, что существует такое /€30) что
каково бы ни было Г > 0, можно найти /0 ? 30 для которого
(i) 0<|а0-а[|<Г, a=*S(f), a0-S(/0);
(И) 9?(/0, ao) = 9U/, cc0).
Тогда IT(91, S)-0. |
Доказательство. Предположим| напротив, что IT (91, Б)Ф09
и пусть ф?1Т(9?, S). Тогда для нашего / найдется гакое Г =
= Г (f) > 0, что определяемая рекурсивно последовательность
#/+1 = ф(#,, 9i(/, *,)) сходится к а для всех |jc0—а||<Г. Пусть
/0 удовлетворяет условиям (i), (ii). Применим итерационный
алгоритм ф к /и при начальном приближении хо = а0. Поскольку
au=*S(/0)—неподвижная точка для ф, мы получаем, что ф(а0.
$l(f\» ао))==ат Но |а0—а|]^Г, т. е. а0 можно использовать как
начальное приближение к а0. Однако хл = ф (а0, 9?(/, а0)) =
« ф(ао> 9J(/0> ao)J35^» откуда дс/+1=.а0#а. Это противоречит
тому, что {*/} сходится к а. 1
Лемма 5.1 утверждает, что если можно найти элемент
задачи /g с той же информацией, что и /, и с а0, достаточно
близким к а, но отличным от а, то класс итераций IT (91, S) пуст.
(Ср. с теоремой 4.1 из работы Кунга и Трауба [76Ь] и леммой 3.2
из работы Вожьняковского [76], где использован сходный метод
доказательства.)
Мы готовы к доказательству следующей теоремы.
Теорема 5.1. Предположим, что выполнены условия E.1) —
E.6) и пусть 9i—линейный информационный оператор. Если
d($l, S)>0, то 1Т(9*, S)=0. |
Доказательство. Так как d(9i, S) > 0, то существуют
и f€V(f), такие что для a=;S(/)
E.9) S(f(d))#S(/) = a.
Пусть h(x)=*f(x)—f для х, близких к а. Тогда /*(#)? ker9i(« -9 х)
и, в силу E.6), функция / липшицева в а, так что
5. Когда класс итерационных алгоритмов пуст? 253
Из E.2) и E.5) вытекает, что / + ch(x)€%0 для с ? [О, I],
поскольку | ch (х) || < 6 (/). Положим g(c)*=S(J + ch (a)) —S (/) для
с€[0> !]• Из E.4) следует, что функция g непрерывна. Отметим,
что g@) = 0, а §A)=т^0, в силу E.9). Выберем такое со?[О, 1),
что§(с0) = 0 и g(co + 6)=^O для б6 @, 1—со]. Пусть /1==/ +
+ ceft(a). Ясно, что /^Зо и fx+ch{x)€$0 для eg [О, б^)/^/)].
Для • таких с положим F (х) = S (/х + ch (х)). Тогда S (/J = а и
F (a) = S (/, + сЛ (а)) =^= а для малых положительных с. Рассмотрим
уравнение x — F(x) при x?J = {x: \\х—а|]^Г}, где Г—малое
положительное число. Заметим, что
| F (х) -а || = || Sfo + chW—SifJ I< cq(S9 h)supx,j\\h (x)Kr
при малом Г для достаточно малых с. Кроме того,
i) -^ W1 < cq (S, /J |) h (xj -/i
Таким образом, при малых с отображение F является
сжимающим в У. Так как J—замкнутый шар в банаховом пространстве
32, то существует ао?«/, такое что ao = F (a0), т. е. aQ = S(fr +
+ ch(ao))y и аофа. Пусть fQ = f1 + ch(a0)). Так как h(ao)?
^ ker 9t (•, a0), то 9i(/0, a0) = ?{(/!, a0). Применяя лемму 5.1 при
найденных fx и /0, заключаем, что П (% S) = 0. |
Теорема 5.1 утверждает, что условие d(9i, 5) = 0 является
необходимым условием непустоты класса итераций IT (Л, S).
В следующем параграфе, мы докажем, что d(dl, S) = 0 только
в том случае, когда кардинальность информационного оператора $1
достаточно велика.
Допустим, что $1—сходящийся линейный информационный
оператор, и пусть p($l, S) порядок информации 3J. Так как
S—Липшицев оператор, а W—класс липшицевых функций, то
Лемма 5.2. Если р(% S)> 1, то класс IT(9Z, S) непуст.
Доказательство. Пусть ф'€Ф(!ЭТ> S)—интерполяционный
алгоритм. По теореме 2.4 имеем р(ц)]) = р($1, S). Отсюда
E.10) \<pl(x, ffltf, x))-al = 0(lx-a\\P-*) Ул > 0
для всех х, достаточно близких к a = S(/), где р = /?(9^, S).
Положим г| = (/7—1)/2 и <7 = (р+1)/2. Тогда E.10) можно
переписать в виде
W(x> 3Hf9 x))— a||<C|x—af для \\х—а||<Г,
где С и Г—некоторые положительные константы. Пусть xi + 1 =а
— фЧ^/» $t(f, Xt)) и et^\xt—a)|. Тогда ?/+i<Ce?. Так как
7> 1, то для «0<С1/A"^ последовательность {^J сходится к а.
254 Ч. В. Модель с итеративной информацией
Очевидно, что а = ср(а, Ш (/, а)). Это значит, что ф1 является
итерационным алгоритмом в смысле определения 5.1, и класс
IT(9t, S) непуст. |
Из доказательств леммы 5.2 легко вытекает
Следствие 5.1. Если ф?Ф(91, S) и р (ф) > 1, то
ф—итерационный алгоритм.|
При р(Ш, 5)=1 класс итераций IT (97, S) непуст, если S —
сжимающее отображение, точнее если ||S(/(*i))— S(/(x2))|K
^q(f)\\x1—х2\\, где q(f)< 1, для всех хх и х2, достаточно
близких к а = 5 (/), и для всех fly J2?V (f). Если р(Ш, S)=l, a
отображение S не является сжимающим, то правдоподобным
выглядит предположение, что IT (97, S) = 0. Мы не будем заниматься
здесь этим вопросом.
6. ИНДЕКС ЗАДАЧИ 5
Напомним, что задача 5—это отображение S: 30—>-32, гДе
80—некоторое подмножество линейного пространства Зх. Пусть
SC) Положим
F.1) G(a) = {ft€3i:tf€30i S(/)==a,
Иначе говоря, G (а) есть множество элементов Л, которые, будучи
умножены на малое с и затем добавлены к /, не меняют элемента
решения a = S(/). В силу предположения 5.2, / + c/i?30 для
\с\ < 6(Л/IIЛ! и потому S(f-\-ch) определено корректно. Отметим,
что G(a)—однородное множество, т. е. из /i?G(a) следует, что
ah?G (а) для любой константы а. Если S аналитично в любой
точке /б^о, то
F.2) G(a) = {h€3x:(feSo> $ (/) = a) =>S">(/)/i'= 0 для />1}.
Пусть А (Зх) обозначает класс всех линейных подпространств
пространства 3i.
ОПРЕДЕЛЕНИЕ 6.1. Величину ind S, задаваемую формулой
F.3) ind(S)= max min codim.4,
a € S (%) AC.G (а) и А е A (Si)
будем называть индексом задачи S. |
Пусть А (а)—подмножество множества G(a), являющееся
линейным подпространством минимальной коразмерности в 3^
т. е. А (а) с G (а), А (а) 6 A Ct) и
F.4) codirr^(a)= min
ЛСС(а) и АеА C
6. Индекс задачи S 255
Если G(a) линейно, то, очевидно, A(a) = G(a). Индекс задачи
S — это максимальная коразмерность подпространства А (а). Если
G(a) линейно при всех a?S(80), то F.3) превращается в
равенство
F.5) ind(S) = max codim G (a).
S C0)
мы показали в § 5, если предельный диаметр
информации й(Щу S) отличен от нуля, то класс итерации IT (?{, S) пуст.
Напомним, что до конца этой части считаются выполненными
условия E.1) —E.6). Предположим также, что S C0) есть
открытое подмножество в 32. Докажем, что из равенства d(91, S) = 0
следует, что кардинальность $1 не меньше индекса S.
Теорема 6.1. Пусть 9Z: ЭхX5 C0) —>33 — произвольный
линейный информационный оператор, такой что Ш ? Lip @) и card ($1) <
< ind(S). Тогда
F.6) d($l, 5)>0.|
Доказательство. Допустим, чта существует информационный
оператор 9J, такой что Ш € Lip @), п = card C1) < ind (S) и
d(% S) — 0. Это означает, что для любых / и /,
удовлетворяющих условию }?V(f), мы имеем || 5 (/(х))—а||—>0 при х—>а =
= S(/). Так как/ и 5 непрерывны, то S(f(a)) = a. Информация
$1 линейна и принадлежит Lip(O). Отсюда следует, что /i(jc) =
= f (x) —/ принадлежит множеству ker Щ (•, л:) == {Л: Ly (ft, х) = 0,
/=1, 2, ..., л}, где Lf — линейные функционалы и L;€L\p@).
Выберем agSC0), для которого codimker A (a) = ind (S). Пусть
g0—произвольный элемент из ker9?(-, a). По лемме 4.4
существует функция h = h(x)y такая что ^l{h(x), #) = 0, h G Lip @) и
ft(a) = ^o- Положим ](x) = f + ch(x) для |c|<6(/)/Jgo||, где
S (/) = а. Тогда / ? V (/) и f (a) = / + eg,. Поэтому 5 (/ + cg0) = S (/),
откуда g€G(a) и ker!K(«f a)cO(a). Из F.4) вытекает, что
что п = codim ker dl (•, a) > codim Л (a) = ind (S). Противоречие!
Следовательно, d($l, S)>0.|
Теорема 6.1 утверждает, что предельный диаметр информации
d($l, S) отличен от нуля для любого линейного
информационного оператора кардинальности, меньшей чем ind (S). Из теорем
5.1 и 6.1 вытекает
Следствие 6.1. Класс итерационных алгоритмов 1Т(ЭТ, 5) пуст
для любого линейного информационного оператора 9?, такого что
9? € Lip @) и card (Ш) < ind (S). |
Покажем теперь, что существует линейный информационный
оператор Ш, такой что 9? 6 Lip @), card Ш = ind E) и d (ЭТ, S) = 0.
Напомним, что А (а) определено формулой F.4). Предположим
256 Ч. В. Модель с итеративной информацией
что область определения Эо оператора S выбрана таким образом,
что коразмерность сосПтЛ(а) остается неизменной при a ?S C0),
т. е. ind (S) = codim А (а) Va?SC0). Применим к А (х), где
x?X = SC0), лемму 4.3. Получим, что существует линейный
информационный оператор
F.7) 31*(Л х) = [Ш!> х), ..., L*n*(f, x)]t
такой что Li(-, л:), ..., L**(-, х)— линейно-независимые при
каждом х линейные функционалы, п* = card (9i) = ind (S) и
ker9?*(-, х) = Л(л;) V*?SC0). Будем называть Ш* основным
линейным информационным оператором,
ОПРЕДЕЛЕНИЕ 6.2. Будем говорить, что оператор решения
S принадлежит классу Lip @) (запись SgLip(O)), если
существует информационный оператор Ш* вида F.7), такой что
9t€Li@)
(Ср. с определением 4.3.) Таким образом, S ? Lip @) означает,
что линейные функционалы, ядра которые задают А (х),
удовлетворяют условию Липшица.
Теорема 6.2. Предположим, что S^Lip(O). Тогда
определенный формулой F.7) оператор 5R* является сходящимся линейным
информационным оператором, т. е. d(9I*, S)*=0.1
Доказательство. • Возьмем любое /63О, и пусть a=*S(/).
Пусть, далее, f—произвольная функция класса Lip(O), такая что
f?V{f). Положим h (X) = f(x)—f. Ясно, что \\h(x)J<b(f) и h(x)
принадлежит множеству кег $1* (•, х) = А (х). Имеем lim^a ||5(f(x))—
— S(f)|«IS(/ + h(a))—S(/)|. Поскольку A(a)€^(a) и Л (a)с
cG(a), то S(f + ch(a))*=S{f) для |б | < б (/)/|/i(a)|. Но |А(а)|<
<б(/), и, полагая с=1, получаем S(f(a)) = S(f). Этим доказано
равенство d(9'!*, 5) = 0, означающее, что $1* сходится. |
Теоремы 6.1 и 6.2 утверждают, что для вычисления а при
помощи сходящегося итерационного алгоритма необходимо и
достаточно использовать линейные информационные операторы,
кардинальность которых не меньше индекса задачи S.
Мы доказали, что основной линейный информационный
оператор сходится. Покажем теперь, что при выполнении
некоторого технического предположения любой сходящийся линейный
информационный оператор содержит 91*. Это означает, что
информацию 9J* следует вычислять непременно (см. определение
4.1).
Теорема 6.3. Пусть G(a) линейно для каждого a?SC0), и
пусть 9t—линейный информационный оператор класса Lip(O).
Тогда d(% S)=»0=»«R*c3l.|
в. Индекс задачи 5 257
Доказательство. Так как G(a) линейно, то ker 9i* (•, а) =
= G(a) Va?SC0). Выберем любые аи/, такие что a = S(f).
Так как d(9t, 5) = 0, то SQ(a)) = S(f) для любого f 6^(/). Пусть
g0— произвольный элемент из ker9?(-, a). По лемме 4.4
существует такая функция /igLip(O), что -ЭТ (&(#), л;) = 0 и h(a) = g0.
Положим f{x) = f + ch{x) для |с| <«(/)/(ft(а)Ц. Тогда f?V(f) и,
следовательно, S(f + ch(a)) = S (h). Этим доказано, что h(a) = g9
принадлежит множеству G(a), откуда ker-DI(«, a)cG(a) =
=; ker9i* (•, а). Следовательно, 9l*c9t. I
Обсудим смысл теорем 6.1—6.3 с вычислительной точки зрения.
Каков наиболее общий вид допустимых линейных
информационных операторов? Рассмотрим идеализированную модель, в кото*
рой вычисление значения каждого линейного функционала
является простейшей операцией. Тогда каждый линейный
информационный оператор $1, определенный при помощи конечного
числа линейных функционалов, т. е. такой, что саге! (Щ < + оо,
допустим. Однако даже эта идеализированная модель допустимой
информации не помогает при решении задач бесконечного индекса
(см. также § 8).
Как мы покажем сейчас на нескольких примерах, индекс
действительно может быть бесконечным. В таком случае
линейные информационные операторы конечной кардинальности не дают
информации, достаточной для решения задачи при помощи
итерационного алгоритма.
ПРИМЕР 6.1. Предположим, что оператор 5
взаимно-однозначен. Тогда G(a) = {0} и codim G(a) = dim3:1. Следовательно,
F.8) ind(S) = dim31.
Таким образом, если dim31=+oo, то задачу 5 нельзя решить
никаким итерационным алгоритмом, использующим линейные
информационные операторы конечной кардинальности.
В терминах взаимно-однозначного оператора в
бесконечномерном пространстве $t можно сформулировать многие задачи.
Один пример дает задача аппроксимации S(f) — f п^1==С[а, Ь].
8 качестве второго примера рассмотрим задачу решения
произвольного линейного дифференциального уравнения Da(x) = f1(x)>
x?Q, при условии a(x) = /2(х) для х?дп. Ясно, что оператор
S(/)=a, где / = (/!1, /2)> взаимно-однозначен. Тем самым показано,
что такого рода задачи аппроксимации и задачи решения
дифференциальных уравнений нельзя решить итеративно с помощью
линейных информационных операторов конечной кардинальности. |
9 К«564
258
Ч. В. Модель с итеративной информацией
Пример 6.2. Пусть 30 = 9!== С [а, Ь] и k—целое
положительное число. Положим
1
$[/@
О
F.9)
Поскольку оператор 5 аналитичен, из F.2) следует, что>/i?(j (a),
где <x = S(f) в том и только том случае, если Sijl (f) h{^ = 0 для
/=1, 2, ... . Отметим, что
5
о
й S</>(/) = 0 при />й.
Предположим, что k « 1. Тогда
и codimG(a)=l.
Поэтому ind(S)s*l. Это значит, что существует линейный
информационный оператор Шс card (Ш) = 1, такой что й(Ш, S) = 0.
В самом деле, определенная формулой F.7) основная информация 91*
задается в данном случае формулой 9Z*(f, х)*=ЦA,х)= }of(t)dt,
и d($l*> S)==0. Далее, /?ER*, S) = +°°, и задачу можно решить
непосредственно. В рассмотренном случае k=l оператор
решения S является линейным функционалом и его в принципе можно
использовать также как линейный информационный оператор
кардинальности единица. (Правда, делать это бессмысленно —
ведь мы хотим аппроксимировать S,—и потому мы исключаем
sft*=*S как допустимый информационный оператор.)
Предположим, чтоk^2. Тогда если k четно, то S{k) (/)hk~0 =ф
r=>ft=0. Если k нечетно, то (S{k~u(f) hk~x^Q для некоторой
положительной функции /)=»/i^0. Итак, G(a)=*{0\ и
ind (S) = codim G(a) = +oo.
Следовательно, при fe^2, используя линейные информационные
операторы конечной кардинальности, итеративно
аппроксимировать значение интеграла Jo/*(O^ нельзя. |
Пример 6.3. Нелинейные уравнения. Пусть Зх — класс ана*
Литических операторов /; DaB1—+B2i где Вг и
В2—вещественные или комплексные банаховы пространства одинаковой раз*
мерности, dim (ВЛ^ dim (B2)=*N. Предположим, что
D—открытое множество и IJ/fl^supjce^/fjc)! < + оо для /GSi- Пусть Эо —
Класс аналитических операторов с единственным простым нулем,
Т. е. /?#0, если и только если /?3i и существует такое a?D,
7. Итерации т~го порядка 259
что /(а)«О, оператор /' (а)" существует и ограничен и а —
единственный нуль /. Положим
F.10) 5@-Г1 @), 3,-*i.
Таким образом, a**S{f) означает, что/(а)«О, и задача S состоит
в отыскании решения нелинейного уравнения. Легко проверить,
что G(a)«{/i€3f: ft(a)*=0} и
ind(S) = dim B^N.
Поэтому если N < + оо, то мы можем найти сходящийся
линейный информационный оператор кардинальности N. В этом
случае основная информация 9?* задается формулой
F.11) «•(/, xj-fW-ftW, f%(x)9 ..., fN(x)]9
где /yS D—+C—компоненты оператора /.
При Мй=+°° индекс задачи S равен бесконечности. Это
означает, что для того, чтобы обеспечить существование
итерационных алгоритмов, следует допустить использование линейных
информационных операторов бесконечной кардинальности.
Например, Щ (/, а:) « / (я)—сходящийся линейный информационный
оператор. |
7. ИТЕРАЦИИ т-ГО ПОРЯДКА
В предыдущем параграфе было доказано, что если
используются линейные информационные операторы, кардинальность
которых меньше индекса задачи S, то класс IT(SR, S) пуст.
Пусть т—вещественное число, m^l. Поставим и решим
следующий вопрос: какова минимальная кардинальность,
обеспечивающая существование итерации /л-го порядка (см.
определение 2.6)? В соответствии с теоремой 2.4 мы ищем линейный
информационный оператор Ш минимальной кардинальности,
порядок информации которого р(% S) не меньше т. Пусть
G.1) k = k{m)= ГяП—1.
В этом параграфе мы всюду предполагаем, что 5
C0)—открытое подмножество в 32, W—класс функций /, для которых
выполняется E.5), а условие E.6) усилено требованием, чтобы
f€Lip(ft).
Пусть Н—класс функций h, таких, что ft: S^o)-^^ и
ft 6 Lip (k). Положим
G.2) G(m) = lh: h^H и V/?30 Vri>0 V | с | < б (/)/1| h (Sf)) fl
260 Ч. В. Модель с итеративной информацией
где o(f) задается формулой E.2). Заметим, что S(f + ch(x))
определено корректно для х> близких a = S(/), поскольку ||cft(#)|<
< б (/) \\Цх) \\l\\h (а)||-б (/) A+оA)). Пустьg (x)=S tf+ch (x))-S (/).
Из G.2) следует, что g(^(a) = 0 при / = 0, 1, ...» k(m). Если
оператор S достаточно регулярен, то условие g{^ (а) = 0
приводит к соответствующим условиям на ft (a), ft'(a), ..., h{k)(a).
Итак, G (m) есть множество функций ft, для которых у функции
S(f+ch(x))—S(f) имеется нуль а кратности k.
Предположим, что А(х)—такое линейное подпространство
в Зх* что codim Л (л;) = const для a;?SC0). Положим
G.3) А = {ft: h?H и ft(x) € А (х) Ух65C0)}.
Таким образом, множество А содержит те функции из класса Н>
для которых значения в х принадлежат А (х). Ясно, что А —
линейное подпространство в Я. Введем обозначение
df
G.4) codim A = codim A (x).
Пусть А(Н)—класс всех множеств вида G.3). Мы
подготовились к тому, чтобы дать определение m-го индекса задачи S.
ОПРЕДЕЛЕНИЕ 7.1. Величину ind(S, m), задаваемую
формулой
G.5) ind (S, т) = min codim Л,
AG () и Аи А (Н)
будем называть т-м индексом задачи S. |
Теорема 7.1. Пусть SR: SjXS^q)—*%—произвольный
линейный информационный оператор, такой что $i€L\p(k(m)) и
card (Ш) < ind E, т). Тогда
G.6) р(д1, S)<m. |
Доказательство. Допустим, что существует информационный
оператор $, такой что 9l^Lip(fe(m)), п — card ($1) < ind (S, m)
и р{% S)^m. Пусть 9lX[Lt, L2i ...,LJf где L, 6 Lip (Л),
t=l, 2, ..., /г. Положим
G.7) /(=-{ft: Лея и МЧ*)# ^«0, f-1,2, ..M n, V^€SC0)}.
Так как ^(-^ х), ..., Ln(«, х) линейно-независимы для каждого
a;?SC0), to K<zA(H) и codim/C=sAi. Покажем, что /CcG(m).
Пусть ft—произвольный элемент из /С. Возьмем любое /?<30 и
положим f(x) = f + ch (х) для | с |< б (/)/] ft (а) ||, где а = 5 (/). Тогда
Для ^> близких к а, и ЭТ(/(л:), х) = 9?(/, х), так как
(, x). Таким образом, ]&V(f). Поскольку р($1, 5)^
то, согласно определению 2.5, S(f + ch(x))—S(/) =
о(||х—• all'711) для каждого ц>0. Это означает, что h?G(m)
7, Итерации т-го порядка 261
и, следовательно, KcG(m). Поэтому из G.5) вытекает, что
indE, т) <codim/( = /2 = card(!ift).
Противоречие! Следовательно, р (Ш, S) < т. |
Теорема 7.1 утверждает, что кардинальность любого
линейного информационного оператора Щ, порядок информации
которого больше или равен т, должна быть не меньше т-го индекса
задачи S.
Построим теперь такой линейный информационный оператор
% $ГС?1лр(?) и cardEW)==ind(S, m), что p(9t, 5)>m.
Пусть А * =* {h: h ? Н и h (х) 6 Л * (х) Vx?S C0)} —линейное
подпространство в Я, на котором достигается минимум в G.5), т. е.
G.8) A*czG(m) и codim 4* = ind(S, m).
Это значит, что A*(x)~\nd(S, m) для каждого #?SC0).
Запишем разложение Sl^Am(x)@A*(x)^\ для каждого f^3t мы
имеем
G.9) f-h+2L;(f, х)Ъ(х)9
где n»=aind(S, m), /0^Л*(а:) и L*(-, л:), •..,
Ln*(-»x)—линейно-независимые линейные функционалы при каждом
фиксированном x?S($0). Оператор
G.10) ЭС(Л x)-[Li(ft х\ .... С tf, д?)]
будем называть /n-ж основным линейным информационным
оператором.
ОПРЕДЕЛЕНИЕ 7.2. Будем говорить, что оператор решенияS
принадлежит классу Lip(k(m)) (запись: S ? Lip (k (m))), если
существует оператор ЭД^ вида G.10), такой что ^^Lip(^(m)) . |
Заметим, что 0i*^Lip(^) означает, что L*?Lip(&) при i=*
=5 1, 2, ..., п*. Ясно, что card(9^) = ind(S, m). Из G.9)
вытекает, что L*(lj(x), x) = 8i/9 и можно считать, что lj?Lip(k).
Оценим порядок p($l?n, S) для /n-й основной линейной
информации ЭД5,.
Теорема 7.2, Предположим, что S?L\p(k(m)). Тогда
G.11) р@С S)>m. I
Доказательство. Пусть / ^ Эо, а =^5 (/). Возьмем любое / 6 V (/)¦
Тогда Л (х) = f (х)—/ принадлежит множеству ker?R?t(*» х), т.е.
Li(h(x)t x)==Q. Так как /€Lip(*), то и AgLip(^). Отсюда и
из G.9) вытекает, что h(x)?A*(x) для каждого л:б5C0). Это
значит, что h^ Л*. Так как /4*cG(m)? то/i6G(m). Заметим,
262 Ч* В г Модель с итеративной информацией
что |й(а)||< б (f). Следовательно, в G.2) можно положить с=1,
откуда
15 (f (x))-S (/) ||- о (\\x-a[»-*) Vi! > 0.
Этим доказано, что р($?т> S)^m. |
Теоремы 7.1 и 7.2 утверждают* что для того, чтобы
обеспечить существование итерации m-го порядка, следует
использовать линейные информационные операторы, кардинальность
которых не меньше m-го индекса. Если ind(S, m)=+°°> то
линейные информационные операторы конечной кардинальности
не дают информации, достаточной, чтобы гарантировать
существование итерации m-го порядка.
Докажем, как и в § 6, что в некоторых случаях любой
линейный информационный оператор Ш, порядок информации
которого не меньше т, содержит информацию Щ*т.
Теорема 7.3. Предположим, что G(m) = v4*, a $1—линейный
информационный оператор класса Lip(?(m)). Тогда р(Ш, 5)>
(Ср. с теоремой 4.2. из работы Трауба и Вожьняковского
[76Ь], где сходная задача рассматривалась для нелинейных
уравнений.)
Доказательство. Пусть / ? 30, a=S (/). Так как р=*р (% S) !>m,
то
S Q (х)) -S (/) - о (|| х-а Г4) V4 > 0
при любом f g V (f). Пусть g0—произвольный элемент из ker $1 (• ,а).
В силу леммы 4.4, можно найти функцию /i, такую что h С Lip (k)f
91(й(*),*)в0 и h(a) = g0. Так как S(f+ch{x))—S\f)=*
= о(Цх—a||"^)Vri>0 и |с|<б(/)Р(а)||, то h?G{m)=*A*. Та-
ким образом, h (х) (= А* (х), т. е. Ц (h (a), a) se 0. Отсюда g01=
= /i(aNker^ (•, a) и ker9^(«, a)cker%(», a). Поскольку a
произвольно, то ^сЭТ. |
Проиллюстрируем понятие /я-го индекса двумя примерами.
ПРИМЕР 7.1. Нелинейные уравнения. Возьмем, как и в
примере 6.3, S(/) = /-i@). Пусть /г^Н. Тогда А(*), т.е. функция
h(x) — h(x, •), есть элемент из 3,. Легко проверить, что
где k~k(m) определено формулой G.1). Это значит, что h(x, t) *==
= 0((л;—t)k+1) принадлежит множеству G(m). Нетрудно
проверить, что m-й индекс задается формулой
ind(S, m)**l
8. Индекс сложности для итеративной линейной информации 263
где ;V — размерность задачи. В случае iV = +00 имеем ind E, т)=*
= + оо. Информация Ш^ задается теперь формулой
®m(f, x) = {f(x), f'(x)t ..., rwi;
она интенсивно изучалась Траубом и Вожьняковским [76b, 77a,b]. |
ПРИМЕР 7.2. Линейные уравнения. Как и в примере 7.1,
рассмотрим оператор 5(/) = /@), предполагая дополнительно,
что/—аффинная функция, точнее, что f(t) = At—b, где Л —
невырожденная N X //-матрица, a b—некоторый (N + 1)-вектор.
Тогда
{ #ЬШ о9 / = 0, 1, ..., k(m),
{ о9 / 0, 1, . |
где h(x, t)—линейная функция от t. Легко проверить, что
ind E, m) = N{N+l) Vm > 1.
Отсюда следует, что каждый алгоритм ф, использующий
произвольный линейный информационный оператор Ш кардинальности,
меньшей N(N + 1), имеет порядок /?(ф)<р(Л, 5)^1. Далее,
каждый интерполяционный алгоритм ср1, использующий линейный
информационный оператор $l*(f, x) = [f(x), f (x)]f card(9Z*) =
= N (N+l)9 имеет порядок p(<pl) = p($l*t S)=+°°. Так как
f(x) = Ax—by a f'(x) = A, то / полностью определяется
информацией 9?*(/, x) и выполнение алгоритма ф1 требует решения
некоторой линейной системы. Следовательно, ф1—прямой
алгоритм. |
8, ИНДЕКС СЛОЖНОСТИ ДЛЯ ИТЕРАТИВНОЙ
ЛИНЕЙНОЙ ИНФОРМАЦИИ
Конкретизируем нашу модель вычислений для случая
итеративных линейных информационных операторов по аналогии с
моделью для линейного случая в ч. А. '
Модель вычислений для итеративной
линейной информации
(i) Пусть Р—заданный набор простейших операций.
Предполагается, что операции сложения двух элементов из 32, f + g,
и умножения элемента из 32 на скаляр, cf> являются
простейшими и принадлежат Р. Предполагается также, что вычисление
значения каждого линейного функционала L(-, x) — простейшая
операция, принадлежащая Р, при каждом рассматриваемом х.
Отсюда следует, что любой линейный информационный оператор
9?= [Li, L2, ..., Ln] конечной кардинальности допустим при
произвольных линейных функционалах Llt L2, ..., Ln.
264 Ч. В. Модель с итеративной информацией
(и) Введем масштаб измерения сложности, приняв стоимость
сложения двух элементов из 32 или умножения элемента из 32
на скаляр равной единице. Далее, предположим, что сложность
вычисления значения линейного функционала L (•, х) не зависит
отх, и положим comp (L)—comp (L (/, х)). Пусть Ш = [Llf ..., Ln]—
линейный информационный оператор, card (9?) = п. Будем считать,
что для вычисления 9?(/, х) необходимо независимо вычислить
^i (/» х)у •••> Ln(f, x) и информационная сложность 91 задается
равенством
(8.1) comp (Щ = S comp (I,.).
Если comp (Lt) = ch то comp (91)^ my, отсюда видно, как
информационная сложность зависит от кардинальности $1.
(iii) Пусть ф—допустимый алгоритм, использующий инфор*
мацию ЭД и отыскивающий е'тприближение для элемента a = S(/).
Пусть сотЬ(ф)—комбинаторная сложность ф. Для всех задач,
представляющих практический интерес, алгоритм ф должен
использовать каждое Lg(ff x), f=*l, 2, ..., п, и текущее
приближение х по крайней мере один раз, поэтому comb (ф)^ п.
Исключая из рассмотрения задачи и информационные операторы
нетипичного специального вида, будем предполагать, что
comb (ф)^ я для каждого из рассматриваемых алгоритмов. |
Исследуем вопрос об индексе сложности итерационных
алгоритмов, использующих линейный информационный оператор $1.
Предположим, что 9? = [Llt ..., Ln] и р(Ш, S) больше единицы.
Пусть ф—допустимый алгоритм из класса Фрегт (97, S) ир(ф)>1
(см. § 3). Тогда ф принадлежит также классу IT(9't, S)
итерационных алгоритмов (см. следствие 5.1). Индекс сложности z (ф)
определяется (ср. с C.11)) формулой
(Я о\ * (аЛ — comp (%)+. comb (ф)
Где comp (91) =^=2?=i comp (Lf-)—информационная сложность, а
comb (ф) а* sup comp (ф (х, 9i (/, x))
(f, x)
*—комбинаторная сложность алгоритма ф. Допустим для
простоты, что comp (Li)^c1. Как мы знаем из теоремы 2.3, ()^
($l> S). Поскольку comb (ф)^п, то
Кроме того, teopeMa 2.4 гарантирует существование алгоритмов,
порядок которых равен порядку информации. Предположим, что
один из этих алгоритмов максимального порядка допустим. Пусть
8. Индекс сложности для итеративной линейной информации 265
comb(^, S) обозначает минимальную комбинаторную сложность
алгоритмов максимального порядка, т. е.
(8.4) сощЪ(% S)=* inf сотЬ(ф),
()(Я, S)
a comb (9?, S)—минимальную комбинаторную сложность алгорит-
мов ф из Фрегю(9?, S) с /?(ф) > 1, т. е.
(8.5) combffl, S)= inf сотЬ(ф).
" ф: Р(Ф)> 1
Очевидно, что я < comb (9t, S)<comb(9t, S). Из (8.4) и (8.5)
вытекают следующие оценки на индекс сложности г (91, S) задачи S
при использовании информации 91 (см. определение 3.1).
Лемма 8.1. Имеют место оценки
(8 6) /Kj + combgt, S)
, S) ^ZVC> Ъ)Ъ*' log p ДО, S)
Заметим, что если псг ^>comb(SR, 5), то
и каждый алгоритм ф максимального порядка близок к алгоритму
минимального индекса сложности, поскольку z (^czncjlogp (Ш, S).
Проведенное обсуждение мотивирует постановку следующей *
проблемы: для фиксированного п найти линейный
информационный оператор 9i с card (ЭТ)< п и максимальным порядком
информации. Пусть Wn—класс всех достаточно регулярных линейных
информационных операторов Ш с card ($)^/г. Предположим,
что оператор S тоже достаточно регулярен.
ОПРЕДЕЛЕНИЕ 8.1. Величину р (/г, S), задаваемую формулой
(8.8) р(п9 S)= sup p(% 5),
будем называть п-м максимальным порядком задачи S. Далее,
оператор Лто€?й будем называть п-й информацией
максимального порядка для задачи S, если
(8.9) р(Ж™, S) = p(n, S). |
Результаты § 6 и 7 позволяют найти n-Pi максимальный
порядок и п-ю информацию максимального порядка. Напомним,
что ind(S, т) обозначает /n-й индекс задачи 5, т^ 1 (см.
определение 7.1); отметим, что ind(S, т)—неубывающая функция от т.
Предположим сначала, что ind(S, 1)= +<х>. Тогда ind(S, m)=
= + °° и, по теореме 7,1, р (Ш, S) = 0 для каждого Ш с card {Щ<
<-j-oo. Поэтому р(п, S) = 0 и каждый линейный
информационный оператор удовлетворяет условию (8.9).
266 Ч. В. Модель с итеративной информацией
Пусть теперь
(8.10) rco = ind(S, 1)< + оо.
Из теоремы 7.1 немедленно вытекает, что p(nt S) = 0 при п < п0.
Для п^п0 положим
(8.11) q(n, S) = inf{m: n<ind(S, m)},
с соглашением, что q(n, S)=+oo, если ind (Sym)^n Vm.
Функция q(ny S) не убывает по n, и q(n0, 5)^1. Мы готовы
доказать следующую теорему.
Теорема 8.1. Пусть no = ind(S, 1). Тогда
0 при п < я0,
(8.12) нк"" "'~\q(nf S) при п>по.|
Доказательство. Достаточно доказать (8.12) для /го< + сх>
и п7^п0. Пусть q = q(n, S). Возьмем произвольное
положительное г]. В силу (8.11), ind(S, q—ri)<п. Теорема 7.2 гарантирует
существование линейного информационного оператора Ш, такого
что card (Ш) = ind(S, q—ц)^п и р(Ш> S)^q—ц. Так как ц
произвольно, то р(п, S)^ q — q(n, S).
Из (8.11) следует, что n< ind(S, q + ц). Теорема 7.1
утверждает, что p($l, S)<q + y] для любого 9?^^- Поэтому р(п,
S)^q, а значит, р(п, S) = q(nt S). I
Теорема 8.1 показывает, как зависит п-й максимальный
порядок р(п, S) от задачи 5. Поскольку S и линейный
информационный оператор 91 предполагаются достаточно регулярными,
то п-и максимальный порядок р(п> S) есть целое число. Найдем
n-ю информацию максимального порядка для п^по== ind(St I),
где n0<-foo. Пусть ri€@, 1), аШп—линейный информационный
оператор, такой что card (9?J=ind(S, p(n,S)—г\) <пи/?(9?Л, S)^
^ p (я, S)—y\ > p (nt S)— 1. Существование Шп гарантируется
теоремой 7.2. Поскольку рф\, S)—целое число, то мы
заключаем, что p($ln, S) = p(nt 5). Тем самым доказана следующая
теорема.
Теорема 8.2. Пусть no = indE, 1)< + оо. При п>п0
информация Шп является n-й информацией максимального порядка для
задачи S. В
Исследуем индекс сложности г(!ЭТ, S) информационных
операторов $1 из класса Wn.
ОПРЕДЕЛЕНИЕ 8.2. Будем называть величину г(п, S),
задаваемую формулой
(8.13) *(n, S)=» inf г(Ш, S)§
8. Индекс сложности для итеративной линейной информации 267
п-м минимальным индексом сложности задачи S. Будем говорить,
что nopt в novi (S) есть оптимальная относительно индекса
сложности кардинальность для задачи S, если
(8.14) z(novi, S)=*intz(n$ S).
п
Будем называть линейный информационный оператор 9?01
оптимальным информационным оператором для вадачи S, если
(8.15) card (Я" ) - "opt (S) и р №°\ 5) - Р (Pt> S). I
Пусть comb (n9 S) ¦¦ infsR€\p-n comb (Ш> S) и comb (n, S) »
-infR€^c5nb(8i, 5), где Т>{»: SlgVj и р (SR, S)-p(/i,S)K
Из леммы 8.1 и теорем 8.1 и 8.2 вытекают следующие оценки
на д-й минимальный индекс сложности.
{8ЛЬ)
Лемма 8.2» Имеют место оценки
, S) ngl+^Sb(n, S)
\ogP(ntS)
Заметим, что (8Л6) существенно упрощается, если
^> comb (/г, S). В этом случае
Это показывает, что м-й минимальный индекс сложности зависит
от кардинальности информации и от m-fo максимального порядка.
Для отыскания оптимальной кардинальности надо
минимизировать функцию f(n)*s*z(n9 S). Значение nopt (S) зависит лишь от
вкороети стремления к бесконечности при п —> оо функций
сотЬ(д# S), comb (п, S) и р(п, S). Зная «ор1E), по теореме 8.2
можно легко найти оптимальный информационный оператор $10[.
В заключение данного параграфа приведем один пример.
ПРИМЕР 8.1. Рассмотрим, как и в примере 6.3, задачу
решения нелинейных уравнений S(/)»f"l(O). Пусть iV—размерность
задачи, N <-Ьоо# Трауб и Вожьняковский [77Ь] показали, что
i 3 при N «в 1 (скалярный елучай),
«opt (S) — j N (N ^ ij при f/^2 (многомерный случай).
Оптимальный информационный оператор имеет вид ЛР(/, к)
[/() fix), I'M] при А/» 1 и 9i-(/, *)-[/(*)• Г MJ
268 Ч. В. Модель с итеративной информацией
9. ИНФОРМАЦИОННЫЙ ОПЕРАТОР С ПАМЯТЬЮ
В этом параграфе будет вкратце намечено, как можно
обобщить понятия предельного диаметра и порядка информации на
случай информационных операторов с памятью. Как всегда, мы
хотим аппроксимировать решение a = S(f). Предположим, что
х0, х1У ..., xr> г^\у— уже известные попарно различные
приближения к а. Пусть
(9.1) 91: D«c3iX35+1-*3f
— информационный оператор с памятью (не обязательно
линейный), причем (/, х09 xlf ..., xr)?D% для всех /€30 и всех
попарно различных х0, х1У ..., хп достаточно близких к а;
Э3—некоторое заданное пространство. Параметр г служит мерой объема
памяти оператора 91. В общем случае 91(/, х0У х1У ..., хг) не
определяет однозначно решения а, и для многих других
элементов задачи информация в х0У х, ..., хг та же, что и для /. Введем
понятие равенства относительно 91.
ОПРЕДЕЛЕНИЕ 9.1. Будем говорить, что функция f:D~fcz
cz3;2+1—>30 равна f относительно 91, если
(i)fglF, где W—некоторое заданное пространство, и
существует Г= Г (/)> О, такое что
[7, где У(Г)=ф: ||*~а||<Г}, a a = S(/);
(ii) 91(?(*о> *i> •••> *r)> xo> xi> •••> xr) = $Hf, xQ, xl9 ..., xr)
V( )D
Для краткости будем в таком случае писать f?V(f), т. е. V(/)
обозначает множество всех функций /, равных/относительно91. |
Пространство W описывает регулярность J как функции от
х0, х1У ..., хг. Предельный диаметр d(9t, S) информации 91 для
задачи 5 определяется теперь следующим образом.
ОПРЕДЕЛЕНИЕ 9.2. Предельным диаметром информации 91
для задачи 5 будем называть величину d(91, S), задаваемую
формулой
(9.2) d (91, S) = sup sup lim sup ||5 (fx (*„,..., xr)) —
Будем говорить, что информация 91 является сходящейся (или
сходится) для задачи S, если
(9.3)
9. Информационный оператор с памятью 269
Пусть стационарный алгоритм с памятью
(9.4) ср: Яфс:%+1хЩАО—32
порождает последовательность приближений по формуле
(9.5) x/+1 = y(x/t xy-i, ..., *у-г> ffttf, Xj, Xj_u ...,ху-,)),
/ = r, r+ 1, .... Заметим, что ф использует г ранее вычисленных
приближений и вычисленную для них информацию 97. Обычно 97
содержит «новую информацию» в Xj и заново использует ранее
вычисленную информацию в xJmml, ..., Xj_r. Пусть Ф(97, S) —
класс всех стационарных алгоритмов с памятью. Мы хотим
изучить вопрос о сходимости последовательности {х;-} к а. Как и в § 2,
введем понятие предельной погрешности алгоритма ф.
ОПРЕДЕЛЕНИЕ 9.3. Будем называть величину е(ф),
задаваемую формулой
(9.6) е (ф) = sup sup lim sup fl <p (*0, ..., xr, $1 (/, x0, ..., xr)) —
i=0, 1 r
-S(f(x0, ..., xr))l
предельной погрешностью алгоритма ф. Алгоритм ф называется
сходящимся, если е(ф) = 0.|
Рассуждая так же, как при доказательстве теоремы 2.1, легко
доказать следующую теорему.
Теорема 9.1. Для любого алгоритма ф?Ф(9?, S)
(9.7)
Итак, d($ly S)/2—неустранимая погрешность информации 97 для
любого алгоритма ф. Диаметр d(SR, S) оценивает сверху
погрешность интерполяционных алгоритмов, определение которых
аналогично определению из § 2.
ОПРЕДЕЛЕНИЕ 9.4. Будем говорить, что ФГ€Ф(^, S)
является интерполяционным алгоритмом, если
(9.8) ф1 (х0, ..., х„ SR (/, х0, ..., хг)) = S(f (х09 ..., хг))
для некоторого J^V(f).§
Это означает, что в качестве нового приближения к а
интерполяционный алгоритм ф1 выбирает точное решение для элемента
задачи f(x0, ..., хг) с той же информацией вх0, ..., хп что и /.
На практике / (х0У ..., хг) должно быть «проще», чем /.
Непосредственно устанавливается
270 Ч. В, Модель с итеративной икфор нацией
Теорема 9,2. Для любого интерполяционного алгоритма
Ф'€Ф(Э1, S)
(9,9) ^Ф'Х^Я, S).|
Итак, сходящийся алгоритм имеется в Ф($1, S) в том и только
том случае, если 91 сходится. Допустим, что $1—сходящийся
информационный оператор. Выясним, сколь бьютро S Q (х0, ..., хг))
стремится к S(J) при стремлении х{ к а, *=»0, 1, ..., г. Обобщим
понятие порядка информации следующим образом. Пусть
А—множество вещественных (г + 1)-мерных векторов, определяемое
формулой -
(9.10) Л-| (qOi qi9 ...9qr):
В предположении, что А непусто, положим
(9.11) /(i4)-sup{<: t'+i-qJ' + qJ'^+.-.+qr, где
(?о> Яи ••-, ^г)€^}.
Заметим, что многочлен tr+1—{qotr+ ... +qr) при 9/^0 и
2{ fli ^ 1 имеет единственный положительный нуль fi ^ 1.
оэтому /(Л)> 1.
ОПРЕДЕЛЕНИЕ 9.5. Величину р (ЭТ, S), задаваемую
формулой
[ О, если А пусто,
' ' ' р* ' ' J t(A) в противном случае,
назовем порядком информации 91 для задачи S. |
При г «в 0, т. е. для информационных операторов без памяти,
множество А совпадает с множеством, определенным в B.17),
и t (A)«sup{q: q&A\. Поэтому определение 9.5 при г «*0
совпадает с определением 2.5. (См. также работу Кунга и Трауба [76а],
где предложен сходный метод для измерения скорости сходимости.)
Приведем теорему, с помощью которой часто можно вычислить
порядок информации p(9l, S).
Теорема 9.3» Если существуют р%% ри ..., рг> такие что
и
(9.13)
9. Информационный оператор с памятью 274
при всех х0, ..., хп достаточно близких к а = 5(/), ||;с0—а||<1...
... < Цл:,—а|| и ct (f, f)< + оо, то
(9.14) р(М, S)^p,
где р—единственный положительный нуль многочлена tr+t-~
Если, кроме того, существуют f€$0 и f?V(f), такие что
(9.15) IS(f(xOi .... xr))-S(/)||>ca(/, /)||хо-а||Р......||*,-а[|'''
для всех xoi .,., хг, достаточно близких к а ^= S(/), |]л:0—а|^..,
... <||*,.—а|| и c2(f, /)>0, то
(9.16) р (Я, SH/M
Доказательство. Из (9.13) следует, что (р0, ри ..., /?fN^i.
Поэтому, в силу E.11), р(% S)=*t(A)^p. Тем самым доказав
но (9.14).
Предположим, что выполняется (9.15). Пусть (qoi qu ,.,, qr) g Л,
Тогда
(9.17) М/, ?)ll^o
¦— S
Для продолжения доказательства нам нужна следующая лемма.
Лемма 9Л. Пусть co(i)=s/7o/74- ... +/?г, а(/)=»?0^+ • • ?/
где Pi^0t ^>0 и 2?=°^/^ ^- Пусть, далее, р—единственный
положительный нуль многочлена tr+l—со(/), а ^—единственный
положительный нуль многочлена tr+1—u(f). Тогда из условия
V^[0, r]
следует, что ^M
Доказательство. Пусть ю (/) *¦ © A) + ю' A) (/ — 1) -f ...
...+(l/r!)©(r>(l)(f—l)'. Заметим, что со<*>A) = 2?о/?7, где
С; = (г—i)\/(r—I—k)l при t = 0, I, ...,r—k. Положим cr_k+1 = 0.
Легко видеть, что ?/>?/+! для i=*0, I, ..., г—k. Умножив обе
части неравенства /?0+Pi+» • • +P/^<7o+9i4- • • • +9/ на ^у—^y+i»
/==0, 1, ..., г—&, и сложив получившиеся неравенства,
найдем, что
r-k r-k r-k r-k /
i=0 t=0 /=i /=0 i=0
272 Ч. В. Модель с итеративной информацией
для 6 = 0, 1, ..., г — 1. Отсюда следует, что (o(t)^u(t) при
t^l. Полагая / = <7, получаем a>(qO^u(q) = qri'1. Итак,
qr+1— со (</)<(), откуда p^q.M
Пусть теперь i—любое целое число из [0, г]. Предположим,
что xi+1, ..., хг фиксированы, и пусть х1==х2= ... =*/
стремится к а. Тогда из (9.17) следует, что ро + рг+ ... +Р/ ^?0+
+?i+ • ••+<?/• На основании леммы 9.1 и равенства (9.11)
заключаем, что р($1, S)^.supq^p. Следовательно, в силу (9.14),
p($l, S) = p. Равенство (9.16) доказано. 1
Пусть ф—сходящийся алгоритм из Ф(9?, 5). Порядок ф
определяется подобно тому, как был определен порядок
информации. Пусть В—множество вещественных (г-\- 1)-мерных
векторов, задаваемое формулой
(9.19) 5 = | foe, qit ..., qr):
Напомним, что в случае, когда В.цепусто,
{^ t+i t + ti++ где
ОПРЕДЕЛЕНИЕ 9.6. Величину р(ф), задаваемую формулой
0, если Б пусто,
^ ' ' ^ ~~ \ / (Б) в противном случае
назовем порядком алгоритма ф. |
При г = 0 определение 9.6 эквивалентно определению 2.6,
поскольку р (ф) = t (В) = sup В для непустого В. Отметим, что
в (9.19) значение ф(#0, ..., хп Щ/, хо> ..м д:г)) сравнивается
с каждым элементом решения 5(/(х0, ..., xr))y f?V(f).
«Классическое» определение порядка основано на сравнении ф (х0У ...,хг,
9^ (/» х09 ..., #r)) с самим решением a = S (/). В добавлении к этой
части будет показано, что для всех алгоритмов, представляющих
практический интерес, «классический» порядок равен /?(ф).
Очевидно, что для алгоритма ф можно установить результат,
аналогичный теореме 9.3. А именно, если
(9.21) ||ф(х0, ..., х„ ЩГ, хй9 ..., xr))-S(f(x09 „., хг))\\
= 0(|]x0-a|h .... .\хг—*\рг)
при pi ^ 0 и 2f-o Pi ^ 1» то Р (ф) ^ Р. гДе Z7—единственный
положительный нуль многочлена tr+1 — (/V+ • • • +/?/•)• Более того,
если оценка (9.21) точна, то /?(ф) = /?.
9. Информационный оператор с памятью 273
Докажем теперь, что порядок алгоритма не может превышать
порядка информации.
Теорема 9.4. Для любого алгоритма ф?Ф(ЭТ, S)
(9.22) р(ч>)<Р(% S).§
Доказательство (ср. с доказательством теоремы 2.3). Без
потери общности можно считать, что В Ф 0. Пусть (qo,qlt ...9qr) —
произвольный элемент из В, и пусть 7бЗо, f?V (/). Тогда
\\S(f(x0, ..., xr))-S(/)|Kl<P(*o> ..., х„ Ж(/, х0> ..., х,))-
-5(/>0, ..., *,))Ж<Р(*о. ...,*„ 9l(f, *.,..., x,))-S{f))\ =
= о(||дг0—а\\*-ъ ... ||*r_a||*r-ii) Vti > 0.
Тем самым доказано, что (^0, ql9 ..., qr) € А (см. 9.10) и t (В) ^t(A).
Отсюда р (ф)<р (9?, S). |
Порядок любого интерполяционного алгоритма достигает
границы р(Э1, 5).
Теорема 9.5. Для любого интерполяционного алгоритма
ф'€Ф0К, S)
(9.23) />(Ф') = Р№ S).|
Доказательство. Метод доказательства аналогичен методу,
использованному при доказательстве теорем 2.4 и 9.4. |
Теоремы 9.4 и 9.5 показывают, что порядок любого
интерполяционного алгоритма р(Ш, S) максимален в классе Ф(% S).
ПРИМЕР 9.1. Нелинейные уравнения. Как и в примере 6.3,
рассмотрим оператор S(/) = /"@). Положим
(9.24) '9Щ*хй9 ..., xr) = \f{x0)9 П*о), •••> PW, ..., /W,
Г(х,)9 ..., Г(лг)]
при некотором заданном k^O. Пусть W—класс аналитических
функций, т. е. f?W означает, что функция ](х, t) аналитична
по х и t.
Случай 1: N=1. Здесь /—скалярная функция скалярной
(вещественной или комплексной) переменной. Включение /? V (f)
означает, что />, t) = f(t) + G(x, t) Ш=о(х—x,)*+1, где G(x9 /) —
некоторая аналитическая функция. Легко проверить, что /?(9i, 5) =
= р (k, г), где р (&, г)—единственный положительный нуль
многочлена tr+1 — (k+ 1J3/—о <Л и*+ 1<р(Л, r)<^ + 2, \imr-,+*p(k, г) =
= & + 2. Как хорошо известно, в этой ситуации
интерполяционный алгоритм цIг k определяется следующим образом:
(i) отыскивается интерполяционный многочлен со степени не
выше (k+l)(r+\) — 1, такой что
г;
274 Ч. В. Модель с итеративной информацией
(ii) xr+1=*q>lrt k(x0, ..., xrf $l(ff xot ..., xr)) определяется
как нуль многочлена со, выбираемый по какому-либо признаку
(например, нуль, ближайший к х0).
При некоторых значениях k и г получаем известные
итерации. Например, при & = 0 и г==1 получается итерация метода
секущих, при k=*l и г —0 — итерация Ньютона. Более
подробное обсуждение этого вопроса можно найти у Трауба [64].
Случай 2: jV>2. Здесь /—многомерная или абстрактная
векторная функция. По теореме 5 из работы Вожьняковского [74]
(9.25) р{Ш, S)=*fe+1 Vr.
Это значит, что р (% S) не зависит от г, и содержащаяся в /(/) (xj)
при * = 0, 1, ..., k и /=1, 2, ..., г информация не помогает
увеличить порядок. Однако если определенное расположение
точек Xi, x2i ..., хг зафиксировано, то р (ЭД, S) может быть больше,
чем &+1, для r^N+l. Примерами могут служить итерация
многомерного метода секущих (k = 0, r = N) и обобщение
интерполяционной итерации cpjt k (см., скажем, Брент [72], Вожьня-
ковский [74], Ортега и Рейнболдт [70], Плешаков [77],
Янковская [75]).!
Обсудим вкратце вопрос о сложности алгоритма ф,
использующего информационный оператор $1 с памятью. Предположим,
что для заданных начальных приближений xoi xi9 .. ¦, хг
алгоритм ф вырабатывает последовательность {#/}:
*,+1«<р(х/, ...* х{_ГУ W.(f, *,_„ ..•, Xi))9
такую что
(9.26) e^GfiVitfi^ .. .-ep{ir^ е^\х^а1 / —г+ 1, ...,
где /?/>0, а 9==2^оР/>1. Пусть р—единственный
положительный нуль многочлена tr+1—(potr+ ... +рг)> Предположим,
что константы Gj — Gtif) удовлетворяют соотношению
(9.27) 0 < G < Gt < G < + оо.
Для упрощения анализа сложности допустим, что существуют
константы Г, Г< 1, Сх и С2, такие что
(9.28) СХТ*>* ^е^СъТ** при f= 1, 2, ..., г,
(9.29) CJ-« < G, С\~о > G.
Легко проверить, что в этом случае
(9.30) СгТР* < ег < С2Тр( VI.
Напомним, что мы ищем xk, где k—наименьшее целое, такое
что ek^i&'e0 при заданном б'^@, 1). Пусть 8^в' таково, что
9. Информационный оператор с памятью 275
ек**ее0. Из (9.30) вытекает, что
/93п log (log (ci/ggo)/log A/Г)) < к< Jog (log (C2/eg0)/log A/D)
\ ' } \0gp ^ ^~ lOg/7
Для малых е имеем ken (loglog l/e)/log/?. Пусть comp (ф, f) —
сложность вычисления л:й по х0, хъ ..., хг. Предположим, что
стоимость каждого итерационного шага равна #(ф, /). Тогда
(9.32) сотр(Ф, /)-Ас(ф, /)-*(ф, /)g(fc, в),
где ^(й, e)==Alogp«e(loglogl/e)(l+О(в)), а
(9.33) г(Ф, /)-с(Ф> /)/logp.
Величину г (ф, /) будем называть индексом сложности ф для /.
Обсудим вопрос о стоимости одного итерационного шага. Чтобы
выполнить t-й шаг, надо вычислить 9{(/, */„,._!, ..., /, X/^i)
и затем ф(х/в1> ..м х,.,.,, ЭТ(/, х,.,,.^ ..., х/иш1).
Предположим, что
(9.34)
для некоторого допустимого информационного оператора без
памяти Ш. Тогда сотр(91(/, х/ш.,_„ ..., x{iml)y-*comp$i{f, x{;=Lt)),
поскольку ранее вычисленная информация Ш(/, лг/«.2)» •••» 9t(f,
^/-r-i) используется заново. Это значит, что информационная
сложность не зависит от размера памяти г. Пусть comp (Ш) &*
ecomp E1 (f, x,)).
Обозначим через comb (ф, г) комбинаторную сложность
алгоритма ф. Тогда
(9.35)
Мы ищем алгоритм минимального индекса сложности.
Поскольку порядок алгоритма ф не превосходит порядка
информации р(Ш, S) и существуют алгоритмы ф с /?(ф)«гр (9i, S), то
5R, 5) •
где comb (gt, г)—минимальная комбинаторная сложность алго*
ритмов порядка выше единицы, использующих информацию 91,
a comb(9'{, r)—минимальная комбинаторная сложность
алгоритмов максимального порядка р(91, S). Если comp (9?)^>comb (91;, г), то
276 Ч, В. Модель с итеративной информацией
Заметим, однако, что обычно неравенство comp (dl) ^> comb ($R, r)
может выполняться лишь при малых г или для «достаточно
трудновычислимых» /.
10. НЕКОТОРЫЕ ДОПОЛНЕНИЯ
И ОТКРЫТЫЕ ПРОБЛЕМЫ
В заключение этой части укажем некоторые дополнения к
изложенным выше результатам и некоторые открытые проблемы.
1. Мы показали, что если индекс задачи бесконечен, то
задачу нельзя решить итеративно, используя одноточечный
линейный информационный оператор конечной кардинальности. Как
охарактеризовать все задачи конечного индекса? Далее, как
охарактеризовать все задачи, для которых indE) = s, где
s—заданное целое число? Тот же самый вопрос можно поставить
относительно т-го индекса линейного информационного оператора
с памятью или без памяти.
Как было доказано, конечномерные нелинейные уравнения
5(/) = /< @) могут быть решены при помощи итерационных
алгоритмов конечного порядка, использующих линейные
информационные операторы конечной кардинальности. Самый ли это
общий вид задачи S, допускающий итеративное решение?
Следующий пример показывает, что это не так.
ПРИМЕР ЮЛ. Пусть /: [0, I]—* R—гладкая скалярная
функция. Положим
[F(n№ = [Af](t)+d(t, f(t)), t?[0, 1],
где А—линейный оператор, a d—гладкая функция двух
переменных. Пусть 30—класс функций /, таких что уравнение
[F (/)]@ — 0 имеет на [0, 1] единственный нуль, причем этот
нуль простой. Рассмотрим задачу
(ЮЛ) S(f) = g([F(f)]-*(O))t
где g—некоторая гладкая взаимно-однозначная функция,
обратная к которой удовлетворяет условию Липшица. Формула A0.1)
означает, что сначала ищется решение |3 уравнения [F (/)](*) = о,
а затем вычисляется a = g(f}). Далее, рассмотрим одноточечный
линейный информационный оператор
y)> f(y), f'(y)l где y = g~l(x).
Заметим, что card (9i)^ 4. Зная 5ГС(/, х), можно вычислить
m [Af] JF(f)]'() [Af]'() dd(J())
[(fmy) [f](y) + (yJ(y))[(f)](y) [f](y) 1(yJ(y)) +
-\-d2d(y, f(y))f'(y) (d/ обозначает частную производную по t-му
аргументу), а потом применить для аппроксимации [J итерацию
10. Некоторые дополнения и открытые проблемы 277
Ньютона. Наконец, рассмотрим алгоритм
Ф(*. Я tf, x)) = g(y-[F(f)](y)/[F(f)Y(y)).
Имеем
- О ((Г1 (x)-g-> (а)J) = О ((*-(*)•).
Это показывает, что порядок алгоритма ф и порядок
информации не меньше 2. Таким образом, задачу A0.1) можно решить
итеративно. В качестве частного случая возьмем Л/ = /(у), d = 0
и g(x) = x. Тогда a = S(/)—единственный, и притом простой,
нуль уравнения /(у)(/) = 0.|
Нас интересует наиболее общий вид задачи S, допускающей
итеративное решение. Выдвинем следующую гипотезу. Пусть
Do и D1—открытые подмножества в С^, l<!N< + oo, и 8Х
обозначает класс функций /: D0—^D1.
Гипотеза 10.1. Если задачу S можно решить итерационными
алгоритмами, использующими одноточечные линейные
информационные операторы конечной кардинальности, то существуют
оператор F: DFd^1^^1 и функция g: D^cC^—*32, такие что
A0.2) S(f)
Эта гипотеза утверждает, что итеративное решение допускают
по существу лишь нелинейные уравнения. В самом деле, A0.2)
означает, что a = S(f) есть преобразованное значение P:a = g"(P),
где |3-~-решение преобразованного нелинейного уравнения [F(f)](t)=>
=0. Заметим, что в гипотезе 10.1 мы не конкретизируем свойств
F и g, а просто предполагаем, что F и g существуют. В
примере 10.1 приводятся такие F и g, что задачу gfl^C/)]^)
можно решить итеративно. Было бы интересным найти наиболее
общий вид Fug, для которых задачу можно решить итеративно.
В ч. А было показано, что многие на первый взгляд
различные задачи можно трактовать в рамках единой общей схемы.
Если, однако, верна гипотеза ЮЛ, то в нашу итеративную
информационную модель можно включить по существу только те
задачи, про которые уже и раньше было известно, что их можно
решить итеративно.
2. Обсудим классификацию линейных информационных опера*
торов более общего вида, чем рассмотренный выше. Такие
операторы представляют и практический, и теоретический интерес.
Определим итеративный линейный информационный оператор
следующим образом. Пусть
A0.3) SR(f, xQf ..., *,)-[!, (f, ЪМ), ..- Lntf9 U*o». ¦•-.
М/, li(xr))9 ..., Ln{f, U*,))L
278 Ч. В. Модель с итеративной информацией
где 1г(х)г=х и
•••* ^y(f» E/W))t/««ii 2,..., л—1,
причем функционал L, (/, х) линеен по /. Итак, Lj (/, lf (x)) за-
висит от ранее вычисленной информации. Параметр г определяет
размер «памяти». При г = 0 оператор $1 есть итеративный
линейный информационный оператор без памяти. При г^ 1
оператор Ш заново использует ранее вычисленную информацию
в xif .. м хг и является итеративным линейным информацион»
ным оператором с памятью. При 1/(х)^х9 /=!, 2, ..., я, мы
получаем одноточечный итеративный линейный информационный
оператор, рассмотренный для случая г==;0 в §§ 4—8. Если
существует такое /', что %/(х)фх, то Ш есть многоточечный
итеративный линейный информационный оператор, поскольку
информация Lx(/, ?, (л:)), ..,, Ln(f, ln(x)) вычисляется по крайней
мере в двух различных точках. Примеры многоточечных
итераций для нелинейных уравнений можно найти в работах Б рента
[76], Вожьияковского [76], Кацевича [75], Кунга и Трауба [74],
Меерсмана [76 а, Ь].
Данная выше классификация схематически представлена в
табл. В.1.
Замечание 10.1. В случае нелинейных итеративных
информационных операторов никакой разницы между одноточечными и
многоточечными операторами нет. Различие между итеративными
Таблица В.1
| r^O rj&A
V/ |у (*)¦¦* I одноточечный без памяти одноточечный с памятью
3/ ?у (х) ^§ я I многоточечный без памяти многоточечный б памятью
информационными операторами без памяти Й«Ж^ х0) (типа
рассмотренных в § 2) и итеративными информационными
операторами о памятью (типа рассмотренных в § 9) в нелинейном
случае сохраняется |
Было бы интересным обобщить результаты §§ 4—8 на случай
многоточечных итеративных линейных информационных
операторов с памятью или без памяти. Нас, в частности, интересуют
вопросы, поставленные в п. 1, применительно к многоточечным
итерациям и итерациям g памятью. Хотелось бы также
распространить на эти случаи понятие и свойства основного линейного
информационного оператора (см. §§ 6 и 7), т. с. при заданном т
найти линейный информационный оператор 91 минимальной
кардинальности порядка не меньше т% Выполняется ли по-прежнему
утверждение теоремы 7,3?
10. Некоторые дополнения и открытые проблемы 279
3. Каково минимальное число линейных функционалов в
A0.3), необходимых для решения системы нелинейных уравнений
f(x) = O(f: DaCN~^CN)? Пример итерации Ньютона
показывает, что достаточно О (N2) линейных функционалов. Из
результатов Трауба и Вожьняковского [76Ь, лемма 4.3 и теорема 4.2]
следует, что любая итерация, основанная на одноточечном
линейном информационном операторе, требует по меньшей мере
вычисления значений f и /". Это справедливо даже при N= +oo.
Этот результат имеет отношение к информационным требованиям
на сходящиеся процессы регулирования цен в математической
экономике (см. Саари и Саймон [78]).
Кацевич [77] высказал гипотезу, что (если не ограничиваться
одноточечными итерациями) необходимо N + CN2 линейных
функционалов, где с—некоторая положительная постоянная, и
получил частичные результаты о минимальном числе линейных
функционалов для случаев N=1 и N— 2.
4. Чтобы получить оценку снизу на сложность, нужно для
фиксированной информации оценить сверху порядок информации.
В частности, пусть /—скалярная нелинейная функция с
простым нулем, и пусть S(/) = /" @). Как показали Кунг и Трауб
[74], существует многоточечный линейный информационный
оператор, использующий линейные функционалы
A0.4) Ly(/, *)S/<*/(*), Лу>0, /=1, 2, .... /г,
такой что
A0.5) р(Ш, S) = 2"-*.
Они высказали гипотезу, что
A0.6) р(% SX2"-1
для всех линейных многоточечных информационных операторов,
использующих функционалы вида A0.4). Справедливость этой
гипотезы была доказана для я=1, 2 ее авторами [76Ь], для
/г = 3 — Меерсманом [76а, Ь] и для произвольного я, но при
условии «эрмитовости» информации (fey = /— 1) — Вожьняковским
[76]. Васильковский [77] показал, что эта гипотеза верна, если
информационный оператор хорошо сбалансирован в смысле
комплексной интерполяции Биркхоффа.
В обобщение гипотезы Кунга — Трауба выдвинем следующую
гипотезу.
Гипотеза 10.2. Пусть /—произвольная нелинейная функция
с простым нулем и S (/) = /~1 @). Пусть, далее, Li9 ...,
Ln—произвольные линейные функционалы, a lit ..., Ъп— произвольные
функции. Тогда
( <272~1 при /- = 0,
Р Ф1 S) j < 2я ПрИ о < г < + оо. Щ
280 Ч. В. Модель с итеративной информацией
(См. также работу Кацевича и Вожьняковского [77], в
которой обсуждается вопрос о максимальном порядке информации
для многоточечных итераций.)
П. СРАВНЕНИЕ РЕЗУЛЬТАТОВ ДЛЯ ОБЩЕЙ
И ИТЕРАТИВНОЙ ИНФОРМАЦИОННЫХ МОДЕЛЕЙ
Для удобства читателя сравним некоторые результаты для
общей информационной модели (ч. А) и итеративной
информационной моделью (ч. В). Эти результаты представлены в табл.
В.2 и В.З.
Таблица В.2
Модель с итеративной информацией
|р(9К, S) = 0 p№,S) = \ 1 < р (% S)< oo
, 5)
сотр C?, 5, е)
> О О О О
не опр. ~ log A/е) *> ~ log log A/e) x> const
Таблица В.З
Модель с общей информацией (ч. А)
(SR, S)=0 0<г(ОД
РОЙ. 5)
сотр (ЗД, 5, 8)
оо О О
const «любая» монотонно не опр.
возр. функция
и См. C.14).— /7/?ши. перев.
В каждой из таблиц указана асимптотическая зависимость
comp (9t, S, б) от 8. Если задачу нельзя решить с точностью е,
то мы говорим, что сложность не определена. В модели с
итеративной информацией основным фактором является порядок
информации p($lt S). Так, если p(9t, S) = 0, то диаметр
информации положителен и сложность не определена. В общей
информационной модели основным фактором является радиус
информации /-(ЭД, S). Так, если г (91, 5) — 0, то порядок бесконечен и
сложность не зависит от е.
В ч. А порядок информации определен не был. Однако,
считая, что в ч. А 91(/, х) не зависит от х, можно использовать
определение ч. В. При этом порядок информации оказывается
равным либо нулю, либо бесконечности.
ДОБАВЛЕНИЕ
Обсудим связь между определенными формулами B.21) и (9.20)
порядком р(ф) алгоритма ф и «классическим» определением
порядка, которое можно сформулировать следующим образом.
Пусть р0У ,.., рг — вещественные числа, удовлетворяющие
Добавление 28!
условиям Pi = 0 или ^1 и <7 = 2'=оР/> 1- Предположим, что ср
использует информационный оператор 9'?(/, лг0, ..., хг) для
/€30. Предположим также, что для каждого /?30 и для
а = S (/) существуют Г (/) > 0 и с (/) < + °° > такие что
(Д.1) |]ср(х0, ..., хг, 9t(/, х0, ..., хг))—а||<
при всех |*0—а||<К — аЦ<. ..<||хг—а|<Г(/).
Допустим, что неравенство (Д.1) точное, т. е. существуем
такое /0€30> что
(Д.2) |)ф(х0, ..., х„ Ш(х0, ...,*„ h))-*\>
>Со tfo)II^о-аоM^i-aoIh • • .1^-а01^
при |]хо-ао||<...<[|л:г-ао||<Г(/о), где ao = S(/o), со(/о) > 04
Единственный положительный нуль р многочлена /r+1 —
— (ро/г+ ... +рг) и называется ^«классическим» порядком ф (см.,
например, Трауб [64]). Заметим, что если г = 0, т. е. если
Щ—информационный оператор без памяти, то р = р0.
Легко проверить, что если
(Д.з) *(/)Г(я«-1<1
и все начальные приближения х0У xif ..., ^удовлетворяю?
условию
(Д.4) ^-||^-а||<Г(/), / = 0, 1, ..., г,
то гф порождает последовательность {х(\, Xi = ^(xh **., ximmr,
ffi(f, xi9 ..., Xi^j)) при t^r+1, обладающую свойствами
(Д. 5) limx/ea,
(Д.6) е.= О(?р'*) при некотором ^< 1.
Число Г (/) можно интерпретировать как радиус шара
сходимости, так как ф сходится при всех начальных приближениях
из шара J*={x: \\x—а|КГ(/)}. Число c(f) можно
интерпретировать как «асимптотическую константу», для которой
Мы готовы к тому, чтобы доказать следующую лемму.
Лемма ДЛ. Пусть 9f—сходящаяся информация.
Предположим, что выполнены условия (Д.1), (Д.2) и, кроме того,
(Д.8) Го= lim Г (f(x0, xi9 ..., xr)) > О,
дг0, • . ., хг -*¦ ос
(Д.9) со= lim c(f(xOf ..*> xr))< + oo
х0 xr ->¦ a
для всех /?30 и всех /€^(/)- Тогда р(у) = р. |
Ч. В. Модель с итеративной информацией
Доказательство. Так как 9? сходится, то для каждого
/€^(/) элемент a = S(/(#0, хг, ..., хг)) стремится к a = S (/) при
стремлении jt0, ;q, ..., хг к а. Из (Д.8) вытекает, что
||*, — а||<Г(/(х0, ..., хг)), i = 0, 1, ..., г,
при достаточно малом тахо<*<г||*/— а|. Это значит, что
х0, ..., хг можно рассматривать как приближения к а и а. Пусть
* = ф(*о> -.-, хг> ^(А *о> •••> */•))• Ввиду (Д.1),
;р0( Г))П»/Г
Выберем такое /, что ру ^ 1. Так как 2?-оР/ > 1, а с (f (х0,..., л:г))
ограничено в силу (Д.9), то (Д.10) можно переписать в виде
Следовательно, ||а—ос|| = о (|]лгу- — а|). Отсюда и из (Д.10)
получаем, что
Этим доказано, что (pOi рЛ, ..., рг)?В (см. (9.19)) и, значит,
<()
//()
Положим /(л:„, ..., xr) — f0, где /0 удовлетворяет неравенству
(Д.2). Пусть (ftt qu ..., qr)?B. Тогда
lim Дф(^о, ». •> *n ЭД(/о» ^o> >-»» ^r))—«II ^о Vn >0
*.-аИ<...<11*г-а||-*0 fl JC0—обЯ^-П.... .И^ — об^-^
Из (Д.2) легко следует, что
q9 + 4i+ • • • +4i<Po + Pi+ • • - + Pi Для i«0, 1, ..., г.
Ha основании леммы 9.1 заключаем, что /6@, р]у где /г+1=:
=ft//"+ ... +qr. Так как (qQ, ..., #г) — произвольный элемент
из б, то /?(ф) = / (В) ^р. Следовательно, р(ф) = р. |
Соотношения (Д.8) и (Д.9) показывают, что радиус T(f(xOi...
..., л:,.)) ограничен снизу, грубо говоря, величиной Го > 0, а
асимптотическая константа c(f(x0, ..., хг)) ограничена сверху,
грубо говоря, величиной ?0< + °°- Условия (Д.8) и (Д.9)
выполняются для всех алгоритмов, представляющих практический
интерес, поскольку Г(/(д:0, ..., хг)) и c(f(x01 ..., хг))
непрерывны по х09 ..., хг и Г0 = Г(/(а, ..., а))>0, со = с(/(а, ...
..., а))< + сю. Поэтому на практике во всех случаях «новое»
определение порядка совпадает с «классическим»: р(ц)) = р.
Часть С
Краткий
исторический очерк
и аннотированная
библиография
1. ВВЕДЕНИЕ
Основное место в этой части занимает аннотированная
библиография, включающая в себя свыше 300 статей и монографий
по теории оптимальных алгоритмов и аналитической сложности
и охватывающая работы как восточноевропейских, так и
западных авторов. Кроме того, кратко излагается история предмета.
Каждая статья в библиографии состоит из библиографического
описания работы, перечня ключевых слов и краткой аннотации.
Для сохранения разумных размеров библиографии мы
ограничились почти исключительно работами, которые относятся к
основной тематике монографии. Для таких работ в перечень
ключевых слов входит сокращение «ОТ» (основная тематика)г). В
библиографию включено небольшое число особенно близких к нашему
предмету чисто математических работ; они отмечены ключевым
словом «математика». Даже среди работ по основной тематике
мы выбирали лишь самые, на наш взгляд, важные, что иногда
ставило нас перед необходимостью принимать трудные решения.
Как правило, в библиографию включались работы, где
изучаются задачи, которые можно решить только приближенно, и
не включались работы, относящиеся к задачам, в которых
приближенные методы связаны g желанием повысить эффективность
отыскания решения. Так, в нее не попали работы, посвященные
итеративному решению больших линейных систем и
приближенному решению трудных (например, NP-полных) комбинаторных
задач; по каждой из этих тем имеется своя обширная литера-
В) В оригинале core (сердцевина).— Прим, ред.
284 Ч. С. Краткий исторический очерк и аннотированная библиография
тура. Не включены также в библиографию многочисленные
работы по исследованию различных конкретных алгоритмов, в
частности касающиеся вопросов сходимости, порядка и т. п. для
итерационных алгоритмов решения нелинейных уравнений,
поскольку в таких работах нет речи об анализе оптимальности. По
большей части отсутствуют в библиографии и работы*, где
развиваются чисто математические теории, пусть даже и связанные
с нашим предметом, например теории аппроксимации,
дифференциальных уравнений и итерационных методов.
В некоторых случаях мы предпочли в аннотациях
использовать не терминологию авторов, а недавно введенные обобщающие
понятия и термины. Употребляются, скажем, такие слова, как
информация и индекс сложности.
В литературе имеется много разных определений
оптимальности. Часто оптимальный алгоритм определяется как алгоритм с
минимальной погрешностью в каком-то ограниченном классе
алгоритмов, например в классе линейных алгоритмов. Если автор
понимает оптимальность алгоритмов в каком-либо ограниченном
смысле, то в списке ключевых слов и в аннотации используется
термин «оптимальный алгоритм». Если речь идет об алгоритме,
обладающем минимальной погрешностью в классе всех
алгоритмов, использующих одну и ту же информацию, то он называется
«оптимальным по точности алгоритмом».
Многие авторы формулируют свои результаты, фиксируя п,
которое мы называем «кардинальностью информации», и
отыскивая погрешность 8 как функцию от п. Такие результаты можно
было бы автоматически переформулировать, записав
кардинальность и сложность как функции от е. Мы, однако, обычно
следуем формулировкам авторов.
Для работ на русском и польском языках, не переведенных
на английский, мы даем заголовки на английском языке1]. Для
переведенных работ даны ссылки как на оригинал, так и на
перевод^, и используется заголовок, данный переводчиком на
английский. Если для непереведенной работы в журнале был дан
перевод заголовка, то он и использовался.
Так как теория оптимальных алгоритмов и аналитической
сложности быстро развивается, мы имеем в виду периодически
обновлять данную библиографию. Работы по этому предмету
многочисленны и по причине широкой его прикладной
направленности разбросаны по множеству периодических изданий. Мы
убедительно просим читателей указать нам на важные работы,
которые мы, быть может, пропустили.
*> В настоящем переводе для русских работ восстановлены оригинальные
названия и ссылки на английский перевод опущены.— Прим% ред.
2. Краткий исторический очерк 285
2. КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
В теории оптимальных алгоритмов и аналитической
сложности имеются два основных направления, впервые объединенные
в данной монографии. Одно из них, изучающее по нашей
терминологии общую информацию, берет начало в работах Кифера,
Сарда и Никольского, написанных около 1950 г. Начало другому
направлению, изучающему итеративную информацию, положил
Трауб в 1961 г. Укажем лишь некоторые основные достижения
для каждого из этих двух направлений. Более полные сведения
по истории вопроса читатель может почерпнуть из
аннотированной библиографии.
Начнем со случая общей информации.
Кифер [53] показал, что если используются значения
функции, то метод Фибоначчи является оптимальным методом поиска
максимума унимодальной функции. Профессор Кифер сообщил
нам, что этот результат был получен им еще в 1948 г. в
диссертации на степень магистра в Массачусетском технологическом
институте, но опубликован лишь позднее по инициативе
Дж. Вольфовица.
Сард [49] исследовал оптимальные алгоритмы для квадратур,
использующих значения функции в фиксированных точках, и
рассмотрел вопрос о возможности распространения своих
результатов на случай линейных функционалов. Та же задача
независимо была поставлена Никольским [50], при этом допускалась
возможность оптимального выбора узлов интегрирования. Сард и
Никольский ограничивались рассмотрением линейных
функционалов. Смоляк в своей диссертации [65] доказал, что для любого
линейного функционала, заданного на уравновешенном выпуклом
множестве, и любого информационного оператора, образованного
из п линейных функционалов, существует линейный
оптимальный по точности алгоритм. Поэтому линейные алгоритмы,
оптимальные в смысле Сарда или Никольского, оптимальны по
точности, при условии что множество элементов задачи
уравновешенно и выпукло.
Голомб и Вайнбергер [59] впервые подвергли систематическому
изучению оптимальные по точности алгоритмы аппроксимации
линейного функционала с информацией, состоящей из значений п
линейных функционалов.
Для многих задач оптимальные по точности алгоритмы
основываются на интерполяционных сплайнах. Шёнберг [64] первым
выявил тесную связь между сплайнами и оптимальными
алгоритмами в смысле Сарда.
Виноград [76] рассматривал вопрос об использовании в
теории аналитической сложности для получения оценок снизу
рассуждений, сходных с принципом соперничества.
286 Ч. С. Краткий исторический очерк и аннотированная библиография
Миккелли и Ривлин [77] изучали оптимальные алгоритмы
для линейных задач при использовании линейной информации.
Трауб и Вожьняковский [77] положили в основу понятие
информации. В их модели допускается рассмотрение линейных и
нелинейных задач и информации. Они ввели в общей постановке
понятие радиуса (диаметра) информации и использовали его для
получения чрезвычайно мощного принципа соперничества. Этим
было инициировано изучение в общей постановке оценок снизу
на сложность. Было введено понятие центрального алгоритма.
Некоторые из указанных выше понятий в неявном виде
использовались для конкретных случаев в ряде более ранних работ.
Одна из основных проблем в теорий аналитической сложности
заключается в отыскании для данной задачи наиболее подходя-
щей информации. Эта проблема для конкретных задач была
впервые изучена Никольским [50] и Кифером [53]. Идея
варьирования информационного оператора, ведущая к понятию
оптимального информационного оператора, принадлежит Траубу и
Вожьняковскому [77].
Начало развитию второго из двух основных направлений
исследований по аналитической сложности, посвященного
итеративной информации и итерационным алгоритмам, положили
работы Трауба [61, 64]. В них была дана классификация
итерационных алгоритмов по используемой ими информации. Были
доказаны теоремы и предложены гипотезы о максимальном
порядке итерационных алгоритмов решения скалярных нелинейных
уравнений. Такие результаты о максимальном порядке нужны
для получения оценок снизу на сложность. Термин
«аналитическая вычислительная сложность» был введен в статье Трауба [72],
хотя эта работа, собственно говоря, относится к подразделу
теории аналитической сложности, который сейчас получил
название «теория итеративной вычислительной сложности».
Брент, Виноград и Вулф [73], применяя рассуждения,
сходные с принципом соперничества, получили теоремы о
максимальном порядке в случае класса нестационарных одноточечных
итераций с памятью, использующих стандартную информацию
для решения скалярных нелинейных уравнений. Вожьняковский
[75] ввел понятие порядка информации, явившееся мощным
инструментом для вычисления максимального порядка в случае
абстрактного пространства. Он показал, что максимальный
порядок в данном классе алгоритмов зависит только от
используемой алгоритмом информации и не зависит от структуры самого
алгоритма.
Трауб и Вожьняковский [76] поставили новый вопрос: какая
информация в наибольшей степени подходит для решения данной
задачи? Полный ответ на него был получен для одноточечных
итераций при использовании линейной информации.
3. Аннотированная библиография 28?
Трауб и Вожьняковский [78] предложили мощный принцип
соперничества для установления оценок снизу на сложность в
итеративной информационной модели.
В своих двух объемистых отчетах [77, 78] Трауб и
Вожьняковский впервые объединили вместе оба направления теории
аналитической сложности, заключив их в рамки единой
абстрактной постановки и заметив, что принципиальное различие этих
направлений состоит в том, что в одном случае используется
общая информация, а в другом—итеративная. Материалы этих
отчетов вошли составной частью в настоящую монографию.
3. АННОТИРОВАННАЯ БИБЛИОГРАФИЯ *>
Адамский, Корытовский, Митковский (Adamski A., Korytowski A., Mitkowski W.)
A conception of optimality for algoritms and its application to the optimal
search for a minimum, Zastos. Mat. 14 A977), 499—509.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы
Рассматривается понятие «сильно» оптимальных алгоритмов. Это понятие
анализируется на примере задачи поиска минимума унимодальной или выпуклой
скалярной функций. Информация — значения функции / в п точках. Имеется
связь с результатами Кифера [53].
Айхьхорн (Eichhorn В. Н.) On sequential search, "Selected Statistical Papers",
Vol. 1, pp. 81—95. Math. Centrum, Amsterdam, 1968.
ОТ, экстремум, нелинейные уравнения, одна переменная, оптимальные алгоритмы,
анализ среднего случая
Для класса скалярных унимодальных функций и класса невозрастающих
функций с одним нулем рассматриваются соответственно задачи поиска
максимума или нуля. Информация — значения функций / в адаптивно выбираемых
точках. Обсуждаются оптимальные алгоритмы в наихудшем и среднем случаях.
Аксень М. Б., Турецкий А. X, О наилучших квадратурных формулах для
некоторых классов функций, ДАН СССР, 1966, 166, № 5, с. 1019—1021.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Для класса скалярных функций с ограниченной в Lq производной порядка г
рассматривается задача интегрирования. Информация — значения /,/', ...,/(/*~2>
в т точках. При четных г найдена погрешность оптимальных линейных
алгоритмов с оптимально выбранными точками информации.
Алберг, Нильсон Э. (Ahlberg J. H., Nilson E. N.) The approximation of linear
functional, SIAM J. Nurner. Anal, 3 A966), 173—182.
ОТ, аппроксимация линейных функционалов
Рассматривается задача аппроксимации линейного функционала L для класса
скалярных функций /, таких что f{n)?L2. Информация—значения функции /
и ее производных. Показано, что значение L на интерполяционном сплайне
минимизирует погрешность определенного вида.
Алберг, Нильсон, Уолш (Ahlberg J. H., Nilson E. N., Walsh J. L.)
Теория сплайнов и ее приложения.—М.: Мир, 1972 A967).
математика и ОТ, сплайны
*> Для переводных книг в круглых скобках указан год оригинального изда*
ния.— Прим. ред.
288 Ч. С. Краткий исторический очерк и аннотированная библиография
Рассматривается теория сплайнов и ее приложения ко многим задачам
численного анализа. Изучаются свойства оптимальности сплайнов. Указаны
взаимосвязи между сплайнами и оптимальной аппроксимацией в смысле Сарда.
Алхимова В. М. Наилучшие квадратурные формулы с равноотстоящими узлами,
ДАН СССР, 1972, 204, № 2, с. 263—266.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Для некоторых классов скалярных функций с ограниченной в Lq
производной порядка г рассматривается задача интегрирования.
Информация—значения /. Найдены оптимальные квадратурные формулы с равноотстоящими узлами
и их погрешность.
Арестов В. В. О наилучшем приближении операторов дифференцирования,
Мат. заметки, 1967, 1, № 2, с. 149—154.
ОТ, дифференцирование, оптимальная аппроксимация ограниченными линейными
операторами
Продолжение работы Стечкина [67]. Рассматривается задача
аппроксимации f{k) для класса скалярных функций с ограниченной в Lx или в С
производной /г-го порядка, 0 < k < п, с помощью линейного оператора ср, норма
которого ограничена заданной константой. Показано, что при малых п почти
оптимальный оператор <р требует вычисления небольшого числа значений /.
Арестов В. В. О наилучшем равномерном приближении операторов
дифференцирования, Мат. заметки, 1969, 5, № 3, с. 273—284.
ОТ, дифференцирование, оптимальная аппроксимация ограниченными линейными
операторами
Продолжение работы Арестов [67]. Изучаются существование и
единственность оптимальных линейных операторов для аппроксимации /(Л).
Афанасьев А. Ю. О поиске минимума функции с ограниченной второй
производной, ЖВМ и МФ, 1974, 14, № 4, с. 1018—1021.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы
Для класса скалярных функций /, у которых значения второй
производной принадлежат [a, b], a > 0, рассматривается задача поиска минимума.
Информация— значения / в двух точках. Найдены интервал, которому принадлежит
минимум /, и точки оптимальной информации.
Афанасьев А. Юм Новиков В. А. О поиске минимума функции с ограниченной
третьей производной, ЖВМ и МФ, 1977, 17, № 4, с. 1031—1034.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы
Рассматривается задача поиска минимума для класса скалярных
унимодальных функций, у которых значения третьей производной лежат в заданном
интервале. Информация —значения / в трех точках. Предложен алгоритм, который
отыскивает интервал, содержащий точку минимума.
Бабенко В. Ф. Асимптотически точная оценка остатка наилучших для
некоторых классов функций кубатурных формул, Мат. заметки, 1976, 19, № 3,
с. 313—322.
ОТ, интегрирование, несколько переменных, оценки асимптотики погрешности
Рассматриваются кубатурные формулы для класса скалярных функций
нескольких переменных с ограниченным модулем непрерывности. Информация —
значения / в п точках. Найдена асимптотика при п погрешности оптимальной
квадратурной формулы.
Бабушка (Babuska I.) Problems of optimization and numerical stability in
computations, ApU Mai. 1 A968), 3—26.
3. Аннотированная библиография 289
ОТ, интегрирование, одна переменная, оптимальные алгоритмы, устойчивость
вычислений
Это доклад, представленный на конференции «Основные проблемы
вычислительной математики» в Либлице в 1967 г. Среди прочих рассматривается задача
интегрирования для класса периодических функций. Информация —значения /.
Изучаются оптимальные точки информации и оптимальные алгоритмы. См. также:
Babuska I., Uber universal optimale quadraturformeln, Apl. Mat. 4 A968),
305—338; 5 A968), 388—404.
Бабушка, Соболев С. Л. (Babuska I.) Оптимизация численных методов, ApU
Mat., 1965, 10, № 2, с. 96—130.
ОТ, обзор по оптимальным алгоритмам
Рассматриваются оптимальные вычислительные алгоритмы решения
алгебраических и аналитических задач. Изучаются оптимальные или асимптотически
оптимальные по точности алгоритмы аппроксимации линейных функционалов
и решения линейных операторных уравнений при условии абсолютной
непрерывности обратных операторов. Устанавливаются взаимосвязи с д-поперечни-
ками по Колмогорову и энтропией. Хорошая библиография.
Барнхилл (Barnhill R. E.) Optimal quadratures in L2 (Er). I and II, SI AM J9
Numer. Anal. 4 A967), 390—397, 534—541.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций, ограниченных константой на эллипсе ?g с фокусами ±1,
полуосями а, Ь и ? = (а+6J. Информация — значения/. Найдены оптимальные
алгоритмы.
Барнхилл (Barnhill R. E.) Asymptotic properties of minimum norm and optimal
quadratures, Numer. Math. 12 A968), 384—393.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
линейные алгоритмы, квадратура Гаусса
Рассматривается задача интегрирования для класса скалярных
аналитических функций на эллипсе ?g с фокусами ±1, полуосями a, b и ?,= (а-\-ЬJ. -
Информация — значения /. Изучаются асимптотические свойства оптимальных
квадратурных формул. Показано, что веса и узлы оптимальной квадратуры
стремятся при ?—^+°° к весам и узлам квадратуры Гаусса.
Барнхилл, У иксом (Barnhill R. E., Wixom J. A.) Quadratures with remainders
of minimum norm. I and II, Math, Сотр., 21 A967), 66—75, 382—387.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
точки информации, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций на эллипсе Е^ с фокусами ±1, полуосями а, Ь и?=(а+6J.
Информация — значения /. Обсуждается вопрос об оптимальных квадратурных
формулах при фиксированных и нефиксированных точках информации.
Барнхилл, Уиксом (Barnhill R. E., Wixom J. A.) An error analysis for
interpolation on analytic functions, SI AM J. Numer. Anal., 5 A968), 522—528.
ОТ, интерполяция, аналитические функции, одна переменная, оптимальные
линейные алгоритмы
Рассматривается задача интерполяции для класса скалярных
аналитических функций, определенных на эллипсе Е^ с фокусами ±1, полуосями
a, b и ? — (я + ЬJ• Информация —значения /. Изучаются линейные
оптимальные алгоритмы. Рассматриваются асимптотические свойства оптимальных весов
при ? —>+ °°-
10 № 364
290 Ч. С. Краткий исторический очерк и аннотированная библиография
Баррар, Лоуб, Вернер (Barrar R. В., Loeb H. L., Werner M.) On the existence
of optimal formulas for analytic functions, Numer. Math. 23 A974), 105—117.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Для класса аналитических функций рассматривается задача
интегрирования. Информация —значения функции / и ее производных. Доказано
существование ве'сов и узлов квадратурной формулы, минимизирующих погрешность
определенного типа.
Батчер (Butcher J. С.) On Runge — Kutta processes of high order, J. Austral.
Math. Soc. 4 A964), 179—194.
ОТ, < дифференциальные уравнения, методы Рунге — Кутты, максимальный
порядок
Рассматривается решение задачи yr =f (х, у), у(х0)=уо методами Рунге —
Кутты. Информация —значения / в «адаптивно выбираемых точках. Изучается
вопрос о максимальном порядке р (п) таких методов. При п = 5 найден
максимальный порядок, а при п — 6 улучшены оценки.
Батчер (Butcher J. С.) On the attainable order of Runge — Kutta methods, Math.
Сотр. 19 A965), 408—417.
ОТ, дифференциальные уравнения, методы Рунге — Кутты, максимальный
порядок
Продолжение статьи Батчер [64]. Найден максимальный порядок при
п<9и оценка р(п)<п—2 при л^10.
Батчер (Butcher J. С.) An order for Runge — Kutta methods, SI AM J. Numer,
Anal. 12 A975), 304—315.
ОТ, дифференциальные уравнения, методы Рунге — Кутты, максимальный
порядок
Продолжение статьи Батчер [65]. Доказано, что при л<;р + & не
существует явного метода Рунге — Кутты, использующего п вычислений / и
имеющего порядок p^uk, где щ — Ъ, un+i — (^un-\-2n-\-3)/3.
Бахвалов Н. С. О приближенном вычислении кратных интегралов, Вестник
Моск. ун-та, сер. мат., мех., ,.., 1959, № 4, с. 3—18.
ОТ, интегрирование, несколько переменных, оптимальные линейные алгоритмы,
оценки снизу
Рассматривается задача интегрирования для класса скалярных функций s
переменных с ограниченными производными порядка ниже р и р-й производной,
удовлетворяющей условию Гёльдера с показателем К. Информация — значе*
ния /. Показано, что оценка снизу погрешности любой квадратурной формулы
с п узлами имеет порядок ai-(p+^/s. Оценка снизу математического ожидания
погрешности имеет порядок /i-<P+*)/s-o.6t Показано, что оценки точны.
Бахвалов Н. С. Оценка в среднем остаточного члена квадратурных формул,
ЖВМ и МФ, 1961, 1, № 1, с. 64—77.
ОТ, интегрирование, несколько переменных, анализ среднего случая
Продолжение статьи Бахвалов [59]. Для тех же классов функций найдено
математическое ожидание погрешности для квадратурных формул со случайно
выбираемыми узлами.
Бахвалов Н. С. Об оптимальных способах задания информации при решении
дифференциальных уравнений, ЖВМ и МФ, 1962, 2, № 4, с. 569—592.
ОТ, дифференциальные уравнения, энтропия, л-поперечники
Рассматривается дифференциальное уравнение щ = Р (t, x, и), где u~u{t, x)t
Р — заданный оператор, а и @, х) принадлежит заданному классу функций.
Информация—значения и @, х). Изучается задача о минимальном числе вычис*
лений функции и @, х), необходимом для аппроксимации и if}x) с точностью 8.
3. Аннотированная библиография 291
Показано, что эта задача связана с е-энтропией. Рассматривается также задача
аппроксимации функции по п ее значениям с помощью алгоритма, область
значений которого имеет размерность п. Установлены взаимосвязи с
«-поперечниками по Колмогорову
Бахвалов Н. С. Об оценке количества вычислительной работы, необходимой
при приближенном решении задач.— Дополнение IV в кн.: Годунов С. К.»
Рябенький В. С. Введение в теорию разностных схем.— М.: Физматгиз,
1962, с. 316—329.
ОТ, интегрирование, несколько переменных, дифференциальные уравнения,
оценки снизу и сверху
Рассматривается сложность интегрирования функций нескольких
переменных и сложность некоторых типов дифференциальных уравнений Получены
оценки на сложность снизу и сверху.
Бахвалов Н. С. Оптимальные свойства формул численного интегрирования
Адамса и Грегори.—В кн.: Вопросы вычислительной математики и
вычислительной техники. Под. ред. Люстерника Л. А.— М.: Машгиз, 1963, с. 9—26.
ОТ, интегрирование, одна переменная, дифференциальные уравнения,
оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной г-н производной. Информация—значения функции/и ее
производных в равноотстоящих точках. Показано, что формулы Эйлера и Грегори близки
к оптимальным. Для некоторого класса функций / рассмотрены также
обыкновенные дифференциальные уравнения у' —f (лс, у), доказана асимптотическая
оптимальность формулы Адамса.
Бахвалов Н. С. Об оптимальных оценках скорости сходимости квадратурных
процессов и методов интегрирования типа Монте-Карло на классах
функций.— В кн.: Численные методы решения дифференциальных и
интегральных уравнений и квадратурные формулы.—М.: Наука, 1964, с. 5—63.
ОТ, интегрирование, несколько переменных, асимптотически оптимальные ал
горитмы, оценки снизу
Задача интегрирования рассматривается для многих классов скалярных
функций нескольких переменных. Информация — значения / в п точках.
Представлены линейные алгоритмы, погрешность которых отличается от
оптимальной не более чем в lnV n раз при некотором положительном у.
Бахвалов Н. С. Об оптимальной скорости интегрирования аналитических
функций, ЖВМ и МФ, 1967, 7, № 5, с. 1011 — 1020.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
алгоритмы
Рассматривается задача интегрирования для класса аналитических
скалярных функций, ограниченных константой на эллипсе с фокусами ± 1 и
суммой полуосей, равной заданному с. Информация —значения / и /' в п
точках. Доказана асимптотическая оптимальность квадратуры Гаусса.
Оптимальная погрешность равна приблизительно с~2п.
Бахвалов Н. С. Об оптимальных методах решения задач, ApL Mat.t I A968),
27—38.
ОТ, обзор по оптимальным алгоритмам
Это доклад, представленный на конференции «Основные проблемы
вычислительной математики» в Либлицев 1967 г. Сделан обзор советской
литературы по оптимальному решению многих вычислительных задач.
Бахвалов Н. С. О свойствах оптимальных методов решения задач
математической физики. ЖВМ и МФ, 1970, 10, № 3, с. 555 — 568.
10*
292 Ч. С. Краткий исторический очерк и аннотированная библиография
ОТ, интегрирование, несколько переменных, дифференциальные уравнения,
оценки снизу
Рассматриваются оптимальные методы решения задач математической
физики. Информация — значения / в п точках. Для многомерного интегрирования
и параболических дифференциальных уравнений изучается вопрос о
минимальном числе вычислений значений функции, позволяющем решить задачу
с точностью е. Для параболических дифференциальных уравнений предложен
асимптотически оптимальный алгоритм с линейной комбинаторной сложностью.
Бахвалов Н. С. Об оптимальности линейных методов приближения операторов
на выпуклых классах функций, ЖВМ и МФ, 1971, № 11, № 4,
с. 1014—1018.
ОТ, аппроксимация линейных функционалов, оптимальные линейные
алгоритмы
Рассматривается задача аппроксимации линейных функционалов на
выпуклом уравновешенном классе. Информация — значения п линейных
функционалов. Приводится лемма Смоляка, утверждающая, что существует линейный
оптимальный по точности алгоритм. Сделаны некоторые обобщения на случай
аппроксимации линейных операторов.
Бахвалов Н. С. Об оптимизации методов решения обыкновенных
дифференциальных уравнений с сильно осциллирующими решениями, ЖВМ и МФ,
1971, 11, № 5, с. 1318 — 1322.
ОТ, дифференциальные уравнения, оценки снизу
Для класса функций /, таких что а(х)^а0 > 0, |/(*> (х) | ^ Л, * = 0, 1, ...
. . ., m, V*?[0, 1], и | jju/ @) | <; ?0 при малом положительном \х
рассматривается уравнение \12у" + а(х) y=f (х). Информация —значения а и/. Показано,
что оценка снизу погрешности любого алгоритма, использующего п значений
а, есть D1min(l, 1/(алм))- При m=l, 2 оценка точна по порядку.
Бахвалов Н. С. Оценки снизу асимптотических характеристик классов
функций с доминирующей смешанной производной, Мат. заметки, 1972, 12,
№ 6, с. 655—664.
ОТ, интегрирование, интерполяция, периодические функции, несколько
переменных, оценки снизу
Рассматриваются задачи интегрирования и интерполяции для класса
скалярных периодических функций нескольких переменных с ограниченной
производной. Информация — значения функции/ и ее производных. С помощью
нового представления указанного класса функций получены оценки снизу на
погрешность интегрирования и интерполяции и оценка снизу на е-энтропию.
Бимер, Уайлд (Beamer J. H., Wilde D. J.) Time delay in minimax
optimization of unimodal functions of one variable, Management Sci., 15 A969),
528-538.
ОТ, экстремум, одна переменная, оптимальные алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация —значения f. В двух случаях получены
оптимальные алгоритмы. В первом случае очередное значение функции
вычисляется перед тем, как становится известным результат предыдущего вычисления.
Во втором очередное вычисление производится перед тем, как становятся
известными результаты двух предшествующих.
Бимер, Уайлд (Beamer J. H., Wilde D. J) Minimax optimization of unimodal
functions by variable block search, Management Sci. 16 A970), 529 — 541.
ОТ, экстремум, одна переменная, оптимальные алгоритмы
3. Аннотированная библиография 293
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация — значения /. Изучаются оптимальные
алгоритмы, основанные на одновременном вычислении значений функции.
Бимер, Уайлд (Beamer J. H., Wilde D. J.) Minimax optimization of a unimo-
dal function by variable block derivative search with time delay, J. Comb.
Theory 10 A971), 160 — 173.
ОТ, экстремум, одна переменная, оптимальные алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация — значения первой производной функции /.
Алгоритмы поиска максимума используют последовательность блоков
одновременных вычислений значений /'. Найдены оптимальные по точности
алгоритмы. Дается метод оптимизации числа вычислений в блоке,
Бодэ (Baudet G. M.) Asynchronous iterative methods for multiprocessors,
J. Assoc. Comput. Mack. 25 A978), 226 — 244.
ОТ, нелинейные уравнения, несколько переменных, итерационные алгоритмы,
асинхронность
Вводится и анализируется некоторый общий класс асинхронных
итерационных методов. Установлены общие теоремы сходимости и получены оценки
на сложность. Представлены экспериментальные результаты для некоторых
задач, показывающие, что «чисто асинхронные» итерационные методы
являются наилучшими.
Бородин, Манроу (Borodin A., Munro I.) "The Computational Complexity of
Algebraic and Numeric Problems", American Elsevier, New York, 1975.
ОТ, алгебраические числа, оптимальные итерации, алгебраическая сложность,
итеративная сложность, максимальный порядок
Руководство по теории алгебраической сложности. Включает главу по
параллельным вычислениям. Особенно тесно связана с теорией аналитической
сложности глава «Сложность рациональных итераций», где излагается теория
Пэтерсона —Кунга, посвященная сложности итераций, с помощью которых
аппроксимируются алгебраические числа. См. также работы Пэтерсона [72] и
Кунга [72, 73].
Боянов (Bojanov В. D.) Оптимальная скорость интегрирования и е-энтропия
одного класса аналитических функций, Мат. заметки, 1973, 14, № 1,
с. 3-10.
ОТ, интегрирование, аналитические функции, одна переменная, оценки снизу
См. Боянов [74]. Найдена е-энтропия класса аналитических функций.
Боянов (Bojanov В. D.) Best quadrature formula for a certain class of
analytical functions, Zastos. Mat. 14 A974), 441—447.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
линейные алгоритмы, оценки снизу
Рассматриваются оптимальные квадратурные формулы для класса
вещественных функций на [—1, 1], аналшически продолжаемых на единичный круг
и ограниченных на нем единицей. Информация — значения / и /; в п точках.
С помощью леммы Смоляка найдены линейные оптимальные по точности
алгоритмы и их погрешности. Для оптимальных узлов погрешность равна
приблизительно ехр (—я ]fn/2).
Боянов (Bojanov В. D.) Наилучшие методы интерполирования для некоторых
классов дифференцируемых функций, Мат. заметки, 1975, 17, № 4,
с. 511—524.
ОТ, интерполяция, одна переменная, оптимальные линейные алгоритмы
294 Ч. С. Краткий исторический очерк и аннотированная библиография
Рассматривается задача интерполяции для класса скалярных функций с
ограниченной в LQ производной порядка г. Информация — значения /, /', ...
. . ., /с-1* в п точках. Получен линейный оптимальный по точности алгоритм.
Показано, что это сплайн. Доказано, что точки оптимальной информации
являются равноотстоящими.
Эта работа является несколько расширенным вариантом статьи: Boja-
nov В. D., Optimal methods of interpolation in Win LQ(M\ a> b), Comptes
Rendus Acad. Bulg. ScL 17 A974), 85 — 888.
Боянов (Bojanov B. D.) Optimal methods of integration in the class of
different! able functions, Zastos. Mat. 15 A976), 105—115.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
оценки снизу
Рассматриваются оптимальные квадратурные формулы для класса г раз
кусочно непрерывно дифференцируемых функций с r-й производной, ограни*
ченной в Lq некоторой константой. Информация —значения /, /', .. ., f(r-i)
в п точках. С помощью леммы Смоляка найдены линейные оптимальные по
точности алгоритмы и их погрешности. Найдена погрешность при
оптимальных узлах интегрирования.
Боянов, Черногоров (Bojanov В. D., Chernogorov V. G.) An optimal
interpolation formula, J.Approx. Theory, 20 A977), 264—274.
ОТ, интерполяция, аппроксимация, одна переменная, оптимальные линейные
алгоритмы
Для заданного класса функций рассматривается задача аппроксимации
некоторого линейного функционала. Информация —значения п линейных
функционалов на функции /. Изучаются оптимальные по точности алгоритмы.
Найдены линейные оптимальные по точности алгоритмы для задач
интерполяции и аппроксимации в классе скалярных функций, вторая производная
которых ограничена в L^ некоторой константой.
Брент (Brent R. P.) The computational complexity of iterative methods for
systems of nonlinear equations, in "Coplexity of Computer Computations"
(R. E. Miller and J. W. Thatcher, eds.), pp. 61 — 71. Plenum Press,
New York, 1972.
ОТ, нелинейные уравнения, несколько переменных, итерации с памятью,
индекс сложности, максимальный порядок
Сравнивается сложность некоторых классов алгоритмов для решения
системы нелинейных уравнений / = 0. Информация — значения /. Среди
рассматриваемых классов алгоритмов — методы многомерной полиномиальной
интерполяции, а также два новых класса.
Брент (Brent R. Р.) "Algorithmic for Minimization without Derivatives",
Prentice-Hall, Englewood Cliffs, New Jersey, 1973. .
ОТ, нелинейные уравнения, экстремум, одна переменная, несколько
переменных, порядок
Ценная монография но алгоритмам и программам вычисления нулей и
экстремумов скалярных нелинейных функций и экстремумов нелинейных
функций, зависящих от нескольких переменных. Информация — значения
функции. Содержит много оригинального материала, Обсуждаются вопросы
оптимальности и сложности. Хорошая библиография.
Брент (Brent R. P.) Some efficient algorithms for solving systems of nonlinear
equations, SIAM J. Numer. Anul. 10 A973), 327—344.
ОТ, нелинейные уравнения, несколько переменных, итерационные алгоритмы,
метод секущих, итеративная сложность, индекс сложности, порядок
S. Аннотированная библиография 295
Рассматриваются итерационные алгоритмы решения системы нелинейных
уравнений / = 0. Информация — значения /. Вводятся два новых класса
алгоритмов и устанавливается локальная сходимость. Для этих алгоритмов
вычисляется индекс сложности и производится сравнение с известными
методами. Формулируется открытая проблема, связанная с оптимальным индексом
сложности.
Брент (Brent R. P.) Computer Solution of Nonlinear Equations. Lecture Notes,
Computer Science Dept., Stanford Univ. A975).
ОТ, нелинейные уравнения, одна переменная, несколько переменных,
одноточечные итерации, многоточечные итерации, итерации с памятью, итеративная
сложность
Лекционный курс объемом с приличную книгу. Содержит обзор теории
итерационных алгоритмов и итеративной сложности как для скалярных, так
и для векторных нелинейных уравнений. Хорошая библиография.
Брент (Brent R. P.) Some high-order zero-find ing methods using almost
orthogonal polynomials, /. Austral. Math. Soc. Ser. В 19 A975), 1—29.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
многоточечные итерации, индекс сложности
Рассматриваются итерационные алгоритмы вычисления нуля скалярной
нелинейной функции /. Информация—одно значение / и п значений /'. Для
установления сходимости получены результаты по ортогональным и «почти
ортогональным» многочленам. Обсуждается вопрос об индексе сложности
итерационных методов. Хорошая библиография.
Брент (Brent R. P) A class of optimal-order zero-finding methods using
derivative evaluations, in "Analytic Computational Complexity" (J. F. Traub, ed.),
pp. 59—73. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
многоточечные итерации, максимальный иорядок
Рассматриваются итерационные алгоритмы вычисления нуля скалярной
нелинейной функции /. Информация — одно значение fun значений/'. Точки,
в которых производятся вычисления, определяются с помощью некоторых
ортогональных или «почти ортогональных» многочленов. Полученные итерации
имеют максимальный порядок.
Пусть x'(t) = g{x). Предыдущие результаты используются для получения
явного нелинейного метода Рунге — Кутты порядка 2п—1, использующего п
вычислений значений g.
См. также Брент [75] (Some high-order zero-finding methods using almost
orthogonal polynomials).
Брент (Brent R. P.) Multiple-precision zero-finding methods and the complexity
of elementary function evaluation, in "Analytical Computational Complexity"
(J. F. Traub, ed.), pp. 151 — 176. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, формальные степенные ряды, одна переменная,
быстрые алгоритмы, многократная точность
Вводятся быстрые алгоритмы. Анализируется их сложность в задачах
вычисления некоторых чисел, функций, выполнения арифметических операций
с многократной точностью. Среди рассматриваемых операций —операции
вычисления обратных величин, квадратных корней, отыскание нулей, вычисление
элементарных трансцендентных функций и решение скалярных уравнений.
Приводятся быстрые алгоритмы для операций вычисления логарифма и возведения
в степень, рассматриваемых как операции с формальными степенными рядами.
Брент (Brent R. P.) Fast multiple-precision evaluation of elementary functions,
J. Assoc. Comput. Mach., 23 A976), 242—251,
296 Ч. С. Краткий исторический очерк и аннотированная библиография
ОТ, аппроксимация, одна переменная, многократная точность, быстрые
алгоритмы
Показано, что элементарные функции можно вычислять с относительной
погрешностью в B~й) за в (М (п) log я) операций, где М (я) —число операций
одинарной точности, необходимое для перемножения л-разрядных целых.
Среди частных случаев —вычисление констант, таких как я, е и еп.
Брент (Brent R. P.) The complexity of multiple-precision arithmetic, in
"Complexity of Computational Problem Solving" (R. Anderssen and R. P. Brent,
eds.), pp. 125—165. Univ. of Queensland Press, 1976.
ОТ, аппроксимация и нелинейные уравнения, одна переменная, многократная
точность, быстрые алгоритмы, оценки снизу, оценки сверху, итеративная
сложность
Изучаются вопросы сложности выполнения вычислений с многократной
точностью. Среди рассматриваемых вычислительных операций —арифметические
операции и вычисление элементарных функций. Получены оценки сверху и
некоторые оценки снизу. Для задачи вычисления нулей нелинейных
скалярных функций сравнивается сложность различных итерационных методов,
использующих арифметику с многократной точностью переменной длины.
Брент, Виноград, Вулф (Brent R. P., Winograd S., Wolfe P.) Optimal iterative
processes for root-finding, Numer. Math. 20 A973), 327—341.
ОТ, нелинейные уравнения, одна переменная, итерационные алгоритмы,
итерации с памятью, максимальный порядок
Рассматриваются локально сходящиеся одноточечные итерации с памятью
для вычисления нуля скалярной нелинейной функции /. Используемая в k-Pi
точке информация — значения /, /', ..., f{d) во всех предыдущих точках.
Доказано, что максимальный порядок любой такой итерации не превосходит
rf+2. Тем самым установлена справедливость гипотезы Трауба [64] по
крайней мере для итераций, использующих всю предыдущую информацию.
Брент, Кунг (Brent R. P., Kung Н. Т.) О ((N log NK/2) algorithms for
composition and reversion of power series, in "Analytic Computational Complexity"
(J. F. Traub, ed.), pp. 217—225. Academic Press, New York, 1976.
ОТ, подстановка, обращение, формальные степенные ряды, быстрые алгоритмы,
алгебраическая сложность
Первое сообщение о результате, сформулированном в заголовке.
Доказательство см. в работе Брент, Кунг [78] (Fast algorithms for manipulating
formal power series).
Брент, Кунг (Brent R. P., Kung H. T.) Fast algorithms for composition and
reversion of multivariate power series, Proc. Conf. Theoret. Comput. ScLt
pp. 149—158. Univ. of Waterloo, Waterloo, Canada, 1977.
ОТ, подстановка, обращение, формальные степенные ряды, несколько
переменных, быстрые алгоритмы, алгебраическая сложность
Результаты работы Брент, Кунг [78] обобщаются на многомерный случай.
Показано, что каждой задаче обращения степенного ряда можно сопоставить
задачу подстановки степенных рядов в том смысле, что если задача
подстановки допускает быстрое решение, то то же справедливо и для задачи
обращения. Для подстановки и обращения степенных рядов разработаны быстрые
алгоритмы с существенно меньшим количеством операций, чем у классических
методов. Улучшение растет с ростом числа переменных.
Брент, Кунг (Brent R. P., Kung H. Т.) Fast algorithms for manipulating
formal series, /. Assoc. Comput. Mach. 25 A978), 581—595.
ОТ, подстановка, обращение, дифференциальные уравнения, формальные сте*
пенные ряды, быстрые алгоритмы, алгебраическая сложность
3. Аннотированная библиография 297
Дан алгоритм для вычисления первых N членов подстановки одного
степенного ряда в другой за О ((N log NK/'2) операций. Показано, что сложности
подстановки и обращения асимптотически эквивалентны. Пусть MULT (N) —
минимальное число операций для вычисления первых N членов произведения
двух многочленов. Доказано, что первые N членов ряда, полученного в
результате обращения данного ряда, можно вычислить за О (MULT (N))
операций. Показано, что для многих типов дифференциальных уравнений первые
N членов разложения в степенной ряд решения .можно получить за
О (MULT (ЛО) операций.
Брент, Трауб (Brent R. P., Traub J. F.) On the complexity of composition and
generalized composition of power series, Computer Science Dept. Rep.,
Carnegie-Mellon Univ. A978). See also SIAM J. Comput. 9 A930), 54—66,
ОТ, подстановка, обобщенная подстановка, формальные степенные ряды,
быстрые алгоритмы, алгебраическая сложность
Пусть FW (х) есть ^-кратная подстановка формального степенного ряда.
Показано, что /^ (к) для произвольного q можно определить часто, но не
всегда. Даны быстрые алгоритмы и оценки сложности вычисления первых
N членов /W (х) в случае, когда этот ряд определен. Если q—целое, то
быстрые алгоритмы уменьшают сложность в log2 q раз по сравнению с
алгоритмом «многократного возведения в квадрат».
Бусарова Т. Н. Наилучшие квадратурные формулы для одного класса
дифференцируемых периодических функций, Укр. машем, ж., 1973, 25, № 3,
с. 291-301.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных
периодических функций с ограниченной в [« третьей производной. Информация —
значения / или f и f. Показано, что точки оптимальной информации являются
равноотстоящими, а коэффициенты оптимальных квадратурных формул равны
между собой. Найдены погрешности оптимальных алгоритмов.
Бут (Booth R. S.) Location of zeros of derivatives, SIAM J. Appl. Math. 15
A967), 1496-1501.
ОТ, нелинейные уравнения, одна переменная, оптимальные точки информации,
оценки точности
Рассматривается задача поиска нуля а производной А-го порядка для
класса таких скалярных функций /, что /(ft) меняет знак только в а.
Информация—значения / в л точках. Изучается асимптотическое поведение
погрешности оптимального алгоритма при оптимально выбранных точках информации.
Бут (Booth R. S.) Location of zeros of derivatives. II, SIAM J. Appl. Math.
17 A969), 409-415.
ОТ, нелинейные уравнения, одна переменная, оптимальные точки информации,
оценки точности
Продолжение работы Бут [67].
Вайнбергер (Weinberger H. F.) Optimal approximation for functions prescribed
at equally spaced points, J. Res. Nat. Bur. Std. Sect. В 65 A961), 99—104.
ОТ, аппроксимация линейных функционалов, оптимальные по точности
алгоритмы
Рассматривается задача аппроксимации линейного функционала для
класса скалярных функций, k-я производная которых ограничена в L2
некоторой константой. Информация — значения / в п равноотстоящих точках.
Найдены оптимальные по точности алгоритмы и их погрешности. Для
вычисления оптимального алгоритма требуется обращать матрицу порядка k — J.
?98 Ч. С. Краткий исторический очерк и аннотированная библиография
Вайнбергер (Weinberger H. F.) On optimal numerical solution of partial
differential equations, SIAM J. Numer. Anal, 9 A972), 182—198.
ОТ, аппроксимация линейных операторов, дифференциальные уравнения,
оптимальные алгоритмы
Рассматривается задача аппроксимации линейного оператора S: В—*2 для
единичного шара в В. Информация — значения некоторого линейного
оператора $: В —> R". При заданном линейном операторе М: Rm —> 2 оператор S
аппроксимируется оператором MQN,- где Q — матрица размера пХт. Для
фиксированных пит изучается проблема оптимального выбора Q, М и N.
Получено выражение оптимальной погрешности через нормы S и S*.
Результаты иллюстрируются на примере параболических и. эллиптических
дифференциальных уравнений.
Ваккер (Wacker H. J.) Minirnierung des Rechenaufwandes des Globalisierungen
spezieller Iterationsverfahren von Тур minimales Residuum, Computing 18
A974), 209—224.
ОТ, нелинейные уравнения, абстрактный случай
Рассматривается задача решения нелинейного уравнения Т (х)=0 в
гильбертовом пространстве. Используется метод продолжения, и уравнение
Т (х, si) = 0 при 0 = s0 < s3 < ... < Sb = 1, Т (х, 1) = Т (х) решается с помощью
локально сходящегося итерационного метода, использующего в качестве
начального приближения аппроксимацию #/-i решения уравнения Т (х, s/_i) — 0.
Рассматриваются оптимальные равноотстоящие точки s/.
Васильковский (Wasilkowski G. W.) N-Evaluation conjecture for multipoint
iterations for the solution of scalar nonlinear equations. Master's Thesis,
Dept. of Mathematics, Univ. of Warsaw A977), See also J, Assoc. Comput.
Mach. 28 A981), 71—80.
ОТ, нелинейные уравнения, одна переменная, порядок информации,
многоточечные итерации без памяти
Рассматриваются многоточечные итерации без памяти для решения
нелинейных скалярных уравнений. Информация — N значений функции / и ее
производных, отвечающих матрице инцидентности. Доказано, что если
соответствующая интерполяционная задача Биркгофа хорошо обусловлена в комплексном
случае, то порядок таких итераций не превосходит 2п~1.
Васильковский (Wasilkowski G. W.) Can any stationary iteration using linear
information be globally convergent? Dept. of Computer Science Rep.
Carnegie-Mellon Univ. A978). See also J. Assoc. Comput. Mach. 27 A980),
263—269.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
одноточечные итерации, глобальная сходимость
Доказано, что никакая стационарная итерация, использующая линейную
информацию, не может сходиться глобально. Показано, что этот результат
справедлив даже для такого простого класса, как класс всех аналитических
комплексных функций, имеющих только простые нули. Высказывается гипотеза
о справедливости результата даже для класса всех вещественных многочленов
с вещественными простыми нулями.
Васильковский (Wasilkowski G. W.) The strength of nonstationary iteration,
Dept. of Computer Science Rep., Carnegie-Mellon Univ. A979).
ОТ, нелинейные уравнения, абстрактный случай, линейная информация,
глобальная сходимость
Рассматривается задача итеративного решения нелинейных уравнений
в банаховом пространстве. Информация линейна и адаптивна. Исследуется
вопрос о существовании глобально сходящихся нестационарных итераций для
класса аналитических операторов с простыми нулями-
3. Аннотированная библиография 299
Васильковский (Wasilkowski G. W.) Any iteration for polynomial equations
using linear information has infinite complexity, Dept. of Computer Science
Rep. Carnegie-Mellon Univ. A979).
ОТ, нелинейные уравнения, одна переменная, линейная информация,
сложность
Рассматривается задача итеративного решения полиномиальных уравнений
с простыми нулями. Информация линейна и адаптивна. Доказано, что для
любой итерации ф и любого числа к существует такой многочлен [ с одними
лишь простыми нулями, что первые k приближений, порожденные итерацией ф,
аппроксимируют нуль а функции / не лучше, чем начальное приближение дг0.
Это справедливо даже при произвольно малом |#0 —а|. Этот результат
означает, что сложность любой итерации бесконечна в классе полиномиальных
уравнений с простыми нулями.
Васильковский, Вожьняковский (Wasilkowski G. W., Wozniakowski H.) Opti-
mality of spline algorithms, Computer Science Dept. Rep., Carnegie-Mellon
Univ. A978).
ОТ, аппроксимация линейных операторов, сплайновые алгоритмы,
оптимальные линейные алгоритмы, центральные алгоритмы
Эта работа включена в ч. А настоящей книги в качестве гл. 4.
Великий В. Л. Оптимальная интерполяция периодических дифференцируемых
функций с ограниченной старшей производной, Мат. заметки, 1977, 22,
№ 5, с. 663—670.
ОТ, интерполяция, периодические функции, одна переменная, оптимальные
точки информации
Рассматривается задача интерполяции для класса периодических
скалярных функций с ограниченной в L^ производной порядка г. Информация —
значения / и f в п точках. Показано, что точки оптимальной информации
являются равноотстоящими и что вычисление 2л значений функции дает
больше, чем вычисление п значений функции и п значений первой
производной.
Вершульц (Werschulz A. G.) Optimal order and minimal complexity of one-step
methods for initial value problems, Dept. of Computer Science Rer.,
Carnegie-Mellon Univ. A976).
ОТ, обыкновенные дифференциальные уравнения, оптимальный порядок
Это —часть диссертации автора. Рассматривается решение задачи Коши
для некоторого класса обыкновенных дифференциальных уравнений.
Информация— значения функции, стоящей в правой части. Найден оптимальный
порядок для одношаговых методов, минимизирующий сложность построения
е-аппроксимации. Показано, что при разумных предположениях оптимальный
порядок стремится к бесконечности при стремлении 8 к нулю.
Вершульц (Werschulz A. G.) Computational complexity of one-step methods for
the numerical solution of initial value problems. Dept. of Computer Science
Rep., Carnegie-Mellon Univ. A976). To appear in Computing.
ОТ, обыкновенные дифференциальные уравнения, оптимальный порядок,
оптимальная величина шага
Это —часть диссертации автора. Рассматривается решение обыкновенных
дифференциальных уравнений, принадлежащих некоторому классу.
Информация— значения функции, стоящей в правой части. Изучаются оптимальный
порядок и оптимальная величина шага для одношаговых методов,
минимизирующие сложность построения е-аппроксимации. Показано, что оптимальный
порядок монотонно возрастает и стремится к бесконечности при стремлении 8
к нулю.
300 Ч. С. Краткий исторический очерк и аннотированная библиография
Вершульц (Werschulz A. G.) Computational complexity of one-step methods for
systems of differential equations, Dept. of Computer Science Rep., Carnegie-
Mellon Univ. A976). See also Math. Сотр. 34 A980), 155—174.
ОТ, обыкновенные дифференциальные уравнения, оптимальный порядок
Это — часть диссертации автора. Рассматривается решение задачи Коши
для системы из N обыкновенных дифференциальных уравнений. Информация —
значения функций, стоящих в правой части, и их производных. Для
метода Тэйлора /7-го порядка найден алгоритм, комбинаторная сложность
которого есть 0 (pN log/?). Найден также оптимальный порядок, минимизирующий
оценки на сложность получения е-аплроксимации. Показано, что при
разумных предположениях порядок стремится к бесконечности при стремлении 8
к нулю.
Вершульц (Werschulz A. G.) Maximal order of information for numerical
quadrature. Mathematics Research Rep. 77-2, Univ. of Maryland, Baltimore
County A977), See also J. Assoc. Comput. Mach. 26 A979), 527—537.
ОТ, интегрирование, одна переменная, порядок информации, максимальный
порядок
Рассматривается задача интегрирования для класса аналитических
функций. Информация —значения функции / и ее производных. Изучаются методы,
использующие фиксированную информацию и имеющие максимальный
порядок. Доказано, что максимальный порядок равен порядку информации. Найден
порядок информации для эрмитовой информации «одинакового веса», т. е.
состоящей в каждой точке из значений всех производных до некоторого
одинакового для всех точек порядка.
Вершульц (Werschulz A. G.) Maximal order for quadratures using n evaluations,
Mathematics Research Rep. 77-7, Univ. of Maryland. Baltimore County A977).
See also Aequationes Math., 19 A979), 310—313; 21 A980), 68—97.
ОТ, интегрирование, одна переменная, максимальный порядок
Рассматривается задача интегрирования для класса аналитических
функций. Информация —значения п функционалов Lt на f, где ?,/(/) =/(;", *=1,
2, ..., я, при некоторых //. Высказана гипотеза, что порядок информации
(см. Вершульц [77, Rep. 77 2]) не превосходит 2я+1. Доказана
справедливость этой гипотезы для эрмитовой информации.
Вершульц (Werschulz A. G.) Maximal order for approximation of derivatives.
Mathematics Research Rep. 77-8. Univ. of Maryland, Baltimore County A977).
See also /. Comput. System Set. 18 A979), 213—217.
ОТ, дифференцирование, порядок информации, максимальный порядок
Рассматривается задача дифференцирования для класса гладких
скалярных функций. Информация — значения f. Определены понятия порядка метода
и порядка информации. Показано, что максимальный порядок методов,
использующих фиксированную информацию, равен порядку информации.
Доказано, что порядок центральной разностной формулы максимален.
Вершульц (Werschulz A. G.) Maximal order and order of information for local
and global numerical problems, Proc. Conf. Informat. Sci. Systems, John
Hopkins Univ., Baltimore, Maryland A978).
ОТ, дискретизированная информация, порядок информации, оптимальные
алгоритмы
Рассматривается аппроксимация S (/; К) для / из заданного множества
при вещественном h, стремящемся к нулю. Информация — некоторый оператор
91 (/, h). Определено понятие порядка информации и доказано, что порядок
информации есть точная верхняя грань порядков алгоритмов, использующих
Ш (f, h). Результаты иллюстрируются несколькими примерами.
3. Аннотированная библиография 301
Вершульц (Werschulz A. G.) Multipoint methods with memory using Hermitian
information, Proc. Conf. Informat. Sci. Systems, John Hopkins Univ.,
Baltimore, Maryland A979).
ОТ, нелинейные уравнения, одна переменная, эрмитова информация, память,
максимальный порядок
Рассматриваются многоточечные итерации с памятью для решения
нелинейных скалярных уравнений. Информация —значения функции / и ее
производных. Изучается максимальный порядок таких итераций. Показано, что 2п
является точной оценкой максимального порядка.
Виноград (Winograd S.) Parallel iteration methods, in "Complexity of Computer
Computations" (R. E. Miller and J. M. Thatcher, eds.), pp. 53—60. Plenum
Press, New York, 1972.
ОТ, нелинейные уравнения, одна переменная, итерации с памятью,
параллельная сложность, итеративная сложность, максимальный порядок
Рассматривается решение скалярного нелинейного уравнения / = 0 на ЭВМ
с параллельными процессорами. Рассматривается класс итераций, информацией
для которых служат значения функции / и ее производных. Показано, что
для модели сложности из этой работы ускорение вычислений зависит
логарифмически от числа процессоров.
Виноград (Winograd S.) Some remarks on proof techniques in analytic
complexity, in "Analytic Computational Complexity" (J. F. Traub, ed.), pp. 5—14.
Academic Press, New York, 1976.
ОТ, оценки снизу
Обсуждается метод «обмана» или «соперничества» для получения оценок
снизу в теории аналитической сложности. В качестве иллюстрации показано,
как используемся этот метод при получении оценок снизу для алгоритмов
отыскания максимума унимодальной функции, нуля скалярной функции,
решения интегрального уравнения и аппроксимации скалярной функции.
Витушкин А. Г. Оценка сложности задач табулирования.— М.: Физмат-
гиз, 1959.
ОТ, оптимальное кодирование, энтропия
Рассматривается задача оптимального кодирования для заданного класса F
функций, определенных в некоторой области G. Предположим, что для
фиксированного е > 0 существуют конечное множество w и функция Pk~Pk(x> У)>
y = (ylt у2, ••., Ур), являющаяся многочленом степени не выше k по
каждому уi% i=l, 2, ...,/?, такие что для каждой функции f?F существует
y(f)?wP, для которого \f(x)-Pk(x, #(/))|<е \fx?G. Тогда Tf (/) = {у(/), Pk}
называется таблицей для /; здесь Ф —некоторое пространство, содержащее
/ и Pk (•, у)- Если п= card (w) — общее число элементов в до, то пР — общее
число различных элементов, участвующих в кодировании всех функций из F.
Величина Р (Tf (F)) — \og2 пР называется объемом (или сложностью) таблицы
и показывает, какое число двоичных разрядов необходимо, чтобы представить
пР элементов. Показано, что е-энтропия He(F) класса F совпадает с точной
нижней гранью объема всевозможных таблиц Tf (/) (/?F, а Ф произвольно).
Для некоторых множеств F доказано основное неравенство р log2 ((&+ 0/е)^
^zc(F) He(F), являющееся точным (с (/) — положительная константа). Для
многих важных классов функций найдена е-энтропия.
Вожьняковский (Wozniakowski H.) On nonlinear iterative processes in
numerical methods (in Polish). Ph. D. Thesis. Univ. of Warsaw A972).
ОТ, нелинейные уравнения, абстрактный случай, одноточечные итерации,
итерации с памятью, интерполяционные итерации, максимальный порядок
302 Ч. С. Краткий исторический очерк и аннотированная библиография
Рассматривается итеративное решение нелинейных уравнений.
Информация—значения функции / и ее производных. Изучаются одноточечные
итерации максимального порядка с памятью и без памяти. Интерполяционные
операции с памятью обобщаются на случай многих переменных. См. также Вожь-
няковский [74].
Вожьняковский (Wozniakowski H.) Maximal stationary iterative methods for
the solution of operator equations, SI AM J., Numer. Anal. 11 A974),
934-949.
ОТ, нелинейные уравнения, абстрактный случай, одноточечные итерации,
итерации с памятью, интерполяционные итерации, максимальный порядок
Проблема максимального порядка обобщается на бесконечномерные
задачи. В скалярном случае устанавливается максимальный порядок
интерполяционных алгоритмов. Показано, что в векторном случае память, вообще
говоря, не увеличивает порядка.
Вожьняковский (Wozniakowski H.) Generalized information and maximal order
of iteration for operator equations, SIAM J. Numer. Anal. 12 A975),
121—135.
ОТ, нелинейные уравнения, абстрактный случай, порядок информации,
одноточечные итерации, итерации с памятью, интерполяционные итерации
Вводится понятие порядка информации, что дает общий метод для
установления максимального порядка алгоритма. Показано, что максимальный
порядок зависит только от информации, используемой алгоритмом, и не
зависит от структуры алгоритма. Доказано, что порядок любого обобщенного
интерполяционного алгоритма максимален.
Вожьняковский (Wozniakowski H.) Properties of maximal order methods for
the solution of nonlinear equations, Z. Angew. Math. Mech. 55 A975),
268—271.
ОТ, нелинейные уравнения, абстрактный случай, эрмитова информация,
порядок информации, многоточечные итерации для скалярных задач,
итеративная сложность
Изучаются свойства итераций максимального порядка. Анонсируется
результат о справедливости гипотезы Кунга и Трауба при п ^ 3 для эрмитовой
информации.
Вожьняковский (Wozniakowski H.) Maximal order of multipoint iterations using
n evaluations, in "Analytic Computational Complexity" (J. F. Traub, ed.),
pp. 75—107. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, одна переменная, эрмитова информация,
итеративная информация, порядок информации, многоточечные итерации
Изучается вопрос о максимальном порядке многоточечной итерации для
решения скалярного уравнения /(й*)=0, т^О. Информация—п значений
функции / или ее производных. Пусть рп (т) обозначает максимальный
порядок. Для эрмитовой информации установлена справедливость гипотезы Кунга
и Трауба, т. ё7 доказано, что рп@)=2п-г. Выдвинута гипотеза, что/?„(т) =
— 2п~1. Показана взаимосвязь между задачами о максимальном порядке и
об интерполяции Виркгофа.
Гайсарян С. С. Об одном оптимальном алгоритме приближенного вычисления
квадратур, ЖВМ и МФ, 1969. 9, № 5, с. 1015-1023.
ОТ, интегрирование, одна переменная, оптимальные точки информации
Рассматриваются квадратурные формулы порядка s. Информация
—значения /. Путем минимизации главного члена погрешности точки оптимальной
информации выражены через s-ю производную функции /.
3. Аннотированная библиография 303
Гайсарян С. С. О выборе оптимальных сеток при численном решении задачи
Коши для системы обыкновенных дифференциальных уравнений, ЖВМ
и МФУ 1970, 10, № 2, с. 465—474.
ОТ, обыкновенные дифференциальные уравнения, оптимальные точки
информации
Рассматривается задача Коши для системы обыкновенных
дифференциальных уравнений y' = f(x, у), у(хо) — уо. Информация — значения /. Задача
решена одношаговым методом на сетке {*/}. Изучаются точки */,
минимизирующие главный член асимптотики погрешности. Найдены асимптотически
оптимальные сетки.
Ганшин Г. С. Вычисление наибольшего значения функций, ЖВМ и МФ, 1976,
16, № 1, с. 30—39.
ОТ, экстремум, несколько переменных
Рассматривается задача поиска максимума для класса зависящих от
нескольких переменных скалярных функций, у которых определенная
производная ограничена. Информация —значения /. Оценивается общее число
вычислений значений /, необходимое для решения задачи с точностью 8.
Ганшин Г. С. Оптимальные пассивные алгоритмы вычисления наибольшего
значения функций на отрезке, ЖВМ и МФ, 1977, 17, № 3, с. 562—571.
ОТ, экстремум, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы
Рассматривается задача поиска максимума для трех классов скалярных
функций. Информация —значения / в п точках. Оптимальные по точности
алгоритмы представляют собой оптимальные сетки из п точек, лежащих в
заданном интервале. Найдено также минимальное значение я, для которого
погрешность не превосходит 8.
Гаффни (Gaffney P. W.) Optimal interpolation, Ph. D. Thesis, Oxford Univ.
A976).
ОТ, интерполяция, одна переменная, оптимальные по точности алгоритмы,
сплайны
Это—диссертация. Некоторые из ее результатов опубликованы в работах:
Гаффни [77] (The range of possible values of f(x)), Гаффни [77] (To
compute the optimal interpolation formula, Гаффни, Пауэлл [76].
Гаффни (Gaffney P.-W.) The range of possible values of f(x). Computer Science
and Systems Division Rep., AERE, Harwell, Oxfordshire A977).
ОТ, интерполяция, одна переменная, оптимальные по точности алгоритмы,
совершенные сплайны, оценки снизу
Рассматривается задача интерполяции для класса скалярных функций
с ограниченной в LTO производной порядка k. Информация—значения f в п
точках. Область возможных значений / (х) ограничена интерполяционными
совершенными сплайнами степени к. Рассматривается вопрос о вычислении
значений этих сплайнов в точке х.
Гаффни (Gaffney P. W.) To compute the optimal interpolation formula,
Computer Science and Systems Division Rep., AERE, Harwell, Oxfordshire A977).
See also Math. Сотр. 32 A978), 763—777.
ОТ, интерполяция, одна переменная, оптимальные по точности алгоритмы,
сплайны .
Рассматривается задача интерполяции для класса скалярных функций
с ограниченной в L^ производной порядка k. Информация — значения / в п
точках. Оптимальный по точности алгоритм определяется интерполяционным
сплайном Q степени k — l, имеющим ровно п—k узлов. Погрешность выра-
304 Ч. С. Краткий исторический очерк и аннотированная библиография
жается совершенным сплайном В степени k с теми же п—k узлами, что и
у Q. Изучается вопрос о вычислении узлов и коэффициентов для сплайнов
Q и В.
Гаффни, Пауэлл (Gaffney P. W., Powell M. J. D.) Optimal interpolation, in
"Numerical Analysis" (G. A. Watson, ed.) Lecture Notes in Math., Vol 506,
pp. 90-—100. Springer Verlag, Berlin and New York, 1976.
ОТ, интерполяция1 одна переменная, оптимальные по точности алгоритмы,
сплайны
Рассматривается задача интерполяции для класса скалярных функций
с ограниченной в ?«, производной порядка k. Информация —значения /. Область
возможных значений / (*) для функций с одной и той же информацией
выражена через совершенные сплайны. Найдены оптимальные по точности
алгоритмы и их погрешности.
Гермейер Ю. Б. Введение в теорию исследования операций.— М.: Наука, 1971,
математика и ОТ, исследование операций, экстремум, одна переменная,
оптимальные алгоритмы
В числе прочих рассмотрена задача поиска максимума для класса
скалярных функций, удовлетворяющих условию Липшица. Информация —
значения /. Построен оптимальный алгоритм.
Голомб (Golomb M.) Interpolation operators as optimal recovery schemes for
classes of analytic functions, in "Optimal Estimation in Approximation
Theory" (C. A. Micchelli and T. J. Rivlin, eds.), pp. 93—138. Plenum Press,
New York, 1977.
ОТ, аппроксимация, оптимальные линейные алгоритмы, сплайны, л-поперечники
Рассматривается задача аппроксимации для класса комплекснозначных
функций, лежащего в гильбертовом пространстве с воспроизводящим ядром.
Информация — значения /. Показано, чго линейным оптимальным по точности
алгоритмом является интерполяционный сплайн. Рассматриваются точки
оптимальной информации и взаимосвязи с «-поперечниками. Для некоторых
пространств аналитических функций найдены в явном виде интерполяционные
сплайны и оптимальные погрешности.
Голомб, Вайнбергер (Golomb M., Weinberger H. F.) Optimal approximation
and error bounds, in "On Numerical Approximation" (R. E. Langer, ed.),
pp. 117—190. Univ. of Wisconsin Press, Maddison, Wisconsin, 1959.
ОТ, аппроксимация линейных функционалов, оптимальные по точности
алгоритмы
Это одна из первых работ, где для заданного класса элементов
рассматривается задача аппроксимации линейного функционала. Информация —
значения п функционалов. Приводятся различные условия, обеспечивающие
существование оптимальных по точности алгоритмов с конечной погрешностью.
Для ряда поглощающих классов подробно изучаются оптимальные по
точности алгоритмы. В случае гильбертова пространства получены линейные
оптимальные по точности алгоритмы. Эти алгоритмы базируются в первую очередь
на сплайнах, хотя само слово «сплайн» не употребляется. Результаты
иллюстрируются многочисленными полезными примерами.
Гребенников А. И. Об оптимальном приближении нелинейных операторов,
ЖВМ и МФ, 1978, 18, № 3, с. 762—766.
ОТ, аппроксимация нелинейных операторов, сплайны
Рассматривается аппроксимация В (и), где В — нелинейный оператор,
действующий из гильбертова пространства И в некоторое нормированное
линейное пространство, ||Lw||^?, L — линейный оператор, действующий из Н
в некоторое гильбертово пространство, а /?-—заданная константа. Информа-
3. Аннотированная библиография 305
ция — значения п линейных функционалов An = [Ll (и), ... , Ln(u)]. Вводится
алгоритм (р(Ап) — В(и^), где tif — интерполяционный сплайн. Показано, что ф
оптимален с точностью до множителя, равного двум. Упоминаются условия,
обеспечивающие оптимальность ф.
Гребенников А. И., Морозов В. А. Об оптимальном приближении операторов,
ЖВМ и МФ, 1977, 17, № 1, с. 3—14.
ОТ, аппроксимация линейных операторов, оптимальные линейные алгоритмы
Рассматривается в основном задача аппроксимации линейного оператора
в гильбертовом пространстве. Информация — линейный оператор. Доказано
существование линейного оптимального по точности алгоритма. Изучается
также случай информации с возмущениями. Эта работа связана с понятиями
центрального и сплайнового алгоритмов.
Гросс, Джонсон (Gross О., Johnson S. M.) Sequential minimax search for a zero
of a convex function, MTAC (now Math. Сотр.) 13 A959), 44—51.
ОТ, нелинейные уравнения, одна переменная, выпуклые функции,
оптимальные точки информации, оптимальные алгоритмы
Рассматривается задача решения нелинейных скалярных уравнений для
класса выпуклых непрерывных функций /, таких что / (а) > 0, / (Ь) < 0.
Информация—значения / в п адаптивно выбираемых точках. Изучаются точки
оптимальной информации, оптимальные алгоритмы и их погрешности.
Гэл (Gal S.) Multidimensional minimax search for a maximum, S1AM J. Appl,
Math. 23 A972), 513-526.
ОТ, экстремум, несколько переменных, оптимальные алгоритмы
Рассматривается задача поиска максимума в классе линейно
унимодальных скалярных функций нескольких переменных. Информация —значения /
в адаптивно выбираемых точках. Оптимальные алгоритмы определены как
алгоритмы, минимизирующие меру множества максимумов всех функций,
соответствующих вычисленной информации. Доказано, в частности, что в случае
двух переменных оптимальная погрешность после вычисления 3/г значений
функции / не превосходит величины C/4)" и. (В), где u, (fi) —лебегова мера
множества В, на котором определена функция /. Та же задача рассматривается
для подкласса сферически симметричных функций.
Гэл, Миккелли (Gal S., Micchelli С. A.) Optimal sequential and non-sequential
procedures for evaluating a functional. Univ. of Wisconsin-Madison Rep. 1871
A978). See also Appl. Anal. 10 A980), 105—120.
ОТ, аппроксимация линейных функционалов и операторов, оптимальная
адаптивная и неадаптивная информация
Рассматривается задача аппроксимации линейного функционала (или
оператора) в заданном классе. Информация—значения, возможно с возмущениями,
п линейных функционалов. Изучаются оптимальная детерминированная,
случайная и адаптивная последовательная информации. Показано, что для многих
задач оптимальная детерминированная и адаптивная последовательная
информации дают одинаковую погрешность.
Гэри, Джонсон (Garey M. R., Johnson D. S.) Approximation algorithms for
combinatorial problems; An annotated bibliography, in "Algorithms and
Complexity: New Directions and Recent Results" (J. F. Traub, ed.), pp. 41—52.
Academic Press, New York, 1976.
обзор, комбинаторная сложность
Дана аннотированная библиография работ по приближенным
полиномиальным алгоритмам решения комбинаторных задач, для которых неизвестны точ-
ныр полиномиальные алгоритмы.
306 Ч. С. Краткий исторический очерк и аннотированная библиография
Гзри, Джонсон Д. (Garey M. R., Johnson D. S.) "Computers and Intractability",
Freeman, San Francisco, California, 1979.
обзор, комбинаторная сложность
Руководство по NP-полным задачам. Содержит материал по
приближенному решению трудных задач. Хорошая библиография.
Данилин Ю. М. Оценка эффективности одного алгоритма отыскания
абсолютного минимума, ЖВМ и МФУ 1971, II, № 4, с. 1026—1031.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы
Рассматривается задача поиска минимума для класса скалярных функций,
удовлетворяющих условию Липшица с заданной константой. Информация —
значения /. Доказано, что алгоритм Пиявского (см. Пиявский [72]) требует
вычислить не более чем в три раза больше значений функций, чем
оптимальный алгоритм, решающий задачу с точностью 8.
де Бур (de Boor С.) Computational aspects of optimal recovery, in "Optimal
Estimation in Approximation Theory" (C. A. Micchelli and T. J. Rivlin,
eds.), pp. 69—91. Plenum Press, New York, 1977.
ОТ, аппроксимация, совершенные сплайны
Рассматривается задача аппроксимации для класса скалярных функций
с ограниченной в ?«, производной порядка k. Информация — значения функции
/ и ее производных. Приводится программа на Фортране построения
совершенного интерполяционного сплайна, являющегося оптимальным по точности
алгоритмом. Имеется связь с работами Миккелли, Ривлина, Винограда [76]
и Гаффни, Пауэлла [76].
ден Хейер (den Heijer С.) On the local convergence of Newton's method, Dept.
of Numerical Mathematics Rep., Mathematisch Centrum, Amsterdam A976).
ОТ, нелинейные уравнения, абстрактный случай, метод Ньютона,
оптимальная сходимость
Устанавливается оптимальный радиус шара сходимости итерационного
метода Ньютона для поиска нуля нелинейного оператора. См. Вожьняковский
[77] (Convergence and complexity of Newton iteration for operator equations).
Джаррэтт (Jarratt P.) Some efficient fourth order multipoint methods for solving
equations, BIT 9 A969), 119—124.
ОТ, нелинейные уравнения, одна переменная, многоточечные итерации,
итеративная сложность, порядок
Построен метод четвертого порядка для решения скалярных нелинейных
уравнений, использующий одно значение функции и два значения первой
производной. Обсуждается вопрос об индексе сложности.
Джаррэтт (Jarratt P.) A review of methods for solving nonlinear algebraic equa
tions in one variable, in "Numerical Methods for Nonlinear Equations"
(P. Rabinowitz, ed.), pp. 1—26. Gordon and Breach, New York, 1970.
ОТ, нелинейные уравнения, одна переменная, одноточечные итерации с
памятью, многоточечные итерации, порядок
Обзор итерационных алгоритмов вычисления нуля скалярной нелинейной
функции /. Информация —значения / или значения / и /'. Содержатся также
некоторые новые материалы по сравнению численной эффективности
различных операций.
Джентлмэн (Gentleman W. M.) Measures of efficiency, unpublished letter to
J. F. Traub A970).
ОТ, итеративная сложность
3. Аннотированная библиография 307
Доказано, что индекс эффективности, инвариантный относительно
подстановки итерационной функции в себя, должен иметь определенный вид. Хотя
и нигде не опубликованный, этот результат широко цитируется.-
Джеттер (Jetter К.) Optimale Quadraturformeln mit semidefiniten Peano-kernen,
Numer. Math. 25 A976), 239—249.
ОТ, интегрирование, одна переменная, оптимальные алгоритмы
Рассматривается задача интегрирования для класса т раз
дифференцируемых скалярных функций. Информация —значения /. Погрешность
квадратурной формулы представлена в виде cf{m) (l). Исследуется вопрос о
минимизации \с\.
Дживс (Jeeves Т. A.) Secant modification of Newton's method, Comtn. ACM 1
(8) A958), 9-10.
ОТ, нелинейные уравнения, одна переменная, метод Ньютона, метод секущих
Сравнивается сложность итераций Ньютона и секущих для решения
скалярного нелинейного уравнения / = 0. Впервые замечено, что если стоимость
вычисления /' больше стоимости вычисления /, умноженной на 0.43, то
сложность итерации секущих ниже, чем сложность итерации Ньютона.
Джонсон Л., Рисе (Johnson L. W., Riess R. D.) Minimal quadratures for
functions of low-order continuity, Math. Сотр. 25 A971), 831—835.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
оценки сверху
Рассматривается задача интегрирования скалярных функций, ряд Фурье
которых по системе многочленов Чебышёва первого рода сходится равномерно,
а также скалярных функций, аналитических на единичном круге.
Информация—значения / в п точках. Усгановлено существование квадратурных формул
с минимальной погрешностью. Для класса аналитических функций показано,
что погрешность этих формул не превосходит О (п~1).
Джонсон (Johnson S. M.) Best exploration for maximum is Fibonaccian. RAND
Corp. Red. P-856 A956).
ОТ, экстремум, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация—значения f в п адаптивно выбираемых
точках. Доказана оптимальность метода Фибоначчи. См. Кифер [53].
Емельянов К. В., Ильин А. М. О числе арифметических действий,
необходимом для приближенного решения интегрального уравнения Фредгольма
II рода, ЖВМ и МФ, 1967, 7, № 4, с. 905—910.
ОТ, интегральные уравнения, оценки снизу и сверху
Рассматривается интегральное уравнение Y (Р)= \ К (Р, Q) У (Q) dQ-\-f (P),
где D a IROT, для класса функций /С и / с ограниченной производной порядка г.
Информация—значения К и /. Показано, что оценка снизу погрешности
произвольного алгоритма, использующего п значений функции /С, равна по
меньшей мере п~г^2тК Дан алгоритм, погрешность которого достигает этой
границы.
Женсыкбаев А. А. О наилучшей квадратурной формуле на классе WrLp,
ДАН СССР, 1976, 227, № 2, с. 277-279.
ОТ, интегрирование, периодические функции, одна переменная, оптимальные
точки информации, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных
периодических функций с ограниченной в Lp производной порядка г. Информация —
308 Ч. С. Краткий исторический очерк и аннотированная библиография
значения /. Доказано, что квадратурная формула прямоугольников с
равноотстоящими узлами является оптимальным линейным алгоритмом с оптимально
выбранными точками информации. Тем самым обобщен соответствующий
результат Моторного [73], полученный для р=оо.
Женсыкбаев А. А. О наилучших квадратурных формулах для некоторых
классов непериодических функций, ДАН СССР, 1977, 286, № 3, с. 531—534.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lp производной порядка г. Информация —значения /.
Изучаются оптимальные линейные алгоритмы с оптимальными точками информации
и их погрешности.
Женсыкбаев А. А. Об одном свойстве наилучших квадратурных формул, Мат.
заметки, 1978, 23, № 4, с. 551—562.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lq производной порядка г. Информация—значения /, /', ..., /<?>.
Показано, что оптимальные квадратурные формулы совпадают при ? = 2т
и ? = 2/п+1. Это справедливо также и для периодического случая.
Жилейкин Я. М., Кукаркин А. Б. Об оптимальном вычислении интегралов
от быстроосциллирующих функций, ЖВМ и МФ, 1978, 18, № 2, с. 294—301.
ОТ, интегрирование, одна переменная, оптимальные по точности алгоритмы
Рассматривается задача аппроксимации интеграла J*o eiw&{x) f (х) dx при
фиксированной функции g и большом | w | для класса функций / с
ограниченной г-й производной. Информация — значения /. При g?Cr+1 найдены
оптимальные по точности алгоритмы и их погрешности.
Жилинскас А. Г. Одношаговый байесовский метод поиска экстремума функций
одной переменной, Кибернетика, 1975, № 1, 139—144.
ОТ, экстремум, одна переменная, оптимальные байесовские алгоритмы
Рассматривается задача поиска минимума для одного связанного с вине-
ровским процессом класса функций. Найден оптимальный одношаговый
байесовский алгоритм.
Зализняк Н. Ф., Лигун А. А. Об оптимальных стратегиях поиска глобального
максимума функции, ЖВМ и МФ, 1978, 18, № 2, с. 314 — 321.
ОТ, экстремум, одна переменная, оптимальная линейная информация,
оптимальные по точности алгоритмы
Задача поиска максимума рассматривается для класса, являющегося
алгебраической суммой выпуклого компактного уравновешенного множества и
конечномерного линейного пространства. Информация —значения п линейных
функционалов. Найдены оптимальные по точности алгоритмы. Показано, что
существует неадаптивная информация, оптимальная в классе адаптивной
информации. Для класса 2я-периодических функций, у которых r-я
производная ограничена в ?«, единицей, оптимальной информацией служат значения
/ в п равноотстоящих точках, оптимальные по точности алгоритмы связаны
со сплайнами, а погрешность есть я-поперечник задачи, равный Кг/пг, где
Кг — постоянная Фавара.
Зонневенд (Sonnevend G.) On optimization of algorithms for function
minimization, ЖВМ и МФ, 1977, 17, N 3, с. 591—609.
ОТ, экстремум, нелинейные уравнения, несколько переменных, оптимальные
точки информации, оптимальные по точности алгоритмы
S. Аннотированная библиография 309
Рассматриваются задача поиска минимума скалярной функции /, зависящей
от нескольких переменных, и задача отыскания решения системы нелинейных
уравнений grad / (*) =0 для класса функций /, таких что (grad / (х) — grad / (у),
х—У)/\\х—#||26И, Щ* гДе т^0. Информация — значения функции / и ее
производной. Определены оптимальные точки информации и оптимальные по
точности алгоритмы для различных критериев, соответствующих разным видам
погрешности. Показана взаимосвязь между этими задачами и задачами
динамического программирования и оптимального управления.
Ибрагимов И. И., Алиев Р. М. Наилучшие квадратурные формулы для
некоторых классов функций, ДАН СССР, 1965, 162, № 1, с. 23—25.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lq при q=\, 2, + оо производной порядка г. Информация —
значения /, /', ..., /с-2> в т точках. Для четных г получены оптимальные
линейные алгоритмы с оптимальными точками информации.
Иванов В. В. Об оптимальных алгоритмах минимизации функций некоторых
классов, Кибернетика, 1972, № 4, с. 81—94.
ОТ, экстремум, несколько переменных, оптимальные алгоритмы, оценки точности
Рассматривается задача поиска минимума для класса скалярных функций
от т переменных с r-й производной, удовлетворяющей условию Липшица с
заданной константой. Информация —значения функции / и ее производных в
п точках. Показано, что погрешность оптимального алгоритма есть в (п-{г+1^т)ш
Получены также асимптотически оптимальные алгоритмы для классов
аналитических и целых функций.
Иванов В. В. Об оптимальных алгоритмах вычисления сингулярных
интегралов, ДАН СССР, 1972, 204, № 1, с. 21—24.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные алгоритмы
Рассматривается задача вычисления сингулярного интеграла для заданного
класса скалярных функций. Информация —значения /. Для нескольких
классов функций найдены оптимальные алгоритмы, их погрешности и оптимальные
точки информации.
Иванов В. В. Об оптимальных по точности алгоритмах приближенного
решения операторных уравнений I рода, ЖВМ и МФ, 1975, 15, № 1, с. 3—11.
ОТ, операторные уравнения, оптимальные по точности алгоритмы
Рассматривается задача аппроксимации элемента R — O(I), где
О—некоторый оператор, а / принадлежит заданному множеству. Информация —значение
? (/), где Y — некоторый оператор. Найдены оптимальные по точности
алгоритмы. Эта идея иллюстрируется на примере решения уравнения КФ=[, где
К—линейный компактный оператор, / = /(Lm, ||м||<;1, L— заданный линейный
компактный оператор. Информацией является ? (/С, f)=(Ke, /е),где \\К—/Се||<е,
II/ — /еЦ^е- Найдены асимптотически оптимальные по точности алгоритмы.
Иванов В. В. Об оптимальных по точности алгоритмах приближения функций
некоторых классов на ЭВМ.— В кн.: Теория приближения функций.—
М.: Наука, 1977, с. 195—200.
ОТ, аппроксимация, оптимальные по точности алгоритмы
Это доклад, представленный на международной конференции в Калуге
(СССР) в 1975 г. Дается обзор результатов по оптимальным алгоритмам
решения задачи аппроксимации для некоторых классов функций.
Казули, Триджанте (Casuli V., Trigiante D.) The convergence order for iterative
multipoint procedures, Calcolo 14 A977), 25 — 44.
310 Ч. С. Краткий исторический очерк и аннотированная библиография
ОТ, нелинейные уравнения, одна переменная, многоточечные итерации,
максимальный порядок
Рассматривается итеративное решение скалярных нелинейных уравнений.
Приняты ограничительные предположения относительно используемых
алгоритмов и информации. Для этого класса итераций, как и у Кунга, Трауба
[74] (Optimal order of one-point and multipoint iterations), найден
максимальный порядок.
Казули, Триджанте (Casuli V., Trigiante D.) Computational complexity for a
class of multipoint iterative procedures without or with internal memory,
Calcolo 14 A977), 225-235.
ОТ, нелинейные уравнения, одна переменная, многоточечные итерации, сложность
Рассматривается итеративное решение скалярных нелинейных уравнений.
Как и у Кунга, Трауба [74] (Computational complexity of one-point and
multipoint iteration), комбинаторная сложность включается в индекс сложности.
Карлин (Karlin S.) Best quadrature formulas and interpolation by splines
satisfying boundary conditions, and The fundamental theorem of algebra for mono-
splines satisfying certain boundary conditions and applications to optimal
quadrature formulae, in «Approximations with Special Emphasis on Spline
Functions» (I. J. Schoenberg, ed.), pp. 447 — 466, 467—484. Academic Press,
New York, 1969.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
В числе других задач рассматривается задача интегрирования для класса
скалярных функций с ограниченной в L2 производной порядка г.
Информация—значения функции f в п точках и значения ее производных на концах
отрезка. Изучаются оптимальные в смысле Сарда алгоритмы с фиксированными
и варьируемыми точками информации, а также их связь с моносплайнами.
Карлин (Karlin S.) Best quadrature formulas and splines, /. Approx. Theory 4
A971), 59 — 90.
ОТ, интегрирование, одна переменная, оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций,
у которых п-я производная ограничена в L2 единицей. Информация —значения
функции f и ее производных на концах отрезка интегрирования. Изучаются
оптимальные алгоритмы в смысле Сарда. Выявлена их связь со сплайнами,
удовлетворяющими некоторым граничным условиям.
Карп, Мирзнкер (Karp R. M., Miranker W. L.) Parallel minimax search for a
maximum, У. Comb. Theory 4 A968), 19 — 35.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы,
параллельные алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация —значения /. Изучаются оптимальные
параллельные алгоритмы поиска. Установлены результаты, обобщающие результаты
Кифера [53].
Каутски (Kautsky J.) Optimal quadrature formulae and minimal monosplines
in Lq, J. Austral. Mat. Soc. 11 A970), 48-56.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lq производной порядка г. Информация —значения /,
/', ..., /с-1*. Получены оптимальные квадратурные формулы с оптимальными
точками информации и их погрешности. Доказательство базируется на
свойствах моносплайнов минимальной /
3. Аннотированная библиография 311
Кацевич (Kacewicz В.) Integrals with a kernel in the solution of nonlinear
equations in N dimensions. Computer Science Department Rep., Carnegie-
Mellon Univ. A975). See also J. Assoc. Comp.ut. Math. 26 A979), 239 — 249.
ОТ, нелинейные уравнения, абстрактный случай, несколько переменных,
итеративная информация, порядок информации
Рассматриваются итерационные методы решения нелинейного операторного
уравнения / = 0. Определен максимальный порядок итерации /?i, s,
использующей информацию, которая состоит из значений первых s производных
функции / и некоторого «интеграла с ядром g». Для рассматриваемой модели
сложности доказано, что в многомерном случае при большом N сложность
итерации /^i, i меньше сложности итерации /?i, s» s^2, и меньше сложности
любой интерполяционной итерации.
Кацевич (Kacewicz В.) An integral-interpolation iterative method for the
solution of scalar equations, Numer% Math. 26 A976), 355 — 365.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
порядок информации
Выдвигается идея использования интегральной информации для решения
нелинейного скалярного уравнения / = 0. Определяется итерация /-i,$,
использующая информацию, которая состоит из значений первых s производных
функции / и некоторого интеграла. Установлена максимальность порядка
итерации l-i,s.
Кацевич (Kacewicz В.) The use of integrals in the solution of nonlinear equations in
N dimensions, in «Analytic Computational Complexity» (J. F. Traub, ed.),
pp. 127 — 141. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, несколько переменных, итеративная информация,
порядок информации
Выдвигается идея использования интегральной информации для решения
нелинейного /V-мерного уравнения / = 0. Определяется итерация /_j><s
максимального порядка, использующая информацию, которая состоит из'значений
первых s производных функции / и некоторого интеграла. Для
рассматриваемой модели сложности доказано, что сложность итерации /_i,i меньше
сложности итерации I-\lS, s^2. Доказано, что при больших N сложность
итерации /_i,i меньше сложности любой интерполяционной итерации, использующей
стандартную информацию.
Кацевич, Вожьняковский (Kacewicz В., Wozniakowski H.) A survey of recent
problems and results in analytic computational complexity, in «Mathematical
Foundations of Computer Science 77» (J. Gruska, ed.), Lecture Notes in
Computer Science No. 53, pp. 93—107. Springer-Verlag, Berlin and New
York, 1977.
ОТ, нелинейные уравнения, абстрактный случай, итеративная сложность
Обзор исследований по итеративной сложности. Хорошая библиография.
Кист (Keast P.) Optimal parameters for multidimensional integration, SIAM J.
Numer. Anal. 10 A973), 831—838.
ОТ, интегрирование, несколько переменных, оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных
периодических функций нескольких переменных с ограниченными коэффициентами Фурье.
Информация —значения /. Рассматриваются оптимальные квадратурные
формулы с равными весами. Эта работа связана с работой Коробова [63].
Кифер (Kiefer J.) Sequential minimax search for a maximum, Proc. Amer. Math.
Soc. 4 A953), 502-505.
312 Ч. С. Краткий исторический очерк и аннотированная библиография
ОТ, экстремум, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация — значения/ в п точках. Получен классический
результат, что метод Фибоначчи — оптимальный по точности алгоритм.
Оптимальная погрешность равна 1/FW + 1, где Fn + 1 есть (п + 1)-е число Фибоначчи.
Как сообщил нам Кифер, этот результат был получен им еще в 1948 г.
в магистерской диссертации в Массачусетсом технологическом институте и
опубликован позднее по инициативе Дж. Вольфовица.
Кифер (KJefer J.) Optimum sequential search and approximation methods under
minimum regularity assumption, J. Soc, Indust. Appl. Math. 5 A957), 105—136.
ОТ, аппроксимация нелинейных функционалов, оптимальные точки
информации, оптимальные по точности алгоритмы
Рассматривается задача аппроксимации нелинейного функционала для
некоторого класса функций. Информация — значения /. Оптимальные по точности
алгоритмы изучаются для задачи поиска нуля монотонной вещественной
функции, задачи поиска точки, в которой достигается максимум унимодальной
функции, и задачи интегрирования вещественной функции, неубывающей или
удовлетворяющей условию Липшица с заданной константой.
Кнауфф, Кресс (Knauff W., Kress R.) Optimale approximation linearer Funktionale
auf periodischen Funktionen. Numer. Math. 22 A974), 187—205.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы
Рассматривается задача аппроксимации линейного ограниченного
функционала для класса периодических скалярных функций. Информация — значения /
в п равноотстоящих точках. Найдены линейные оптимальные алгоритмы и их
погрешности.
Кнауфф, Кресс (Knauff W., Kress R.) Optimale Approximation mit Nebenhedin-
gungen an lineare Funktionale auf periodischen Funktionen, Numer., Math.
25 A976), 149—159.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы
Рассматривается задача аппроксимации линейного функционала для класса
скалярных периодических комплексных функций. Информация — значения / в п
равноотстоящих точках. Найдены линейные оптимальные алгоритмы,
удовлетворяющие заданным линейным ограничениям.
Коман (Coman Gh.) Monosplines and optimal quadrature formulae in Lpi Rend.
Mat. 5 A972), 567—577.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций, у
которых r-я производная ограничена в Lv константой. Информация — значения
f, F » •••> f{r~1]. При помощи моносплайнов наименьшего отклонения найдены
веса и узлы оптимальных линейных квадратурных формул.
Коман, Микула (Coman Gh., Micula Gh.) Optimal cubature formulae, Rend. Mat.
4 A971), 303—311.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
двух переменных с ограниченными в L2 производными. Информация — значения
функции / и ее производных. Найдены веса и узлы оптимальных линейных
квадратурных формул.
3. Аннотированная библиография 313
Корнейчук Н. П. Наилучшие кубатурные формулы для некоторых классов
функций многих переменных, Мат. заметки, 1968, № 5, с. 565—576.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
нескольких переменных с ограниченным модулем непрерывности. Информация —
значения /. Найдены оптимальные точки информации и оптимальные веса
линейных кубатурных формул. При оптимальных точках найдена также погрешность.
Корнейчук Н. П. О новых результатах по экстремальным задачам теории
квадратур.—Добавление к кн.: — Никольский С. М. Квадратурные
формулы.—М.: Наука, 1974, с. 136—223.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Обзор результатов, полученных после первого издания книги Никольского
A958 г.). Рассматривается задача интегрирования для класса скалярных
функций с ограниченной в Lp производной порядка г. Информация — значения
/> /'> •••» /(?*. Показано, что задача об оптимальных точках информации и
оптимальных весах линейных квадратурных формул связана со сплайном,
старший член которого есть tr', а норма минимальна в пространстве Lgi \/p~\-l/q = \.
Решение получено для ? = г — 1 и ? = /¦ — 2 при нечетных г.
Корнейчук Н. П. Экстремальные задачи теории приближения.— М.: Наука,
1976.
магематика, аппроксимация, оценки точности, л-поперечники
Обзор результатов по точным оценкам погрешностей наилучших
аппроксимаций для нескольких классов функций (в основном, периодических функций
с ограниченной производной или ограниченным модулем непрерывности).
Рассматриваются «-поперечники и экстремальные подпространства. Имеется хорошая
библиография работ советских авторов.
Корнейчук Н. П., Лушпай Н. Е. Наилучшие квадратурные формулы для
классов дифференцируемых функций и кусочно-полиномиальное приближение,
Изв. АН СССР, сер. матем., 1969, 33, № 6, с. 1416—1437.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lp производной порядка г. Информация—значения /, /', ...
..., /<?>. Показано, что задача об оптимальных точках информации и
оптимальных весах линейных квадратурных формул связана со сплайном, старший
член которого есть tr, а норма минимальна в пространстве Lqi \/p-\-l/q — l.
Решение получено для ? = г—2 и ? —г—3 при нечетных г.
Коробов Н. М. Теоретико-числовые методы в приближенном анализе.— М,: Физ*
матгиз, 1963.
ОТ интегрирование, несколько переменных, интерполяция, интегральные
уравнения
Рассматривается задача интегрирования для класса периодических
скалярных функций нескольких переменных с ограниченными коэффициентами Фурье.
Информация —значения /. Рассмотрены оптимальные точки информации для
квадратурных формул с равными весами. С помощью некоторых результатов
из теории чисел изучается задача о вычислении точек, близких к оптимальным.
Полученные результаты применяются к задачам интерполяции и решения интег*
ральных уравнений.
Короткое В. Б. Об оценке снизу погрешности кубатурных формул, Сиб. мат. ж.*
1977, 18, № 5, с. 1188-1191.
ОТ, интегрирование, несколько переменных, оценки снизу
314 Ч. С. Краткий исторический очерк и аннотированная библиография
Рассматривается задача интегрирования для класса Е скалярных функций
нескольких переменных. Информация — значения /. Показано, что оценка снизу
на погрешность в этой задаче зависит от оператора вложения Е в
пространство Lx. Показана взаимосвязь между задачами интегрирования и
аппроксимации.
Коэн, Варайя (Cohen A. I., Varaiya P.) Rate of convergence and optimality
conditions of root finding and optimality algorithms, Dept. of Electrical
Engineering and Computer Science Rep., Univ. of California, Berkeley,
California A970).
ОТ, нелинейные уравнения, одна переменная, несколько переменных,
максимальный порядок, одноточечные итерации, итерации с памятью
Рассматривается максимальный порядок итерационных методов решения
скалярных и векторных нелинейных уравнений / = 0. Информация — значения
функции / и ее производных в одной или в большем числе точек. Следуя
Винограду, авторы показывают, что иногда возможно, закодировав память
одним числом бесконечной точности, изменить максимальный порядок класса
алгоритмов. К определению порядка добавлено условие, гарантирующее, что
такая кодировка не повлияет на порядок. Найден максимальный порядок
некоторого класса алгоритмов.
Кролак, Купер Л. (Krolak P., Cooper L.) An extension of Fibonaccian search
to several variables, Comm. ACM 6 A963), 639—641.
ОТ, экстремум, несколько переменных
Рассматривается задача поиска максимума для класса непрерывных
унимодальных скалярных функций нескольких переменных. Информация
—значения /. Дан алгоритм, являющийся обобщением одномерного алгоритма поиска
Фибоначчи. Некоторые свойства оптимальности этого алгоритма доказаны
в работах Кролака: Property of the Krolak—Cooper extension of Fibonaccian
search, SI AM Rev. 8 A966), 510—517; Further extensions of Fibonaccian search
to nonlinear programming problems, SI AM J. Control 6 A968), 258—265.
Крылов В. И. Приближенное вычисление интегралов.— 2-е изд.— М.: Наука,
1967.—Гл. 11, с. 209—235.
ОТ, интегрирование, одна переменная, оптимальные точки инфорг^ации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций
с ограниченной в Lq производной порядка г. Информация — значения/.
Изучаются оптимальные веса и узлы квадратурных формул. Решение найдено для
малых г.
Кузовкин А. И., Тихомиров В. М. О количестве вычислений для нахождения
минимума выпуклой функции, ЭММ, 1967, 3, № 1, с. 95—103.
ОТ, экстремум, несколько переменных, оптимальные точки информации,
оптимальные алгоритмы, оценки точности
Рассматривается задача поиска минимума для класса скалярных выпуклых
функций нескольких переменных. Информация —значения /. Изучаются
оптимальные алгоритмы. Показано, что для отыскания е-аппроксимации
необходимо и достаточно произвести 0 (In e) вычислений значений функции и
арифметических операций.
Кунг (Kung Н. Т.) A bound on the multiplicative efficiency of iteration, Proc.
- 4th Ann. ACM Symp. Theory Comput. A972), 102—107. Revised paper in
JCSS 7 A973), 334—342.
ОТ, нелинейные уравнения, алгебраические числа, одна переменная,
оптимальные итерации, многоточечные итерации, итеративная сложность, максимальный
порядок
3. Аннотированная библиография 315
Доказано, что мультипликативный индекс эффективности итерации, с
помощью которой аппроксимируется алгебраическое число, ограничен сверху
единицей. Используемый метод доказательства позволяет избавиться от
ограничений, принятых в работе Пэтерсона [72]. Доказано, что максимальный порядок
любой последовательности, порожденной итерацией с М умножениями или
делениями, ограничен числом 2м.
Кунг (Kung Н. Т.) The computational complexity of algebraic numbers, Proc.
5th Ann. ACM Symp. Theory Comput., pp. 152—159 A973). Revised paper
in SIAM J. Numer. Anal 12 A975), 89—96.
ОТ, нелинейные уравнения, алгебраические числа, одна переменная,
оптимальные итерации, многоточечные итерации, итеративная сложность __
Определены два мультипликативных индекса эффективности Е и Е.
Доказано, что оба индекса ограничены единицей для любой итерации, с помощью
которой аппроксимируется данное алгебраическое число а. Показано, чго
если ?=1, то а рационально, а если Е=1, то а рационально или является
квадратичной иррациональностью.
Кунг (Kung H. Т.) On computing reciprocals of power series, Numer. Math. 22
A974), 341-348.
ОТ, метод Ньютона, формальные степенные ряды, быстрые алгоритмы,
алгебраическая сложность
Выдвигается идея использования метода Ньютона для быстрого обращения
формального степенного ряда. Показано, что сложность вычисления первых N
членов обращения не больше сложности перемножения двух многочленов
степени АЛ
Кунг (Kung H. Т.) Complexity of numerical computation, Proc. fnternat. Comput.
Symp. (E. Gelenbe and D. Potier, eds.), pp. 247—252. North-Holland Publ.,
Amsterdam, 1975.
ОТ, обзор, алгебраическая сложность, итеративная сложность
Обзор недавних исследований и задач по алгебраической и итеративной
сложности. Хорошая библиография.
Кунг (Kung H. Т.) The complexity of obtaining starting points for solving
operator equations by Newton's method, in "Analytic Computational Complexity"
(J. F. Traub, ed.), pp. 35—57. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, абстрактный случай, глобальная информация,
итеративная сложность, оценки снизу и сверху
Рассматриваются как сложность поиска начального приближения, так и
сложность итерации. Обсуждается вопрос об оптимальном времени
переключения от фазы поиска к итерационной фазе. Дана новая процедура
получения начальных точек для метода Ньютона.
Кунг (Kung H. Т.) Synchronized and asynchronous parallel algorithms for
multiprocessors, in "Algorithms and Complexity: New Directions and Recent
Results" (J. F. Traub, ed.), pp. 153—200. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, одна переменная, итерационные алгоритмы, асин-
хронность, параллельные алгоритмы, анализ среднего случая
Параллельные алгоритмы для мультипроцессоров разделяются на два
класса —синхронизированных и асинхронных алгоритмов. Определяются и
обсуждаются важные понятия, связанные с построением и анализом этих двух
типов алгоритмов. Рассмотрены три примера приложений: поиск нуля,
итерационные алгоритмы решения линейных систем и нелинейных скалярных
уравнений, адаптивные асинхронные алгоритмы. Обсуждается вопрос об
оптимальном числе процессоров. Хорошая библиография.
316 Ч. С. Краткий исторический очерк и аннотированная библиография
Кунг, Трауб (Kung Н. Т., Traub J. F.) Optimal order of one-point and
multipoint iterations, J. Assoc. Comput. mach. 21 A974), 643—651.
ОТ, нелинейные уравнения, одна переменная, многоточечные итерации,
максимальный порядок
Изучаются итерационные методы вычисления нулей нелинейных
скалярных функций /. Информация — значения функции / и ее производных. Построена
многоточечная итерация порядка 2п~г, использующая п вычислений.
Высказывается гипотеза, что порядок любой многоточечной итерации без памяти,
использующей эту информацию, не превосходит 2п~х.
Кунг, Трауб (Kung Н. Т., Traub J. F.) Computational complexity of one-
point and multipoint iteration, in "Complexity of Computation" (R. M. Karp, ed.),
SIAM — AMS Proc, Vol. 7, pp. 149—160. American Mathematical Society,
1974.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
одноточечные итерации, многоточечные итерации, итеративная сложность, оценки
снизу
Предложено при измерении сложности учитывать как комбинаторную, так
и информационную сложность. Определяется оптимальная сложность на классе
алгоритмов. Для некоторых семейств итераций получены оценки снизу и сверху
на оптимальную сложность.
Кунг, Трауб (Kung H. Т., Traub J. F.) Optimal order and efficiency with two
evaluations, S/AM J. Numer. Anal. 13 A976), 84—99.
ОТ, нелинейные уравнения, одна переменная, итеративная сложность,
максимальный порядок
Рассматриваются рациональные итерации без памяти для решения
скалярного нелинейного уравнения / = 0. Используемая информация—два значения
функции / или ее производных Доказано, что максимальный порядок равен
двум, и тем самым установлена справедливость при п — 2 гипотезы Кунга и
Трауба, утверждающей, что порядок итерации без памяти при использовании п
вычислений не превосходит 2п~1. Показано, что любая рациональная итерация
максимального порядка без памяти с двумя вычислениями использует либо два
значения /, либо одно значение / и одно значение /'. Для обоих этих случаев
определена минимальная комбинаторная сложность.
Кунг, Трауб (Kung H. Т., Traub J. F.) All algebraic functions can be
computed fast, У. Assoc. Comput. Mach. 25 A978), 245—260.
ОТ, формальные степенные ряды, метод Ньютона, многоугольник Ньютона,
быстрые алгоритмы, алгебраическая сложность
Показано, что, используя многоугольник Ньютона и метод Ньютона,
можно построить способ вычисления первых /V членов разложения в ряд
произвольной алгебраической функции, сложность которого не больше сложности
перемножения двух многочленов степени N.
Купер Дж., Вёрнер (Cooper G. J., Verner J. H.) Some explicit Runge — Kutta
methods of high order, SI AM J. Numer. Anal. 9 A972/, 389—405.
ОТ, дифференциальные уравнения, методы Рунге—Кутты
Рассматривается решение уравнения у' = [(у), где у и/ — векторы, явными
методами Рунге—Кутты. Информация — значения/. Изучаются методы Рунге—
Кутты высокого порядка.
Ларкин (Larkin F. M.) Optimal approximation in Hilbert space with
reproducing kernel functions, Math. Сотр. 24 A970), 911—921.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы
Рассматривается задача аппроксимации линейного функционала L для класса
скалярных функций, лежащего в гильбертовом пространстве с воспроизводящим
3. Аннотированная библиография 317
ядром. Информация —значения /. Оптимальные алгоритмы выражены через
элементы, определяющие функционалы. Найдены функции /, для которых L (/)
точно аппроксимируется оптимальным алгоритмом. Показано, что квадратурная
формула Гаусса близка к оптимальной квадратуре для задачи интегрирования
в классе аналитических функций в области | х | < г при больших г.
Левин А. Ю. Об одном алгоритме минимизации выпуклых функций, ДАН СССР,
1965, 160, № 6, с. 1244—1247.
ОТ, экстремум, несколько переменных, выпуклые функции, оценки сверху
Рассматривается задача поиска минимума для класса скалярных выпуклых
функций нескольких переменных, удовлетворяющих условию Липшица.
Информация— значения функции / и ее градиента. Приводится алгоритм,
отыскивающий 8-аппроксимацию и требующий вычисления О (In б) значений функции/
и ее градиента.
Левин М. И., Гиршович Ю. М. Экстремальные задачи для кубатурных
формул, ДАН СССР, 1977, 236, № 6, с. 1303—1306.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для некоторых классов функций
двух переменных с ограниченными в Lq производными. Информация—значения
функции f и ее производных. Найдены оптимальные линейные алгоритмы с
фиксированными и оптимальными точками информации и погрешности этих
алгоритмов.
Левин М. И., Гиршович Ю. М., Арро В. К. О наилучших на множествах
функций квадратурных формулах, ДАН СССР, 1976, 226, № 1, с. 51—54.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для некоторых классов скалярных
функций с ограниченной в Lq производной порядка г. Информация—значения
функции / и ее производных на концах отрезка интегрирования. Найдены
оптимальные линейные алгоритмы с оптимальными точками информации и их
погрешности.
Ли (Lee J. W.) Best quadrature formulas and splines, J. Approx. Theory 20
A977), 348-384.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для некоторого класса скалярных
функций. Информация —значения функции / и ее произво ных. Изучаются
оптимальные квадратурные формулы в смысле Сарда.
Лигун А. А. Точные неравенства для сплайн-функций и наилучшие
квадратурные формулы для некоторых классов функций, Мат. заметки, 1976, 19,
По 6, с. 913-926.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы, сплайны
Рассматривается задача интегрирования для класса периодических функций
с ограниченной r-й производной. Информация — значения /. Показано, что
квадратурная формула прямоугольников и равноотстоящие точки информации
оптимальны. Для случая оптимальных точек найдена погрешность. Доказательства
основаны на точных оценках k-й производной периодических сплайнов в
пространствах Орлича с равномерной нормой.
Липоу (Lipow P. R.) Spline functions and intermediate best quadrature formulas
SI AM J. Numer. Anal.. 10 A973), 127—136.
ОТ, интегрирование, одна переменная, оптимальные алгоритмы, сплайны
318 Ч. С. Краткий исторический очерк и аннотированная библиография
Рассматривается задача интегрирования для некоторого класса скалярных
функций. Информация—значения функции / и ее производных. Изучаются
оптимальные квадратурные формулы в смысле Сарда. Оптимальные- формулы
основываются на кардинальгых эрмитовых сплайнах.
Липсон (Lipson J.) Newton's method: A great algebraic algorithm, Proc. Symp.
Symbolic and Algebraic Compulation (R. D. Jenks, ed.), pp. 260—270.
Assoc. Com put. Mach., New York, 1976.
ОТ, формальные степенные ряды, метод Ньютона, быстрые алгоритмы,
алгебраическая сложность
Показано, что для «регулярной» задачи метод Ньютона можно
использовать для вычисления первых N членов разложения в ряд произвольной
алгебраической функции со сложностью, не превышающей сложности перемножения
двух многочленов степени N. См. также Кунг, Трауб [78].
Лоуб, Вернер (Loeb H. L., Werner M.) Optima) numerical quadrature in Hp
spaces, Math. Z. 138 A974), 111-117. F
ОТ, интегрирование, аналитические функции одна переменная, оптимальные
линейные алгоритмы, оценки сверху
Рассматривается задача интегрирования для класса Нр скалярных
аналитических функций на единичном круге. Информация —значения функции / и
ее производных в п точках. Доказано, что оценка сверху на минимальную
погрешность квадратурных формул есть примерно ехр (— сп), где с > 0.
Лушпай Н. Е. Наилучшие квадратурные формулы на некоторых классах
функций.— В кн.: Материалы межвузовской конференции молодых
ученых-математиков.— Харьков, 1966, с. 58—62. См. Лушпай [69].
Лушпай Н. Е. Наилучшие квадратурные формулы на классах
дифференцируемых периодических функций.— Мат. заметки, 1969, 6, № 4, с. 475—480.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса 2я-периодических
функций с ограниченной в Lq производной порядка г. Информация — значения
/, /', ...,/(?). Для ? = г—1, г =1,2, ..., найдены оптимальные узлы и веса
линейных квадратурных формул. Найдена также погрешность этого
оптимального линейного алгоритма.
Лушпай Н. Е. Наилучшая квадратурная формула на классе WrL2
периодических функций, Мат. заметки, 1974, 16, № 2, с. 193—204.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
оценки точности
Рассматривается задача интегрирования для класса периодических
функций, у которых г-я производная ограничена в L2 единицей. Информация —
значения /,/',..., /<?) в п точках. Для ^ = г-2и г—3 найдены линейные
оптимальные квадратурные формулы, Получены также оценки погрешности.
Майстровский Г. Д. Об оптимальности метода Ньютона, ДАН СССР, 1972,
204, № 6, с. 1313—1315,
ОТ, нелинейные уравнения, несколько переменных, метод Ньютона
Рассматривается задача решения нелинейного уравнения /=0 для класса
функций/: R"—> Rn с ограниченной константой Липшица. Информация —
значения / и /'. Предположим, что х0 —достаточно близкое к решению
начальное приближение. Показано, что тогда погрешность любого алгоритма,
использующего п произвольных значений / и /', не может быть существенно
меньше погрешности метода Ньютона после п шагов.
3, Аннотированная библиография ЗН)
Мангасарян, Шумейкер (Mangasarian О. L.. Schumaker L. L.) Best summation
formulae and discrete splines, SlAM J. Numer. Anal. 10 A973), 448—459.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы, сплайны
Рассматривается задача аппроксимации линейного функционала,
определенного на конечномерном функциональном пространстве.
Информация—значения /. Изучаются оптимальные алгоритмы в смысле Сарда. Задача сводится
к разрешимой задаче линейного или квадратичного программирования.
Показано, что дискретные моносплайны связаны с оптимальными алгоритмами.
Марчук А. Г., Осипенко К. Ю. Наилучшее приближение функций, заданных
с погрешностью в конечном числе точек", Мат. заметки, 1975, 17, № 3,
с. 359-368.
ОТ, аппроксимация линейных функционалов, оптимальные линейные алгоритмы
Рассматривается вопрос об аппроксимации линейного функционала для
заданного класса задач. Информация—значения линейных функционалов,
заданные с погрешностью. Построен линейный оптимальный по точности
алгоритм. Это—обобщение леммы Смоляка.
Маунг Чжо Ньюн, Шарыгин И. Ф. (Maung C2o Njun). Оптимальные кубатур-
ные формулы на классах D\ с и D\' **.— В кн.: Вопросы вычислительной
и прикладной математики.— Ташкент, 1971, вып. 5, с. 22—27.
ОТ, интегрирование, несколько переменных, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для двух классов скалярных
функций с ограниченной первой производной, зависящих от двух и s
переменных соответственно. Информация—значения /. Построены асимптотически
оптимальные линейные алгоритмы.
Меерсман (Meersman R.) Optimal use of information in certain iterative
processes, in "Analytic Computational Complexity" (J. F. Traub, ed.), pp. 109—
125. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, одна переменная, итеративная информация,
порядок информации, многоточечные итерации
Изучается максимальный порядок многоточечных итераций для решения
скалярного нелинейного уравнения / = 0. Информация—п значений функции/
или ее производных. В случае я = 3 установлена справедливость гипотезы
Кунга—Трауба о том, что максимальный порядок ограничен числом 2й-*.
При л —3 найдены все виды оптимальной информации.
Меерсман (Meersman R.) On maximal order of families of iterations for nonlinear
equations, Doctoral Thesis, Vrije Univ. Brussel, Brussels, 1976.
ОТ, нелинейные уравнения, одна переменная, эрмитова информация, порядок
информации, многоточечные итерации без памяти, итеративная сложность
Рассматриваются вопросы итеративного решения нелинейных скалярных
уравнений. Информация —значения функции f и ее производных. Изучаются
гипотеза о многоточечных итерациях без памяти с п вычислениями. Доказано,
что гипотеза Кунга —Трауба справедлива при п~3 для различных классов
информационных операторов.
Мейерз, Сард (Meyers L. F., Sard A.) Best approximate integration formulas,
Л Math. Phys. 28 A950), 118—123.
ОТ, интегрирование, одна переменная, оптимальные алгоритмы
Рассматривается задача интегрирования для класса' скалярных т раз
дифференцируемых функций. Информация —значения / в л точках. Для малых
т и некоторых значений п получены оптимальные квадратурные формулы в
смысле Сарда.
320 Ч. С. Краткий исторический очерк и аннотированная библиография
Мейерз, Сард (Meyers L. F., Sard A.) Best interpolation formulas, J. Math.
Phys. 29 A950), 198-206.
ОТ, интерполяция, одна переменная, оптимальные алгоришы
Рассматривается -задача интерполяции для класса скалярных т раз
дифференцируемых функций. Информация —значения / в п точках. Для малых п
и т получены оптимальные алгоритмы в смысле Сарда.
Мелкмэн (Melkman A. A.) «-Widths and optimal interpolation of time- and
band-limited functions, in "Optimal Estimation in Approximation Theory"
(C. A. Micchelli and T. J. Rivlin, eds.). pp. 55—68. Plenum Press, New
York, 1977.
ОТ, интерполяция, оптимальные точки информации, /г-поперечники
Рассматривается задача оптимального восстановления функций,
принадлежащих некоторому подмножеству класса целых функций Пэли—Винера.
Информация—значения /. Найден линейный оптимальный по точности алгоритм.
Изучаются оптимальные точки информации. Погрешность при оптимальных
точках равна n-поперечнику рассматриваемого подмножества; п-поперечники
найдены для более широкого множества функций /, таких что J^j > T\ f (t) | 2 dt^
<ег» Х|а>| >б 1 /И |2Жо<г)ст, где /"—преобразование Фурье (,ъТугт, а,
•нефиксированные числа.
Мелкмэн, Миккелли (Melkman A. A., MicchelM С. A.) Optimal estimation of
linear operators in Hilbert spaces from inaccurate data. Univ. Bonn Rep.
A977). See also SIAM J. Num. Anal 16 A979), 87—105.
ОТ, аппроксимация линейных операторов, оптимальные линейные алгоритмы
Рассматривается задача аппроксимации линейного оператора для
некоторого класса в гильбертовом пространстве. Информация —значения
информационного оператора, вычисляемые с погрешностью. Найдены линейные
оптимальные по точности алгоритмы.
Менге (Menguet J.) Optimal approximation and error bounds in seminormed
spaces, Numer, Math. 10 A967), 370—388.
ОТ, аппроксимация линейных функционалов
Рассматривается задача аппроксимации линейного функционала на задан-
лом классе. Информация —значения п линейных функционалов. Найдено
множество возможных значений функционала при заданной информации.
Миккелли (Micchelli С. A.) Optimal estimation of linear functionals, IBM
Research Rep. 572Э A975).
ОТ, аппроксимация линейных функционалов и линейных операторов,
оптимальные линейные алгоритмы
Рассматривается задача аппроксимации линейного функционала или
оператора на уравновешенном выпуклом множестве. Информация—значение
некоторого линейного оператора, вычисляемое приближенно. Изучается вопрос о
существовании линейных оптимальных по точности алгоритмов.
Миккелли (Micchelli С. A). On an optimal method for numerical differentiation
of smooth functions, J. Approx. Theory 18 A976), 189—204.
ОТ, дифференцирование, оптимальные линейные алгоритмы
Рассматривается задача аппроксимации производной /' @) для класса
функций /, таких что || L/1| ^7» r^e ? —полиномиальный дифференциальный
оператор, а у— консгаита. Информация —значения f в бесконечном числе точек,
вычисляемые с ошибками. Получен линейный оптимальный по точности алгоритм.
Миккелли, Мирэнкер (Micchelli С. A., Miranker W. L.) High order search
methods for finding roots, J. Assoc. Comput. Mach. 22 A975), 51—60.
3. Аннотированная библиография 321
ОТ, нелинейные уравнения, одна переменная, глобально сходящиеся итерации,
порядок
Определяются и анализируются глобально сходящиеся поисковые методы
высокого порядка для решения нелинейного скалярного уравнения / = 0.
Информация— значения / и глобальные оценки на некоторые производные. Найден
порядок сходимости этих методов.
Миккелли, Пинкус (Micchelli С. A., Pinkus A.) On a best estimator for the
classe Mr using only function values, Indiana Univ. Math, J. 26 A977),
751—759.
ОТ, аппроксимация, оптимальные точки информации, оптимальные линейные
алгоритмы, сплайны, я-поперечники
Рассматривается задача аппроксимации для класса функций /(*) = Р(*)+
+((а—I)!)-1 \ (х—t)r+l cTkj(t)f где Р — многочлен степени не выше г, а для
полной вариации функции Xf выполняется неравенство ||fy[|^l.
Информация— значения /. Показано, что оптимальный в Lx по точности алгоритм есгь
интерполяционный сплайн. При оптимальных точках информации погрешность
равна я-поперечнику по Колмогорову рассматриваемого класса.
Миккелли, Ривлин (ред.) (Micchelli С. A., Rivlin Т. J.) "Optimal Estimation
in Approximation Theory". Plenum Press, New York, 1977.
ОТ, аппроксимация
Это Труды Международного симпозиума по оптимальным оценкам в
теории аппроксимации, состоявшегося в 1976 г. Много интересных работ (см.
Миккелли, Ривлин [77], Мелкмэн [77], де Бур [77], Голомб [77]).
Миккелли, Ривлин (Micchelli С. A., Rivlin Т. J.). A survey of optimal reco
very, jn "Optimal Estimation in Approximation Theory" (C. A. Micchelli
and T. J. Rivlin, eds.), pp. 1—54. Plenum Press, New York, 1977.
ОТ, аппроксимация линейных операторов, оптимальные поточности алгоритмы,
оптимальные линейные алгоритмы
Рассматривается задача оптимальной аппроксимации линейного оператора U
для уравновешенного выпуклого класса /(. Информация — значение некоторого
линейного оператора /, вычисляемое с погрешностью. Изучаются оптимальные
по точности алгоритмы. В предположении, что (У —функционал, подробно
изучены вопросы существования и свойства линейных оптимальных по
точности алгоритмов (конечномерность / не предполагается). Высказанные идеи
иллюстрируются многочисленными полезными примерами. Показано, что во
многих случаях сплайны являются основным инструментом решения задач
оптимального восстановления.
Миккелли, Ривлин (Micchelli С. A., Rivlin T. J.) Optimal recovery of best
approximations, IBM T. J. Watson Research Center Rep. 7071 A978). See
also Resultate der Math., 3 A980), 25—38.
ОТ, аппроксимация, оптимальные по точности алгоритмы
Рассматривается построение наилучшего полиномиального равномерного
приближения для функции из класса непрерывных функций, ограниченных
в равномерной норме единицей. Информация — значения /, вычисляемые
приближенно. Найдены оптимальный по точности алгоритм и его погрешность
Миккелли, Ривлин, Виноград (Micchelli С. A., Rivlin Т. J., Winograd S.)
The optimal recovery of smooth functions, Numer. Math. 26 A976), 191—200
ОТ; аппроксимация, оптимальные по точности алгоритмы, сплайны
Рассматривается задача аппроксимации для класса скалярных функций
с ограниченной в /,«, производной порядка k. Информация — значения
функции / и ее производных. Показано, что погрешность аппроксимации некото
11 № 664
322 */. С Краткий исторический очерк и аннотированная библиография
рым интерполяционным сплайном близка к погрешности линейного
оптимального по точности алгоритма. Даны оценки оптимальной погрешности.
Мирэнкер (Miranker W. L ) A survey of parallelism in numerical analysis,
SJAM Rev., 12 A971), 524—547.
ОТ, обзор, нелинейные уравнения и экстремум, одна переменная,
параллельные алгоритмы
Обзор по параллельным алгоритмам для вычислительных задач. Среди
рассматриваемых направлений —решение нелинейных уравнений и
оптимизация. Хорошая библиография.
Моторный В. П. О наилучшей квадратурной формуле вида 2i?=i Pkf (xk) Для
некоторых классов периодических дифференцируемых функций, ДАН СССР,
1973, 211, № 5, с. 1060—1062.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Анонсируются результаты, доказательства которых приведены в работе
Моторного [/4].
Моторный В. П. О наилучшей квадратурной формуле вида 2f=i Pif (xi) для
некоторых классов периодических дифференцируемых функций, Изв. АН
СССР, сер. мат., 1974, 38, № 3, с. 583—614.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса периодических ска-
лярных функций, у которых модуль непрерывности r-й производной
ограничен. Информация—значения /. Изучаются оптимальные точки информации и
оптимальные квадратурные формулы. Для трех классов функций доказана
оптимальность формулы прямоугольников с равноотстоящими узлами.
Моторный В. П. Некоторые экстремальные задачи теории квадратур и
приближения функций, Мат. заметки, 1976, 19, № 2, с. 299 — 311.
ОТ, интегрирование, аппроксимация, одна переменная, периодические функции
Это —резюме докторской диссертации. Содержит обзор результатов по
квадратурам и аппроксимации для нескольких классов периодических
дифференцируемых функций. Хорошая библиография работ советских авторов.
Моцкус Й. Б. О байесовых методах поиска экстремума, Автоматика и. вычисл.
техн., 1972, № 3, с. 53 — 62.
ОТ, экстремум, одна переменная, оптимальные байесовы алгоритмы
Рассматривается задача поиска минимума для некоторого класса
скалярных функций. Определены оптимальные байесовы алгоритмы.
Мэнсфилд (Mansfield L. E.) On the optimal approximation of linear functional
in spaces of bivariate functions, SIAM У. Numer. Anal. 8 A971), 115 — 126.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы
Рассматривается задача аппроксимации линейного функционала для
некоторого класса функций двух переменных, лежащего в гильбертовом
пространстве. Информация—значения_л линейных функционалов. Оптимальные
алгоритмы выражены через элементы, определяющие соответствующие функционалы.
Рассмотрены приложения к задаче интегрирования.
Мэнсфилд (Mansfield L. E.) Optimal approximation and error bounds in spaces
of bivariate functions, J. Approx. Theory 5 A972), 77—96.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы
Рассматривается задача аппроксимации линейного функционала для
некоторого класса скалярных функций двух переменных, лежащего в гильбертовом
S. Аннотированная библиография 323
пространстве с воспроизводящим ядром. Информация —значения п линейных
функционалов. Оптимальные алгоритмы и оценки точности выражены через
элементы, определяющие эти функционалы. Рассмотрены приложения к задаче
интегрирования. Указаны связи со сплайнами двух переменных.
Никольский С. М. К вопросу об оценках приближений квадратурными
формулами, У МИ, 1950, 5, № 2, с. 165 — 177.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
В этой классической работе рассматривается задача интегрирования для
класса скалярных функций, у которых r-я производная ограничена в Lp
некоторой константой. Информация — значения /, /', ..., /(?> в п точках.
Определены оптимальные линейные квадратурные формулы. Для г=1, 2 и для
произвольного г при ? = /•—2 найдены узлы и веса оптимальной квадратурной
формулы.
Никольский С. М. Квадратурные формулы.— М.: Физматгиз, 1958; 3-е изд.,
1979.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
В этой классической книге вводятся оптимальные на классе функций
линейные квадратурные формулы. Информация — значения Д /', ..., /(?>.
Найдены оптимальные точки информации для класса функций с ограниченной
в Ьж производной порядка г при малых г или ?=г— 2.
Нильсон Г. (Nielson G. M.) Bivariate spline functions and the approximation
of linear functional, Numer. Math. 21 A973), 138—160.
ОТ, аппроксимация линейных функционалов, сплайны
Рассматривается задача аппроксимации линейного функционала для
некоторого класса скалярных функций двух переменных, лежащего в
гильбертовом пространстве. Информация —значения п линейных функционалов.
Показано, что построение линейных оптимальных алгоритмов основывается на
интерполяционных сплайнах двух переменных.
Ньюмэн (Newman D. J.) Location of the maximum on unimodal surfaces, /. Assoc,
Comput. Mack. 12 A965), 395—398.
ОТ, экстремум, несколько переменных, асимптотически оптимальные алгоритмы
Рассматривается задача поиска максимума на решетке точек для класса
скалярных унимодальных функций k переменных. Информация—значения /.
Показано, что число вычислений значений функции, достаточное для решения
задачи на решетке из (n+\)k точек, асимптотически равно log п.
Обэн (Aubin J. P.) Best approximation of linear operators in Hilbert spaces
SI AM J. Numer. Anal. 5 A968), 518—521.
ОТ, аппроксимация линейных операторов
Для единичного шара рассматривается задача аппроксимации линейного
оператора: А:Е—> F\ E, F — гильбертовы пространства. Информационным
оператором является заданный линейный оператор rn: E—> Еп. Для заданного
линейного оператора sn: F —> Fn оператор А аппроксимируется линейным
оператором Ап\ Еп—> Fn, таким что \\Anrnu — snAu\\F минимизируется при
IIй III? ^ 1- Решение получено в терминах оператора «наилучшей интерполяции».
Ортега, Рейнболдт (Ortega J. M., Rheinboldt W. С.) Итерационные методы
решения нелинейных систем уравнений со многими неизвестными.—М.:
Мир, 1975 A970).
математика, нелинейные уравнения, несколько переменных, порядок
324 Ч. С. Краткий исторический очерк и аннотированная библиография
В этой монографии для л-мерного случая дается обзор основных
теоретических результатов по нелинейным уравнениям. Анализируется много
итерационных методов. Хорошая библиография.
Осипенко К. Ю. Оптимальная интерполяция аналитических функций, Мат.
заметки, 1972, 12, № 4, с. 465 — 476.
ОТ, интерполяция, аналитические функции, одна переменная, оптимальные
точки информации, оптимальные линейные алгоритмы
Рассматривается задача интерполяции для класса вещественных
скалярных функций на [а, Ь], которые допускают аналитическое продолжение на
некоторую область G, ограниченное по модулю константой. Информация —
значения / в п точках. С помощью леммы Смоляка получен линейный
оптимальный по точности алгоритм и найдена его погрешность. Рассматриваются
оптимальные точки информации. Если G —единичный круг, то оптимальные точки
определяются с помощью эллиптических функций. Если G—эллипс с фокусами
±1 и суммой полуосей, равной с, то оптимальные точки являются нулями
многочлена Чебышёва, а погрешность равна приблизительно с~п.
Осипенко К. Ю. Наилучшее приближение аналитических функций по
информации об их значениях в конечном числе точек, Мат. заметки, 1976, 19,
№ 1, с. 29 — 40.
ОТ, аппроксимация линейных функционалов, аналитические функции, одна
переменная, оптимальные линейные алгоритмы
Лемма Смоляка обобщена на комплекс 1ый случай. Определен линейный
оптимальный по точности алгоритм аппроксимации линейного комплексного
функционала. Рассматривается задача аппроксимации аналитических
скалярных функций. Результаты связаны с результатами работы Осипенко [72].
Островский (Ostrowski A.) "Solution of Equations in Euclidean and Banach
Spaces", 3rd ed. Academic Press, New York, 1973.
математика, нелинейные уравнения, одна переменная, несколько переменных,
абстрактный случай, итерационные алгоритмы, одноточечные итерации,
итерации с памятью, порядок, метод Ньютона, метод секущих
Монография по численному решению нелинейных уравнений. Содержит
богатый материал по сходимости и порядку итерационных методов и обзор
теории численного решения уравнений.
Паллашке (Pallaschke D.) Optimale Differentiations- und Integrationsformeln in
C0[a, b], Numer. Math. 16 A976), 201—210.
ОТ, дифференцирование, интегрирование, одна переменная, оптимальные
алгоритмы
Рассматриваются задачи дифференцирования и интегрирования для класса
скалярных непрерывных функций. Информация—-значения /. Найдены
оптимальные алгоритмы.
Паркер (Parker D. S., jr.) Studies in conjugation: Huffman tree construction,
nonlinear recurrences, and permutations networks, Dept. of Computer Science
Rep, UIUCDCS-R-78-930, Ph. D. Thesis, Univ. of Illinois A978).
ОТ, подстановка, формальные степенные ряды, быстрые алгоритмы,
параллельные алгоритмы
Рассматривается .вычисление нелинейных рекуррентных выражений с
помощью многопроцессорной вычислительной системы. Изучаются вопрос о
существовании такого преобразования, которое делает эту задачу легкой, и вопрос
об автоматной вычислимости такого преобразования.
Паулик (Paulik A.) Zur Existenz optimaler Quadraturformeln rnit freien Knoten
bei Integration analytischer Funktionen, Numer, Math. 27 A977), 395 — 405.
3, Аннотированная библиография 325
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса аналитических
скалярных функций на окружности. Информация — значения /. При
фиксированных точках информации найдены оптимальные квадратуры и их погрешности.
Установлено существование оптимальных точек.
Пашковский (Paszkowski S.) Optimum choice of initial approximations in
interpolation methods of solving equations, Zastos. Mat. 12 A971), 201—216.
ОТ, нелинейные уравнения, одна переменная, интерполяционные итерации,
оптимальные начальные приближения
Рассматривается итеративное решение нелинейного скалярного уравнения
/ = 0. Информация — значения / Изучается вопрос об оптимальном выборе
начальных приближений для интерполяционных итераций. Показано, что эта
задача эквивалентна задаче минимизации равномерной нормы функции
Ц?=о Iх—ai 1&* п0 ai ПРИ *?[—^» *1 и фиксированных положительных Ь[.
Пинкус (Pinkus A.) Asymptotic minimum norm quadrature formulae, Numer.
Math. 24 A975), 163—175.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций, ограниченных по модулю единицей, в заданной комплексной
области В. Информация—значения функции / и ее производных. Изучаются
оптимальные веса и узлы линейных квадратурных формул. Показано, что при
расширении В до полной комплексной плоскости оптимальные веса и узлы
стремятся к весам и узлам квадратуры Гаусса.
Пиявский С. А. Один алгоритм отыскания абсолютного экстремума функции,
ЖВМ и МФ, 1972, 12, № 4, с. 888-896.
ОТ, экстремум, несколько переменных
Рассматривается один алгоритм отыскания минимума для класса функций
f\X—> R, где X—компакт, таких что существует функция g:XxX—> R,
для которой / (х) ^ g (х, у) Vat, у ? X. (Если / удовлетворяет условию Липшица
\f(x)-f(y)\<L\\x-y\\, то Я(*. У) = /(У)-М||*-0|| при M^L.)
Информацией о функции / является функция g. При реализации алгоритма требуется
находить глобальный минимум функции max0 ^ ;. <kg (x, у.) при различных
Уъ ••¦* Uk- В скалярном случае анализ эффективности этого алгоритма
проведен в работе Данилина [71], где доказана его оптимальность с точностью до
множителя 3.
Плешаков Г. Н. Об эффективности многомерных интерполяционных итераций,
ЖВМ и МФ, 1977, 17, № 5, с. 1153—1160.
ОТ, нелинейные уравнения, многомерные интерполяционные итерации
Рассматривается решение системы п нелинейных уравнений с п
неизвестными / = 0. Информация —значения /. Изучаются обратные интерполяционные
итерации с памятью. (Похоже, что не сделано необходимое предположение о
допустимом расположении итерационных точек.) Обсуждается вопрос об индексе
эффективности Островского.
Пэтерсон (Paterson M. S.) Efficient iterations for algebraic numbers, in
"Complexity of Computer Computations" (R. E. Miller and J.W.Thatcher, eds.),
pp. 41—52. Plenum Press, New York, 1972.
ОТ, нелинейные уравнения, алгебраические числа, одна переменная,
оптимальная итерация, одноточечные итерации, итеративная сложность
Ставится вопрос об оптимальном итерационном методе приближения
алгебраических чисел. Доказано, что мультипликативный индекс эффективности
(величина, обратная к индексу сложности) должен быть ограничен сверху
326 Ч. С. Краткий исторический очерк и аннотированная библиография
единицей. В доказательстве используются результаты из теории чисел.
Выдвинуто несколько гипотез, относящихся к вопросу об оптимальной эффективности.
Райнш (Reinsch Ch.) Two extensions of the Sard—Schoenberg theory of best
approximation, SI AM /. Numer. Anal. 11 A974), 45—51.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы, сплайны
Рассматривается задача аппроксимации линейного функционала на
некотором классе функций. Информация —значения функции / и ее производных.
Получены оптимальные алгоритмы, основанные на натуральных или
периодических сплайнах. Результаты переносятся на случай гильбертова пространства
и на задачу сглаживания.
Райе (Rice J. R.) "The Approximation of Functions", Vol. II, Chapter 10.
Addison-Wesley, Reading, Massachusetts, 1969.
ОТ и математика, аппроксимация линейных функционалов, оптимальные по
точности алгоритмы
В числе других задач рассматривается задача аппроксимации линейного
функционала на шаре в гильбертовом пространстве. Информация —значения п
линейных функционалов. С помощью сплайнов построены оптимальные по
точности алгоритмы.
Райе (Rice J. R.) Matrix representations of nonlinear equation iterations —
Application to parallel computation, Math. Сотр. 25 A971), 639—647.
ОТ, нелинейные уравнения, одна переменная, итерационные алгоритмы,
параллельные алгоритмы, порядок, интерполяционные итерации, суперпозиция
Выдвигается идея матричного представления итерационных методов
решения нелинейных уравнений. Результаты применяются к анализу итераций,
полезных при параллельных вычислениях. См. также Фелдстайн, Трауб [77].
Райе (Rice J. R.) On the computational complexity of approximation operators,
in "Approximation Theory" (G. G. Lorenzt, ed.), pp. 449—456. Academic
Press, New York, 1973. См. Райе [76].
Райе (Rice J. R.) On the computational complexity of approximation operators.
II, in "Analytic Computational Complexity" (J. F. Traub, ed.), pp. 191—204.
Academic Press, New York, 1976.
ОТ, аппроксимация, оптимальные точки информации, оптимальные алгоритмы
Продолжение работы Райе [73]. Рассматривается задача- аппроксимации
скалярных р раз дифференцируемых или аналитических функций.
Информация— значения /. Предполагается, что учитываются только операции
вычисления значений /. Изучается асимптотика числа значений, вычисление
которых необходимо для построения аппроксимации с погрешностью,
пропорциональной погрешности наилучшей полиномиальной аппроксимации, для
различных классов функций.
Риссанен (Rissanen J.) Maximum power feedback law, Internal. J. Control
14 A971), 233—240.
ОТ, нелинейные уравнения, одна переменная, итеративная информация, теория
управления, максимальный порядок
Рассматривается итеративное решение некоторых встречающихся в теории
управления скалярных нелинейных уравнений. С помощью процесез
линеаризации получен итерационный алгоритм. Показано, что при выполнении
некоторых начальных условий порядок этого алгоритма равен примерно 1.55.
Доказано, что это «наиболее мощный» алгоритм среди всех гладких
алгоритмов, использующих ту же самую информацию.
Риссанен (Rissanen J.) On optimum root-finding algorithms, J. Math. Anal,
Appl. 36 A971), 220—225,
3. Аннотированная библиография 327
ОТ, нелинейные уравнения, одна переменная, максимальный порядок
Рассматривается вопрос о максимальном порядке алгоритмов решения
скалярных нелинейных уравнений. Доказано, что порядок метода секущих
максимален среди порядков всех алгоритмов, использующих ту же
информацию, что и метод секущих.
Риттер (Ritter К.) Two-dimensional spline functions and best approximations
of linear functionals, J. Approx. Theory 3 A970), 352—368.
ОТ, аппроксимация линейных функционалов, оптимальные алгоритмы, сплайны
Рассматривается задача аппроксимации линейного функционапа для
некоторого класса скалярных функций двух переменных. Информация —значения
функции f и ее частных производных. Изучаются оптимальные алгоритмы
в смысле Сарда. Выявлена связь с двумерными интерполяционными сплайнами.
Рихтер (Richter N.) Properties of minimal integration rules, SIAM J. Numer.
Anal, 7 A970), 67-79.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций, лежащего в гильбертовом пространстве.
Информация—значения /. Доказано существование оптимальных квадратурных формул.
Изучаются свойства весов и узлов оптимальной квадратуры. См. также N. Richter-
Din, Properties of minimal integration rules. II. SI AM J. Numer. Anal. 8 A971),
497-508.
Ри.;тер-Дин (Richter-Dyn N.) Minimal interpolation and approximation in
Hilbert spaces, SIAM J. Numer. Anal. 8 A971), 583—597.
ОТ, аппроксимация линейных функционалов, оптимальные линейные алгоритмы
Рассматривается задача аппроксимации линейного функционала для
некоторого класса скалярных функций, лежащего в гильбертовом пространстве
с воспроизводящим ядром. Информация —значения /. Изучаются оптимальные
линейные алгоритмы. Рассмотрены приложения к задаче интегрирования.
Саари, Саймон (Saari D. G., Simon СР.) Effective price mechanisms, Econo-
metrica 46 A978), 1097—1125.
ОТ, экономическое равновесие, нелинейные уравнения, несколько переменных,
итеративная информация, одноточечные итерации
Рассматривается вопрос о том, сколько информации необходимо для
обеспечения сходимости механизма цен к состоянию экономического равновесия.
Среди полученных результатов содержится следующий. Пусть (У—открытое
множество в Rn, a /: U —> Rn—функция избыточного спроса. Тогда в любом
«локально эффективном процессе регулирования цен» требуется вычислять
/ и /'. Этот результат следует из теоремы 4.2 работы Трауба, Вожьняков-
ского [76] (Optimal linear information for the solution of nonlinear operator
equations).
Сард (Sard A.) Best approximate integration formulas; Best approximation
formulas, Amer. J. Math. 71 A949), 80-91.
ОТ, интегрирование, аппроксимация линейных функционалов, одна
переменная, оптимальные линейные алгоритмы
По-видимому, это первая работа, в которой обсуждаются оптимальные
алгоритмы. Рассматривается задача интегрирования для класса скалярных т
раз дифференцируемых функций. Информация —значения / в п
фиксированных точках t{. Остаточный член квадратурной формулы ^%if (t[) ki порядка
т — 1 можно записать в виде ? /(ш) (/) k (t) dt} где ядро k зависит лишь от
328. Ч. С. Краткий исторический очерк и аннотированная библиография
весов и узлов квадратурной формулы. Квадратурная формула называется
с ь
наилучшей (теперь говорят «наилучшей в смысле Сарда»), если \ k2(t)dt
достигает минимума по весам /?/. Проблема решена только для малых пит.
Обсуждается вопрос о распространении полученных результатов на задачу
аппроксимации линейных функционалов.
Сард (Sard A.) "Linear Approximation", Amer. Math. Soc, Providence, Rhode
Island, 1963.
математика и ОТ, аппроксимация, интегрирование, одна переменная
В числе других задач рассматривается задача интегрирования для
некоторого класса скалярных функций. Информация—значения функции / и ее
производных. Обсуждается вопрос об оптимальных квадратурных формулах
. в смысле Сарда.
Сард (Sard A.) Optimal approximation, J. Fund. Anal. 1 A967), 222—244.
ОТ, аппроксимация линейных операторов, оптимальные алгоритмы
Рассматривается вопрос об аппроксимации линейного оператора для
некоторого класса задач. Информационный оператор задан при помощи п
линейных операторов. Изучаются оптимальные линейные алгоритмы.
Это—обобщение работы Сард [49]. См. также A. Sard, Optimal approximation: An
addendum, /. Fund. Anal. 2 A968), 368—369.
Сард (Sard A.) Approximation based on nonscalar observations, /. Approx.
Theory 8 A973), 315—334.
ОТ, аппроксимация линейных операторов, сплайны
Рассматривается задача аппроксимации линейного оператора на
некотором классе элементов. Информация —некоторый линейный оператор.
Изучается аппроксимация сплайнами. Это —продолжение работы Сард [67].
Сард, Вайнтрауб (Sard, A., Weintrauh S.) "A Book of Splines". Wiley, New
York, 1971.
ОТ, сплайны
Обзор теории аппроксимации сплайнами. Построены оптимальные
аппроксимации для функции, ее производной или ее интеграла.
Информация—значения / в регулярно расположенных точках. Дается программа на Фортране
для аппроксимации сплайнами. В ряде случаев найдены кардинальные сплайны.
Хорошая библиография.
Секрест (Secrest D.) Numerical integration of arbitrarily spaced data and
estimation of errors, SI AM J. Numer. Anal. Ser. В 2 A964), 52—68.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций,
у которых r-я производная ограничена в Lp некоторой константой.
Информация—значения /. Найдены оптимальные по точности квадратурные формулы.
Секрест (Secrest D.) Frror bounds for interpolation and differentiation by the
use of spline functions, SIAM J. Numer. Anal. Ser. В 2 A965), 440—447.
ОТ, аппроксимация линейных функционалов, оптимальные по точности
алгоритмы, оценки точности
Рассматривается задача аппроксимации линейного функционала для класса
скалярных функций, у которых п-я производная ограничена в L2 константой.
Информация —значения /. Оптимальные по точности алгоритмы выражены
через натуральные сплайны. Даны оптимальные оценки точности для задач
интерполяции и дифференцирования.
Секрест (Secrest D.) Best approximate integration formulas and best error bounds,
Math. Сотр. 19 A965), 79-83.
3. Аннотированная библиография 329
ОТ, интегрирование, одна переменная, оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций,
у которых п-я производная ограничена в L2 некоторой константой.
Информация— значения f. Оптимальные алгоритмы и их погрешности выражены
через натуральные сплайны.
Сивкинг (Sieveking M.) An algorithm for division of power series, Computing
10 A972), 153—156.
ОТ, формальные степенные ряды, быстрые алгоритмы
Дается быстрый алгоритм вычисления частного двух степенных рядов.
См. также Кунг [74J.
Смоляк С. А., Интерполяционные и квадратурные формулы на классах
W? и Е? , ДАН СССР, 1960, 131, № 5, с. 1028—1031.
ОТ, интерполяция, интегрирование, несколько переменных, оценки снизу
Рассматриваются задачи интерполяции и интегрирования для двух
классов Wf и Ef комплексных периодических функций, зависящих от s
переменных, с ограниченными коэффициентами Фурье. Информация—значения /
в п точках. При оптимальных точках информации получены оценки
погрешности снизу и сверху. Для простых п оценка сверху точна.
Смоляк С. А. Об оптимальном восстановлении функций и функционалов от
них.— Канд. дисс. МГУ, 1965.
ОТ, аппроксимация линейных функционалов, оптимальные линейные алгоритмы
Это—диссертация, результаты которой в дальнейшем не были
опубликованы и с текстом которой мы не имели возможности ознакомиться.
Рассматривается задача аппроксимации линейного функционала для заданного
уравновешенного выпуклого класса функций. Информация —значения п линейных
функционалов. Доказано существование линейного оптимального по точности
алгоритма. Доказательство можно найти в работе Бахвалова [71] (Об
оптимальности линейных методов приближения операторов на выпуклых классах
функций).
Соболев С. Л. О порядке сходимости кубатуриых формул, ДАН СССР, 1965,
162, № 5, с. 1005—1008.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оптимальные линейные алгоритмы, оценки снизу и сверху
Рассматривается задача интегрирования для класса скалярных функций s
переменных с ограниченными в L2 производными до порядка г. Информация —
значения / в п точках. Показано, что погрешность оптимальной кубатурной
формулы равна примерно nmls.
Соболев С. Л. Введение в теорию кубатурных формул.—М.: Наука, 1974.
ОТ и математика, интегрирование, несколько переменных, оптимальные
линейные алгоритмы
В числе других рассматривается задача интегрирования для класса
скалярных функций нескольких переменных с ограниченной в L2 производной
порядка г. Информация — значения /. Получена оценка снизу погрешности для
задачи интегрирования. Изучаются оптимальные точки информации.
Соболь И. М. Многомерные квадратурные формулы и функции Хаара.— М.:
Наука, 1969.
ОТ, интегрирование, несколько переменных
Рассматривается задача интегрирования скалярных функций от нескольких
переменных, принадлежащих классу функций Фурье—Хаара с ограниченными
330 Ч. С. Краткий исторический очерк и аннотированная библиография
коэффициентами. Информация—значения /. Изучаются оптимальные или
близкие к оптимальным квадратурные формулы. Найдена погрешность.
Стенгер (Stenger F.) Optimal convergence of minimum norm approximations
in Hp, Numer. Math. 29 A978), 345—362.
ОТ, интегрирование, аппроксимация, аналитические функции, одна переменная,
оптимальные линейные алгоритмы, оценки снизу и сверху
Рассматриваются задачи интегрирования и аппроксимации для класса Нр
скалярных аналитических функций на единичном круге. Информация — значения
f в п точках. Доказано, что в обеих задачах минимальная погрешность
линейных алгоритмов равна примерно ехр (—сУ~п), где с > 0.
Стеттер (Stetter F.) On best quadrature of analytic, functions, Quart. Appl.
Math. 27 A969), 270—272,
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
линейные алгоритмы, оценки сверху
Рассматривается задача интегрирования для класса скалярных
аналитических функций. Информация —значения /. Изучаются оптимальные линейные
алгоритмы, получены оценки сверху на их погрешности.
Стечкин С. Б. Наилучшее приближение линейных операторов. Мат. заметки,
1967, 1, № 2, с. 137—148.
ОТ, линейные операторы, оптимальная аппроксимация ограниченными
линейными операторами
В этой работе отсутствуют понятия е-аппроксимации и информации, а
определение оптимальности отлично от нашего. Рассматривается задача
аппроксимации неограниченного линейного оператора U линейными операторами ф, норма
которых не превосходит заданной константы. Для нескольких U найдены
оптимальные операторы ф и их погрешности. Если U — оператор
дифференцирования, Uf=fin\ причем k мало, то близкий к оптимальному оператор ф требует
малого количества вычислений значений /.
Стёрн (Stern M. D.) Optimal quadrature formulae, Comput. J. 9 A967), 396—
403.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса скалярных функций,
у которых вторая производная ограничена в Lp константой. Информация —
значения /. Найдены оптимальные квадратурные формулы и их погрешности.
Стронгин Р. Г. Численные методы в многоэкстремальных задачах.— М.: Наука,
1978.
•ОТ, экстремум, одна переменная, оптимальные байесовы алгоритмы
Рассматривается задача поиска минимума для класса скалярных функций,
удовлетворяющих некоторому вероятностному аналогу условия Липшица.
Информация — значения /. Изучаются оптимальные байесовы алгоритмы.
Сухарев А. Г. Об оптимальных стратегиях поиска экстремума, ЖВМ и МФ.
1971, 11, № 4, с. 910—924.
ОТ, экстремум, несколько переменных, оптимальные точки информации
Рассматривается задача поиска максимума для класса скалярных
функций N переменных, удовлетворяющих на данном множестве К условию
Липшица с константой L. Информация — значения / в п точках. Доказано, что
оптимальные точки информации задают оптимальное покрытие множества /С.
Показано, что существует неадаптивная информация, оптимальная в классе
адаптивной информации. Для К = [0, \]N для отыскания е-приближения к
решению необходимо вычислить (L/e)^ значений функции. Рассматривается
!Гакже вероятностный способ выбора точек информации.
3. Аннотированная библиография 331
Сухарев А. Г. Наилучшие стратегии последовательного поиска экстремума,
ЖВМ и МФ, 1972, 12, № 1, с. 35-50.
ОТ, экстремум, несколько переменных, оптимальные точки информации
Это —продолжение работы Сухарев [71]. Предполагается, что точки,
в которых вычисляются значения функции, могут зависеть от ранее
полученной информации. Показано, что оптимальные точки информации образуют
оптимальные покрытия подобластей области определения функции /. Имеется
связь с динамическим программированием.
Сухарев А. Г. Оптимальный поиск экстремума.—М.: Изд-во Моск. ун-та, 1975.
ОТ, экстремум, нелинейные уравнения, одна переменная, несколько
переменных, оптимальные точки информации
Рассматривается задача поиска максимума для класса функций,
удовлетворяющих условию Липшица, и класса унимодальных скалярных функций.
Информация —значения /, вычисляемые одновременно или адаптивно. Дается
обзор многих результатов, относящихся к этой задаче. Рассматривается также
решение нелинейных скалярных уравнений для класса функций /, таких что
/(д)<0,/F)^0 и (f(x)—f(y))/(x — y)?[m, М] при х?[а, Ь] и заданныхт, М.
Сухарев А. Г. Оптимальный поиск корня функции, удовлетворяющей условию
Липшица, ЖВМ и МФ, 1976, 16, № 1, с. 20—29.
ОТ, нелинейные уравнения, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы
Рассматривается задача поиска нуля для класса скалярных функций,
удовлетворяющих на заданном отрезке условию Липшица с заданной
константой. Информация — значения / в п точках. Оптимальные х; найдены для
случая, когда / меняет знак на концах отрезка. В случае если это предположение
не выполнено, найден оптимальный по точности алгоритм, минимизирующий
абсолютную величину /. В обоих случаях оптимальные алгоритмы являются
алгоритмами половинного деления.
Сухарев А. Г. Оптимальный метод построения наилучших равномерных
приближений для функций некоторого класса, ЖВМ и МФ, 1978, 18, № 2,
с. 302-313.
ОТ, аппроксимация, оптимальные точки информации
Рассматривается задача построения равномерных приближений для класса
скалярных функций, удовлетворяющих условию Липшица с заданной
константой. Информация — значения /. Обсуждается вопрос об оптимальном выборе
точек неадаптивной и адаптивной информации.
Сухарев А. Г. Optimal quadrature formulas for some functional classes.
Report, 1978.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оптимальные алгоритмы
Рассматривается задача интегрирования для класса функций, зависящих
от s переменных и удовлетворяющих обобщенному условию Липшица.
Информация— значения / в п точках. Найдены оптимальные алгоритмы, их
погрешности и оптимальные точки информации. При оптимальных точках
погрешность равна приблизительно fl-Vs.
Тайков Л. В. Неравенства типа Колмогорова и наилучшие формулы
численного дифференцирования, Мат. заметки, 1968, 4, № 2, с. 233—238.
ОТ, дифференцирование, оптимальная аппроксимация ограниченными
линейными операторами.
Вслед за Стечкиным [67] автор рассматривает задачу аппроксимации /<*>
для класса скалярных функций с ограниченной в L2 производной порядка п9
332 Ч. С. Краткий исторический очерк и аннотированная библиография
посредством линейных операторов, норма которых ограничена
заданной константой. Найдена погрешность такой оптимальной аппроксимации.
Танана В. П. Об оптимальности методов решения нелинейных неустойчивых
задач, ДАН СССР, 1975, 220, № 5, с. 1035—1037.
ОТ, операторные уравнения, оптимальные по точности алгоритмы
Рассматривается нелинейное операторное уравнение Ах = у, где А —
взаимно-однозначный непрерывный оператор, а у принадлежит заданному множеству.
Информация —значение Ах, вычисляемое с погрешностью. Показано, что
погрешности метода невязки и метода квазирешений отличаются от погрешности
оптимального по точности алгоритма не более чем в два раза.
Тарасова В. П. Оптимальные стратегии поиска области наибольших значений
для некоторого класса функций, ЖВМ и МФ, 1978, 18, № 4, с. 886—896.
ОТ, экстремум, оптимальные по точности алгоритмы
Рассматривается задача поиска максимума для некоторого класса К
функций на [а, Ь] со значениями в линейно-упорядоченном пространстве.
Информация—значения /. Предполагается, что для каждой функции /?/(
существует подынтервал Аа[а, Ь] длины б, такой что / (*) > / (xr) V*?A, x' (?
?д. Оптимальные алгоритмы получены при 6 = (Ь—а)/2.
Тихомиров В. М. Наилучшие методы приближения и интерполирования
дифференцируемых функций в пространстве С [—1, 1], Мат. сб., 1969, 80,
№ 2, с. 290-304.
мамематика, я-поперечники
Рассматривается задача аппроксимации для класса скалярных функций,
у которых (г—1)-я производная удовлетворяет условию Липшица с
константой единица. Изучается также периодический случай. Найдены выражения
через норму для совершенных сплайнов я-поперечников по Колмогорову и по
Гельфанду. Показано, что экстремальные подпространства, которые
отыскиваются при вычислении я-поперечникз по Колмогорову, состоят из сплайнов.
Тихомиров В. М. Некоторые вопросы теории приближений.— М.: Изд-во Моск.
ун-та, 1976.
математика, аппроксимация, я-поперечники
Рассматриваются общие задачи аппроксимации. Приводится много
классических и новых результатов, в особенности касающихся я-поперечников
(по Колмогорову, по Гельфанду, линейных). Хорошая библиография.
Тихонов А. Н., Гайсарян С. С. О выборе оптимальных сеток при
приближенном вычислении квадратур, ЖВМ и МФ, 1969, 9, № 5, с. 1170—1176.
ОТ, интегрирование, одна переменная, оптимальные точки информации
Рассматриваются квадратурные формулы порядка s.
Информация—значения /. Изучены оптимальные точки информации. Показано, что если fis) не
меняет знака на некотором интервале, то оптимальные точки существуют,
единственны и определяются нелинейным разностным уравнением второго
порядка. Выявлена взаимосвязь с субоптимальными узлами,
минимизирующими главный член асимптотического разложения погрешности.
Тодд (Todd M. J.) Optimal dissection of simplices, Department of Operations
Research Rep., Cornell Univ. A976).
ОТ, нелинейные уравнения, несколько переменных, оптимальные алгоритмы
Рассматривается задача о неподвижной точке в классе непрерывных
функций нескольких переменных. Информация —значения/. Даны близкие к
оптимальным разбиения для вычисления неподвижных точек. Для оптимальных
алгоритмов получены оценки асимптотической скорости убывания погрешности.
3. Аннотированная библиография 333
Трауб (Traub J. F.) On functional iteration and the calculation of roots,
Preprints of Papers J6th Nat. ACM Conf. Session 5A-1, pp. 1—4. Los Angeles,
California A961).
-ОТ, нелинейные уравнения, одна переменная, одноточечные итерации,
одноточечные итерации с памятью, итеративная сложность, максимальный порядок
Эта работа положила начало исследованиям по итеративной сложности.
Кратко излагаются результаты, в развернутом виде опубликованные позднее
в книге Трауба [64]. Вводятся понятия одноточечной итерации и одноточечной
итерации с памятью (называемой в этой работе многоточечной итерацией).
Доказана теорема о максимальном порядке для одноточечной итерации.
Выдвинута гипотеза о том, что память увеличивает порядок одноточечной итерации
с памятью всегда меньше чем на единицу.
Трауб (Traub J. F.) The theory of multipoint iteration functions, Digest of
Technical Papers, ACM Nat. Conf. Vol. 1, pp. 80—81 A962).
ОТ, нелинейные уравнения, одна переменная, несколько переменных,
многоточечные итерации, итеративная информация, итерационные алгоритмы,
порядок
Для задачи вычисления нуля нелинейной функции / вводится понятие
многоточечной информационной функции. Указано, что для многоточечных
итераций алгоритмы порядка р не требуют вычисления первых р—1
производных функции /. В частности, существуют итерации порядка /?,
использующие р— 1 значений / и одно значение /', итерации порядка /?, использующие
одно значение / и р—1 значений /', и итерации порядка 2 (/7 — 1),
использующие р—1 значений /, одно значение /' и одно значение /". См. также
работу Шаманского [67], где анализируется дискретный вариант итераций
первого из этих трех видов.
Трауб (Traub J. F.) Optimal m-invariant iteration functions, Notices Amer.
Math. Soc. 9 A962), 122.
ОТ, нелинейные уравнения, одна переменная, одноточечные итерации,
максимальный порядок
Рассматриваются одноточечные итерации для решения скалярного
нелинейного уравнения с нулем известной кратности т. Ищется семейство итераций
максимального порядка р для всех положительных целых тир. Задача
решена полностью; коэффициенты для итераций максимального порядка
зависят от чисел Стирлинга первого и второго рода.
Трауб (Traub J. F.) On the informational efficiency of iteration functions.
Abstr. Short Commun. Internat. Congr. Math., Stockholm, 202 A962).
ОТ, нелинейные уравнения, одна переменная, одноточечные итерации,
одноточечные итерации с памятью, многоточечные итерации, максимальный порядок
Рассматриваются итерационные методы вычисления простого нуля
скалярной нелинейной функции. Для трех классов итераций —одноточечных,
одноточечных с памятью (называемых модифицированными одноточечными) и
многоточечных— обсуждается взаимосвязь между информацией, используемой
итерацией, и ее максимальным порядком.
Трауб (Traub J. F.) Interpolator iteration functions, Nat. ACM Conf. A963).
(Краткое изложение результатов этой работы имеется в Сотт. АСМ.
6 A963), 357.
ОТ, нелинейные уравнения, одна переменная, одноточечные итерации,
одноточечные итерации с памятью, порядок
Вводится понятие интерполяционной итерации для вычисления нуля
скалярной нелинейной функции. Получены два полиномиальных, уравнения, опре-
334 Ч. С. Краткий исторический очерк и аннотированная библиография
деляющих порядок интерполяционной итерации для вычисления простого или
кратного нуля.
Трауб (Traub J. F.) "Iterative Methods for the Solution of Equations",
Prentice-Hall, Englewood Cliffs, New Jersey, 1964.
ОТ, нелинейные уравнения, одна и несколько переменных, одноточечные и
многоточечные итерации, итерации с памятью, интерполяционные итерации,
итеративная информация, итеративная сложность, максимальный порядок
Рассматриваются итерационные методы вычисления простого или кратного
нуля скалярной нелинейной функции /. Даны также некоторые результаты,
относящиеся к нелинейным функциям нескольких переменных. Информация —
значения функции f и ее производных. Некоторые из результатов были
анонсированы ранее; см. работы Трауба с 1961 по 1963 г.
Вводится следующая классификация итераций: одноточечные,
одноточечные с памятью, многоточечные, многоточечные с памятью. Доказана теорема
о максимальном порядке для одноточечных итераций. Введено понятие
интерполяционной итерации. Выдвинута гипотеза о том, что память увеличивает
порядок одноточечной итерации всегда меньше чем на единицу. Вводится
понятие многоточечной итерации. Показано, что свойства максимального порядка
в случае многоточечной итерации сильно отличаются от случая одноточечной
итерации. Анализируется вычислительная эффективность. Хорошая
библиография.
Значительная часть материала, представленного в этой книге, содержалась
в оставшейся неопубликованной 140-страничной рукописи, подготовленной
в 1961 г.
Трауб (Traub J. F.) Computational complexity of iterative processes, SlAM J,
Comput. 1 A972), 167—179.
ОТ, обзор, итеративная сложность, максимальный порядок
Дан обзор результатов по теории итеративной сложности и некоторые
исторические комментарии. Вводится термин «аналитическая вычислительная
сложность». Хорошая библиография.
Трауб (Traub J. F.) Optimal iterative processes: theorems and conjectures, in
«Information Processing», Vol. 71, pp. 1273—1277. North-Holland Publ.,
Amsterdam, 1972.
ОТ, нелинейные уравнения, одна переменная, одноточечные итерации,
одноточечные итерации с памятью, многоточечные итерации, итеративная сложность,
максимальный порядок
Ьбзор исследований по теории итеративной сложности по состоянию
на 1972 г. Хорошая библиография.
Трауб (Traub J. F.) An itroduction to some current research in numerical
computational complexity, in "The Influence of Computing on Mathematical
Research and Education" (Proc. Symp. Appl. Math.), Vol. 20, pp. 47—55.
American Mathematical Society, Providence, Rhode Island, 1974.
ОТ, обзор, алгебраическая сложность, аналитическая сложность,
алгебраические числа, параллельные алгоритмы
Обзор исследований по алгебраической сложности, аналитической
сложности и параллельным алгоритмам по состоянию на 1974 г. Хорошая
библиография.
Трауб (Traub J. F.) Parallel algorithms and parallel computational complexity,
in "Information Processing", Vol. 74, pp. 685—687. North-Holland Publ.,
Amsterdam, 1974.
ОТ, параллельные алгоритмы, параллельная сложность
3. Аннотированная библиография 335
Обзор исследований по параллельным алгоритмам и параллельной
сложности по состоянию на 1974 г. Определяется оптимальное ускорение за счет
многопроцессорности как для алгебраических, так и для аналитических задач.
В рамках развиваемой в этой статье методологии ускорение при вычислении
нуля нелинейной функции ограничено константой для любого числа процессоров.
Трауб (Traub J. F.) Theory of optimal algorithms, in "Software for Numerical
Mathematics" (D. J. Evans, ed.), pp. 1 —13. Academic Press, New York, 1974.
ОТ, нелинейные уравнения, одна переменная, итеративная сложность,
алгебраическая сложность
Обзор исследований по теории итеративной сложности и некоторым темам
теории алгебраической сложности по состоянию на 1973 г.
Трауб (ред.) (Traub J. F.) "Analytic Computational Complexity". Academic
Press, New York, 1976.
ОТ, итеративная информация, быстрые алгоритмы, итеративная сложность
максимальный порядок
Труды симпозиума, проведенного в 1975 г. Содержится 13 статей по теории
аналитической вычислительной сложности.
Трауб (Traub J. F.) Introduction, in "Analytic Computational Complexity"
(J. F. Traub, ed.) pp. 1—4. Academic Press, New York, 1976.
ОТ, аналитическая сложность
Кратко излагаются некоторые из побудительных мотивов изучения
аналитической сложности. Дан краткий обзор 13 представленных в сборнике статей.
Трауб (Traub J. F.) Recent results and open problems in analytic computational
complexity, in "Mathematical Models and Numerical Methods", Vol. 3.
Banach Center Publ. PWN, Warsaw, Poland, 1978.
ОТ, нелинейные уравнения, абстрактный случай, итеративная сложность,
максимальный порядок
Статья основана на лекции, прочитанной в Центре им. Банаха в 1975 г.
Дан краткий обзор исследований и открытых проблем по состоянию на 1975 г.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) Strict lower and upper
bounds on iterative computational complexity, in "Analytic Computational
Complexity" (J. F. Traub, ed.), pp. 15—34. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, итеративная информация, одноточечные итерации,
итеративная сложность, индекс сложности, оценки снизу
Изучается сложность итераций, в предположении что справедливо
упрощенное уравнение для погрешности. Вводится понятие индекса сложности.
Показано, что сложность равна произведению индекса сложности на функцию
коэффициента погрешности. Даны точные неасимптотические оценки сложности
снизу и сверху. Указаны также строгие условия для сравнения сложности
двух различных алгоритмов.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) Optimal linear
information for the solution of non-linear operator equations, in "Algorithms and
Complexity: New Directions and Recent Results" (J. F. Traub, ed.)
pp. 103—119. Academic Press, New York, 1976.
ОТ, нелинейные уравнения, абстрактный случай, оптимальная линейная
итеративная информация, порядок информации, одноточечные итерации
Впервые поставлен вопрос: какая информация в наибольшей степени
подходит для решения данной задачи? Пусть / — нелинейный оператор, а
информация— произвольный конечномерный линейный оператор. Доказано, что
максимальный порядок любой одноточечной итерации, использующей линейную
336 Ч. С. Краткий исторический очерк и аннотированная библиография
информацию, равен кардинальности информации. С другой стороны, любая
итерация порядка /г, использующая линейную информацию кардинальности /г,
должна использовать стандартную информацию f {x), f (х)у ..., /i"-1) (х).
Таким образом, любая локально сходящаяся одноточечная информация второго
порядка должна использовать информацию / (х), /' (х).
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) Optimal radius of
convergence of interpolator iterations for operator equations. Dept. of
Computer Science Rep., Carnegie-Mellon Univ. A976). See also Aequationes Math.,
21 A980), 159—172.
ОТ, нелинейные уравнения, абстрактный случай, одноточечные итерации,
радиус сходимости
Изучается радиус сходимости одноточечных прямых интерполяционных
итераций как функция порядка. Для двух классов операторных уравнений
показано, что радиус сходимости может при большом порядке быть большим.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) Convergence and
complexity of Newton iteration for operator equations. Dept. of Computer Science
Rep., Carnegie-Mellon Univ. A977). See also /. Assoc. Comput. Mack. 26
A979), 250—258.
ОТ, нелинейные уравнения, абстрактный случай, метод Ньютона, итеративная
сложность, оптимальная сходимость
Рассматривается вопрос о том, какие условия нужно наложить, чтобы
в дополнение к сходимости обеспечить «хорошую сложность». Изучается метод
Ньютона в задаче отыскания нуля нелинейного оператора. Устанавливается
оптимальный по отношению к некоторому функционалу радиус шара сходимости.
Показано, что- сложность метода Ньютона при условии, что он сходится, может
быть сколь угодно большой. Высказывается предположение, что это общее
явление. Установлены радиус шара, где обеспечена хорошая сложность, и
оценка снизу сложности метода Ньютона.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) Convergence and
complexity of interpolatory-Newton iteration in a Banach space. Dept. of
Computer Science Rep., Carnegie-Mellon Univ. A977). See also Сотр. Maths.
Appl. 6 A980), 385—400.
ОТ, нелинейные уравнения, абстрактный случай, метод Ньютона, оптимальные
итерации, итеративная сложность
Определяется и анализируется класс интерполяционных итераций Ньютона
для вычисления простого нуля нелинейного уравнения в банаховом
пространстве конечной размерности. Устанавливается сходимость итераций этого класса.
Формализуются понятия «информационно оптимального класса алгоритмов» и
оптимального алгоритма. Для случая нескольких переменных установлена
оптимальность итерации Ньютона в классе одноточечных итераций при
«предположении об одинаковой стоимости».
Трауб, Вожьняковский (Traub J. F.f Wozniakowski H.) General theory of
optimal error algorithms and analytic complexity, part A. General information
model, Dept. of Computer Science Rep., Carnegie-Mellon Univ. A977).
ОТ, аналитическая сложность, оптимальная линейная информация,
оптимальные по точности алгоритмы, центральные алгоритмы, линейные алгоритмы,
оценки снизу
Эта работа включена в гл. 1—3 и 5 ч. А настоящей книги.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.) General theory of
optimal error algorithms and analytic complexity, part B. Iterative information
model, Dept. of Computer Science Rep., Carnegie-Mellon Univ. A978).
ОТ, аналитическая сложность, нелинейные уравнения, абстрактный случай,
итеративная информация, порядок информации, итерационные алгоритмы
3. Аннотированная библиография 337
Эта работа включена в ч. В настоящей книги.
Троян (Trojan J. M.) Tight bounds on the complexity index of one-point
iterations A979). See also Сотр. Maths. Appl. 6 A980),-433—431.
ОТ, нелинейные уравнения, абстрактный случай, асимптотически оптимальные
алгоритмы, одноточечные итерации, итеративная сложность
Рассматриваются одноточечные итерации максимального порядка для
решения нелинейного уравнения / = 0 в банаховом пространстве. Используемая
методом п-го порядка информация —это стандартная информация / (я),
/' (*), ..., /<п-1>(л). Если / конечномерно, то комбинаторная сложность этих
методов линейна по числу используемых скалярных элементов информации.
Это дает хорошие оценки на индекс сложности. См. также Trojan J. M.f
How to decrease the combinatory complexity, Demonstratio Math. 11 A978),
807—811, где изучается скалярный случай.
Уайлд (Wilde D. J.) Методы поиска экстремума.— М.: Наука, 1967 A964).
ОТ, экстремум, одна переменная, оптимальные алгоритмы
Руководство по теории поиска максимума функции.
Информация—значения /. В числе других рассматривается метод Фибоначчи поиска максимума
для класса унимодальных функций.
Уилф (Wilf H. S.) Exactness conditions in numerical quadrature, Numer. Math,
6 A964), 315—319.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций в единичном круге, лежащего в некотором гильбертовом
пространстве. Информация —значения /. Рассмотрен вопрос об оптимальных
весах и узлах квадратурных формул.
Файн (Fine T.) Optimum search for the location of the maximum of a unimodal
function, IEEE Trans. Inform. Theory IT-12 A966), 103—111.
ОТ, экстремум, одна переменная, оптимальные алгоритмы, анализ среднего
случая
Рассматривается задача поиска максимума для, класса унимодальных
функций в предположении, что точки максимума равномерно распределены.
Информация —значения f в адаптивно выбираемых точках. Изучаются
оптимальные алгоритмы, т. е. алгоритмы, минимизирующие математическое
ожидание затрат. См. также реферат Кифера в Math. Rev. 34, No. 7260, где
обсуждается рассматриваемая в работе модель.
Фелдстайн (Feldstein A.) Bounds on order and Ostrowski efficiency for inter-
polatory iteration algorithms, UCRL-72238 Rep., Lawrence Livermore Lab.
A969).
ОТ, нелинейные уравнения, одна переменная, интерполяционные итерации,
порядок, индекс сложности, параллельные алгоритмы
Изучаются, как и в работе Фелдстайна и Файерстоуна [67], эрмитовы
интерполяционные функции (ЭИФ) в задаче отыскания нуля нелинейного
уравнения. Получены оценки на порядок ЭИФ и предельные теоремы. Эти
результаты используются для получения предельных теорем и оценок на
индекс сложности. Такие же результаты получены для простых параллельных
итераций.
Фелдстайн, Трауб (Feldstein A., Traub J. F.) Order of vector recurrences with
applications to nonlinear iteration, parallel algorithms, and the power method,
Dept. of Computer Science Rep., Carnegie-Mellon Univ. A974J.
338 Ч. С. Краткий исторический очерк и аннотированная библиография
ОТ, нелинейные уравнения, одна переменная, итеративная сложность,
итерационные алгоритмы, параллельные алгоритмы, порядок, итерации с памятью,
интерполяционные итерации, суперпозиция
То же, что и в работе Фелдстайн, Трауб [77], с многочисленными
примерами приложений.
Фелдстайн, Трауб (Feldstein A., Traub J. F.) Asymptotic behavior of vector
recurrences with applications, Math. Сотр. 31 A977), 180—192.
ОТ, нелинейные уравнения, одна переменная, итеративная сложность,
итерационные алгоритмы, параллельные алгоритмы, порядок, итерации с памятью,
интерполяционные итерации, суперпозиция, порядок
При очень слабых предположениях доказано, что величины Нт„_юо \\уп\\г^п
и lim^oo ||yn + i/||yn|| Для векторного разностного уравнения yn+1= Myrt + w,,+1
равны спектральному радиусу М. Статья является продолжением работы Раиса
[71] по матричному представлению итерационных методов решения нелинейных
уравнений. Полученный результат применяется к анализу параллельных
итерационных алгоритмов, а также к анализу порядка и сложности
суперпозиции итераций. Показано, что порядок суперпозиции итераций может быть
меньше, равен или больше, чем произведение порядков итераций.
Фелдстайн, Файерстоун (Feldstein A., Firestone R. M.) Hermite interpolatory
iteration theory and parallel numerical analysis, Division of Applied
Mathematics Rep., Brown Univ. A967).
ОТ, нелинейные уравнения, одна переменная, интерполяционные итерации,
порядок, индекс сложности, параллельные алгоритмы
Изучаются эрмитовы интерполяционные функции (ЭИФ) в задаче
отыскания нуля нелинейной функции /. Информация —значения функции / и ее
производных в некотором числе точек. Анализируется порядок ЭИФ и
изучается индекс сложности. Обсуждается вопрос о применении ЭИФ для
параллельных вычислений и сравниваются индексы сложности параллельных
алгоритмов.
Форст (Forst W.) Zur Optimal itat interpolatorischer Quadraturformeln perio-
discher Funktionen, Numer. Math. 25 A975), 15—21.
ОТ, интегрирование, одна пере генная, оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса Фавара скалярных
периодических функций, у которых r-я производная удовлетворяет условию
Липшица с константой единица. Информация —значения / в п
равноотстоящих точках. Показано, что единственной оптимальной квадратурной формулой
является формула трапеций, а ее погрешность равна Kr + i/nr+1> где/Сг+1—
постоянная Фавара.
Форст (Forst W.) Optimale Hermite-interpolation differenzierbarer periodischer
Funktionen, /. Approx. Theory 20 A977), 333—347.
ОТ, интерполяция, одна переменная, оптимальные алгоритмы, сплайны i
Рассматривается задача интерполяции для класса Фавара 2я-периодиче-
ских скалярных функций, у которых r-я производная ограничена в L^
единицей. Информация —значения функции / и ее производных. Оптимальные
алгоритмы выражены через периодические сплайны.
Херцбергер (Herzberger J.) Uber Matrixdarstellungen fur Iterationsverfahren bei
nichtiinearen Gleichungen, Computing 12 A974), 215—222.
ОТ, нелинейные уравнения, одна переменная, итерационные алгоритмы,
параллельные алгоритмы, порядок, интерполяционные итерации, суперпозиция
Показано, что порядок сходимости некоторых итераций для решения
нелинейных уравнений равен спектральному радиусу некоторой матрицы. См.
также Фелдстайн, Трауб [77].
3. Аннотированная библиография 339
Хиндмарш (Hindmarsh А. С.) Optimallity in a class of rootfinding algorithms,
SI AM J. Numer. Anal. 9 A972), 205—214.
ОТ, нелинейные уравнения, одна переменная, итеративная сложность,
итерационные алгоритмы, порядок, интерполяционные итерации
Изучаются эрмитовы интерполяционные итерационные функции (ЭИФ)
*в задаче решения нелинейных уравнений. Показано, как можно вычислить
порядок суперпозиции ЭИФ и что порядок суперпозиции не равен
произведению порядков. Изучается сложность суперпозиции ЭИФ и обсуждается
вопрос об оптимальной сложности.
Хэйбер (Haber S.) The error in numerical integration of analytic functions,
Quart. AppL Math. 29 A971), 411-420.
ОТ, интегрирование, аналитические функции, одна переменная, оптимальные
линейные алгоритмы, оценки сверху
Рассматривается задача интегрирования для двух классов скалярных
аналитических функций. Информация—значения / в я точках. Найдена оценка
сверху минимальной погрешности квадратурных формул.
Чавла, Кауль (Chawla M. M., Kaul V.) Optimal rules for numerical integration
round the unit circle, BIT 13 ()973), 145—152.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные алгоритмы
Рассматриваются : задачи интегрирования и аппроксимации линейного
функционала для класса скалярных аналитических функций в круговом кольце,
лежащего в гильбертовом пространстве с воспроизводящим ядром.
Информация—значения /. Оптимальные веса и точки информации выражены через
элементы, определяющие функционалы. Найдены оптимальные квадратурные
формулы для единичной окружности и отрезка [—1, 1].
Ченцов Н. Н. О квадратурных формулах для функций бесконечно большого
числа переменных, ЖВМ и МФ, 1961, 1, № 3, с. 418—424.
ОТ, интегрирование, абстрактный случай, оценки снизу
Рассматривается задача интегрирования для класса скалярных функций
бесконечно большого числа переменных. Информация — значения/. Для класса
лилшицевых функций найдена точная оценка снизу на погрешность линейных
квадратурных формул.
Черноусько Ф. Л. Оптимальный алгоритм поиска корня функции,
вычисляемой приближенно, ЖВМ и МФ, 1968; 8, № 4, с. 705—724.
ОТ, нелинейные уравнения, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы ,
Рассматривается задача поиска нуля для класса скалярных функций /,
таких что m<(/ (хг) — f (х2))/(х1— *ъ)<М при хъ х2?[а, Ь] и т > 0.
Информация—значения /, вычисляемые с ошибками. Найдены оптимальный по
точности алгоритм и оптимальные точки информации. Обсуждается оптимальный
по точности алгоритм при фиксированной стоимости вычислений в
предположении, что стоимость вычисления с определенной точностью значения /
измеряется некоторой заданной функцией стоимости.
Черноусько Ф. Л. Об оптимальном поиске экстремума унимодальных функций,
ЖВМ и МФ, 1970, 10, № 4, с. 922-933.
ОТ, экстремум, одна переменная, оптимальные по точности алгоритмы
Рассматривается задача поиска экстремума для класса унимодальных
скалярных функций, удовлетворяющих условию Липшица с заданной
константой. Информация — значения f в п точках. Найдены алгоритмы, оптимальные
по точности по двум различным критериям. Полученные результаты связаны
с результатами Кифера [53J.
340 Ч. С. Краткий исторический очерк и аннотированная библиография
Черноусько Ф. «Л. Об оптимальном поиске минимума выпуклых функций,
ЖВМ и МФ, 1970, 10, № 6, с. 1355-1366.
ОТ, экстремум, одна переменная, выпуклые функции, оптимальные по
точности алгоритмы
Рассматривается задача поиска минимума для класса скалярных
выпуклых функций. Информация — значения / в п точках. Найдены оптимальные
по точности или близкие к оптимальным по точности алгоритмы.
Чжан Гуанцзюань (Chzhan Guan-Tszjuan) О минимальном числе узлов при
численном интегрировании уравнения теплопроводности, ЖВМ и МФ,
1962, 2, № 2, с. 80-88.
ОТ, дифференциальные уравнения, п-поперечники
Рассматривается уравнение теплопроводности ut~uxx, где и (х, 0)
принадлежит классу Нр функций /, таких что /<2/) @) = /B/) (л) = 0 при 2* < p и
/(/?)€^2- Информация — значения и (х, 0). Изучается задача о минимальном
числе п значений и (*, 0), вычисление которых необходимо для
аппроксимации и (х, t) с точностью 8 при помощи алгоритма с областью значений
размерности не выше п. Получен алгоритм с я = в (е~1/р). Отсюда следует
асимптбтическая оптимальность этого алгоритма, поскольку указанное п —
наибольшее число, для которого йп(Нр)^г, где dn (Hp)=^B (е~]/р) есть
л-поперечник по Колмогорову.
Шайдаева Т. А. Квадратурные формулы с наименьшей оценкой остатка для
некоторых классов функций, Труды Матем. ин-таим. Стеклова, 1959, 53,
с. 313—341.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для классов скалярных функций
с ограниченной первой, второй или третьей производной. Найдены веса и узлы
оптимальных квадратурных формул.
Шаманский В. Е. Об одной модификации метода Ньютона, Укр. мат. ж.,
1967, 19, № 1, с. 133-138.
ОТ, нелинейные уравнения, несколько переменных, итеративная сложность
Рассматривается некоторый класс алгоритмов решения нелинейной системы
уравнений / = 0. Используемая информация —значения f. Для mk итераций
метода Ньютона сохраняется постоянной дискретная аппроксимация матрицы
Якоби. Числа т^ выбираются так, чтобы минимизировать индекс сложности.
Эти алгоритмы являются дискретным вариантом алгоритмов,
предложенных Траубом (см. Трауб [62] (The theory of multipoint Iteration functions)
или Трауб [64].
Шарыгин И. Ф. Оценки снизу погрешности квадратурных формул на классах
функций, ЖВМ и МФ, 1963, 3, № 2, с. 370—376.
ОТ, интегрирование, несколько переменных, оценки снизу
Рассматривается задача интегрирования для трех классов скалярных
функций нескольких переменных с ограниченными коэффициентами Фурье.
Информация — значения /. Даны оценки снизу погрешности линейных
квадратурных формул.
Шарыгин И. Ф. Оценка снизу погрешности формулы приближенного
суммирования на классе Esp(C), Мат. заметки, 1977, 21, № 3, с. 371—375.
ОТ, интегрирование, несколько переменных, оптимальные точки информации,
оценки снизу
Рассматривается задача интегрирования для класса ESf p (С) скалярных
функций s переменных. Информация—значения / в р точках. Показано, что
3. Аннотированная библиография 341
при произвольных точках информации погрешность любого алгоритма не
меньше в (р-г \ns p). Этой границы достигает оптимальный алгоритм,
использующий р равноотстоящих точек информации.
Шёнберг (Schoenberg I. J.) On best approximations of linear operators, Nederl.
Akad. Wetensch. Indag. Math. 67 A964), 155—163.
ОТ, аппроксимация линейных функционалов, оптимальные линейные
алгоритмы, сплайны
Изучается задача аппроксимации линейного функционала L для класса
скалярных т раз дифференцируемых функций. Информация—значения /.
Рассматривая действие L на интерполяционные сплайны, автор получает
оптимальные алгоритмы в смысле Сарда.
Шёнберг (Schoenberg I. J.) Spline interpolation and best quadrature formulae,
Bull. Amer. Math. Soc. 70 A964), 143-148.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
сплайны
Рассматривается задача интегрирования для класса скалярных т раз
дифференцируемых функций. Информация—значения /. Показано, что
оптимальные квадратурные формулы в смысле Сарда суть интегралы от
интерполяционных сплайнов.
Шёнберг (Schoenberg I. J.) On monosplines of least deviation and best
quadrature formulae, SI AM J. Numer. Anal. Ser. В 2 A965), 144—170.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
сплайны
Рассматривается задача интегрирования для класса т раз
дифференцируемых скалярных функций. Информация—значения функции / и ее
производных. Изучаются оптимальные квадратурные фо'рмулы в смысле Сарда.
Указана взаимосвязь между оптимальными квадратурными формулами и
моносплайнами, наименее отклоняющимися от нуля. Доказано, что классические
квадратурные формулы Эрмита и Эйлера—Маклорена оптимальны. См. также
Schoenberg I. J., On mo.iosplines of least square deviation and best quadrature
formulae. II, SI AM J. Numer, Anal 3 A966), 321—328.
Шёнберг (Schoenberg I. J.) Monosplines and quadrature formulae, in "Theory
and Applications of Spline Functions" (T. N. E. Greville, ed.), pp. 157—207.
Academic Press, New York, 1969.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы, сплайны
Рассматривается задача интегрирования для класса скалярных т раз
дифференцируемых функций. Информация —значения функции / и ее
производных. Определяются (и изучаются) оптимальные квадратурные формулы
в смысле Сарда как формулы, в которых веса и точки информации выбраны
так, чтобы минимизировать \ k2(t)dt (см. Сард [49]). Решение получено
в терминах моносплайнов наименьшей ?2-нормы.
Шёнберг (Schoenberg I. J.) A second look at approximate quadrature formulae
and spline interpolation, Advances in Math. 4 A970), 277—300.
ОТ, интегрирование, одна переменная, оптимальные линейные алгоритмы,
сплайны
Рассматривается задача интегрирования с весовой функцией для класса
скалярных т раз дифференцируемых функций. Информация — значения
функции / и ее производных на концах отрезка интегрирования. Изучаются опти-
342 Ч. С. Краткий исторический очерк и аннотированная библиография
мальные квадратурные формулы в смысле Сарда. Показано, что задача
сводится к нахождению моносплайнов наименьшей ?2-нормы, удовлетворяющих
некоторым краевым условиям.
Шмайсер (Schmeisser G.) Optimale Quadraturformein mit semidefiniten Kernen,
Numer. Math. 20 A972), 32—53.
ОТ, интегрирование, одна переменная, оптимальные алгоритмы
Рассматривается задача интегрирования для класса 2/е раз
дифференцируемых скалярных функций. Информация —значения /. В предположении что
погрешность квадратурной формулы можно представить как cf{2k) (?),
изучается вопрос о минимизации \с\.
Шульц (Schultz M. H.) The computational complexity of elliptic partial
differential equations, in "Complexity of Computer Computations" (R. E. Miller
and J. W. Thatcher, eds.), PP- 73—83. Plenum Press, New York, 1972.
ОТ, дифференциальные уравнения, оптимальные алгоритмы
Эллиптическое дифференциальное уравнение с частными производными
рассматривается на квадрате. Информация — значения функций, входящих
в уравнение. Для сетки, длина шага которой равна квадратному корню из
длины шага исходной сетки, построен алгоритм четвертого порядка. На
исходной сетке он дает результат второго порядка. Этот алгоритм
асимптотически оптимален, поскольку его комбинаторная сложность пропорциональна
числу точек решетки.
Шульц (Schultz M. H.) The complexity of linear approximation algorithms, in
"Complexity of Computation" (R. M. Karp, ed.), pp. 135—148. American
Mathematical Soc, Providence, Rhode Island, 1974.
ОТ, аппроксимация, оптимальные алгоритмы
Рассматривается задача аппроксимации для заданного класса скалярных
функций. Изучаются линейные алгоритмы с конечномерной областью
значений. Показано, что для класса функций/, для которых [|/|| < 1, погрешность
любого линейного алгоритма равна единице. Инструментом для отыскания
«хороших» линейных алгоритмов для класса абсолютно непрерывных функций,
у которых первая производная ограничена в L^ единицей, служит
«-поперечник по Колмогорову.
Шульц (Schultz M. H.) Complexity and differential equations, in "Analytic
. Computational Complexity" (J. F. Traub, ed.), pp. 143—149. Academic Press,
New York, 1976.
ОТ, аппроксимация, линейные и нелинейные уравнения, несколько
переменных, разреженность
Сводка результатов по трем темам: сложность некоторой задачи
аппроксимации, сложность по памяти алгоритмов решения некоторых разреженных
линейных систем, сложность двух алгоритмов решения некоторых
разреженных нелинейных систем.
Эвриэл, Уайлд (Avriel M., Wilde D. J.) Optimal search for a maximum with
sequences of simultaneous function evaluations, Management Sci. 12 A966),
722—731.
ОТ, экстремум, одна переменная, оптимальные алгоритмы
Рассматривается задача поиска максимума для класса скалярных
унимодальных функций. Информация — значения /. Изучаются оптимальные
алгоритмы, использующие одновременно вычисляемые значения функции.
Экхардт (Eckhardt U.) Einige Eigenschaften Wilfscher Quadraturforrneln, Numer,
Math. 12 A968), 1-7.
3. Аннотированная библиография 343
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные алгоритмы
Рассматривается задача интегрирования для класса скалярных
аналитических функций в единичном круге, лежащего в некотором гильбертовом
пространстве. Информация —значения /. Изучены вопросы существования, а
также свойства оптимальных в смысле Уилфа [64J весов и узлов
квадратурных формул.
Элхей (Elhay S.) Optimal quadrature, Bull. Austral. Math. Soc. 1 A969),
81—108.
ОТ, интегрирование, одна переменная, оптимальные точки информации,
оптимальные линейные алгоритмы
Рассматривается задача интегрирования для класса гладких скалярных
функций, для которых ограничена величина 2/=о Д/|1/(у) В» где
я/—вещественные константы, а0 ф 0, аг Ф 0. Информация —значения /, /', ..., г^-1*.
При г=1, 2 построены оптимальные квадратурные формулы с оптимальными
точками информации. Некоторые свойства оптимальных квадратурных формул
установлены для произвольного л
Эрманн (Ehrmann H.) Konstruktion und Durchfiihrung von Iterationsverfahren
hoherer Ordnung, Arch. Rational Mech. Anal. 4 A959), 65—68.
ОТ, многочлены, метод Ньютона
В рамках принятой в статье модели сложности автор обсуждает вопрос о
наилучшем порядке И1ерации для вычисления нуля многочлена. Результат
зависит от степени многочлена.
Юдин Д. Б., Немировский А. С. Оценка информационной сложности задач
математического программирования, ЭММ, 1976, 12, № 1, с. 128—142.
ОТ, экстремум, несколько переменных, оптимальные точки информации,
оптимальные алгоритмы, оценки точности
Рассматривается задача минимизации скалярных функций нескольких
переменных. Информация — значения функции / и ее производных. Указано,
сколько значений функции / необходимо вычислить, чтобы найти е-приближе-
ние к решению для класса функций, у которых (k— 1)-я производная
удовлетворяет условию Липшица, и для класса выпуклых функций. Построены
асимптотически оптимальные алгоритмы.
Юдин Д. Б., Немировский А. С. Информационная сложность и эффективные
методы решения выпуклых экстремальных задач, ЭММ, 1976, 12, № 2
с. 357—369. " '
ОТ, экстремум, несколько переменных, оптимальные точки информации,
оптимальные алгоритмы, оценки точности
Продолжение работы Юдин, Немировский [76]. Изучаются практические
аспекты вопроса об асимптотически оптимальных алгоритмах. Показано, что
для некоторого класса выпуклых функций, лежащего в гильбертовом
пространстве, для отыскания е-приближения необходимо и достаточно вычислить
6(е~2) значений функции.
Юдин Д. Б., Немировский А. С. Информационная сложность строго
выпуклого программирования, ЭММ, 1977, 13, № 3, с. 550—559.
ОТ, экстремум, несколько переменных, оптимальные точки информации,
оптимальные алгоритмы, оценки точности
Продолжение работы Юдин, Немировский [76] (Информационная
сложность и эффективные методы решения выпуклых экстремальных задач).
Показано, что для класса строго выпуклых функций для отыскания е-приближения
к решению необходимо и достаточно вычислить e^lne) значений функции.
344 Ч. С. Краткий исторический очерк и аннотированная библиография
Ян (Yun D.Y.Y.) Hensel meets Newton—Algebraic constructions in an analytic
setting, in "Analytic Computational Complexity" (J. F. Traub, ed.),
pp. 205—215. Academic Press, New York, 1976.
ОТ, метод Ньютона, алгебраическая сложность
Обсуждается вопрос об использовании метода Ньютона (который обычно
рассматривается как аналитический метод) для решения алгебраических задач,
таких как задача р-адической аппроксимации.
Янковская (Jankowska J.) Multivariate secant method, Ph. D. Thesis, Univ. of
Warsaw, first part of thesis A975). See also SIAM J. Numer. Anal 16
A979), 547—562.
ОТ, нелинейные уравнения, несколько переменных, метод секущих, порядок
информации
Рассматривается итеративное решение системы нелинейных уравнений
/=0. Информация —значения /. Изучаются свойства оптимальности
многомерного метода секущих. Показано, как положение точек, в которых
вычисляются значения f, влияет на порядок информации.
Янковский, Вожьняковский (Jankowski M., Wozniakowski H.) Computational
complexity in numerical mathematics (in Polish), Mat. Stosow 5 A975),
5-27.
ОТ, алгебраическая и аналитическая сложность
Обзор недавних работ по алгебраической и аналитической сложности для
некоторых вычислительных задач.
Яфиль (Hyafil L.) Optimal search for the zero of the (n — l)st derivative
[RIA/LABORIA Rep. No. 247 A977).
ОТ, нелинейные уравнения, одна переменная, оптимальные точки информации,
оптимальные по точности алгоритмы
Рассматривается задача поиска нуля (п — 1)-й производной для класса
скалярных функций /, таких что производная /<*-*> непрерывна на [а, Ь] и
меняет знак только один раз, /(и~1)(а) < 0, /о*-1) ф) > 0. Информация —
значения / в п точках. Для нечетных п, л = 2 и /г = 4 найдены оптимальные по
точности алгоритмы с оптимальными точками информации. Доказательства
основываются на результатах, относящихся к проблеме отыскания нулей для
асинхронного мультипроцессора.
ЛИТЕРАТУРА1»
К части А
Адамский, Корытовский, Митковский (Adamski A., Korytowski A., Mitkow-
ski W.)
[77] A conception of optimality for algorithms and its application to the
optimal search for a minimum, Zastos. Mat. 14 A977), 499—509.
Айхьхорн (Eichhorn В. Н.)
[68] On sequential search, "Selected Statistical Papers", Vol. 1, pp. 81—95.
Math. Centrum, Amsterdam, 1968.
Аксень М. Б., Турецкий А. X.
[66] О наилучших квадратурных формулах для некоторых классов
функций, ДАН СССР, 1966, 166, № 5, с. 1019—1021.
Алберг, Нильсон Э. (Ahlberg J. H. Nilson Е. N.)
[66] The approximation of linear functionals, SI AM J. N timer. Anal. 3
A966), 173—182.
Алхимова В. М.
[72] Наилучшие квадратурные формулы с равноотстоящими узлами,
ДАН СССР, 1972, 204, № 2, с. 263—266.
Арестов В. В.
[67] О наилучшем приближении операторов дифференцирования, Мат.
заметки, 1967, 1, № 2, с. 149—154.
[69] О наилучшем равномерном приближении операторов
дифференцирования, Мат. заметки, 1969, 5, № 3, с. 273—284.
Аттэйя (Atteia M.)
[65] Fonctions-spline generalisees, С. R. Acad. ScL Paris 261 A965),
2149—2152.
Афанасьев А. Ю.
[74] О поиске минимума функции с ограниченной второй производной,
ЖВМ и МФ, 1974, 14, № 4, с. 1018-1021.
Афанасьев А. Ю., Новиков В. А.
[77] О поиске минимума функции с ограниченной третьей производной,
ЖВМ и МФ, 1977, 17, № 4, с. 1031—1034.
Ахо, Хопкрофт, Ульман (Aho А. V., Hopcroft J. E., Ullman J. D.)
[74] Построение и анализ вычислительных алгоритмов.— М.: Мир, 1979.
Бабенко В. Ф.
[76] Асимптотически точная оценка остатка наилучших для некоторых
классов функций кубатурных формул, Мат, заметки, 1976» 19, № 3,
с. 313—322.
Бабушка (Babuska I.)
[68а] Problems of optimization and numerical stability in computations, Apl.
Mat. 1, A968), 3-26.
J) Для переводных книг в квадратных скобках приведены последние две
цифры года оригинального издания. Если он больше года выхода перевода,
то это означает, что перевод делался с более раннего издания, чем то, кото*
рое указывает автор.— Прим. ред.
346 Литература
[68b] Uber universal optimale Quadraturformeln, Apl. Mat. 4 A968),
305—338; 5 A968), 388-404.
Бабушка, Соболев С. Л. (BabuSka I.)
[65] Оптимизация численных методов, Apl. Mat., 1965, 10, № 2, с. 96—130.
Барнхилл (Barnhill R. E.)
[67] Optimal quadratures in L2(E$. 1 and II, SIAM J. Numer. Anal. 4
A967), 390—397, 534—541.
[68] Asymptotic properties of minimum norm and optimal quadratures,
Numer. Math. 12 A968), 384—393.
Барнхилл, Уиксом (Barnhill R. E., Wixom J. A.)
[67] Quadratures with remainders of minimum norm. I and II, Math. Сотр.
21 A967), 66-75, 382-387.
[68] An error analysis for interpolation of analytic functions, SIAM J.
Numer. Anal 5 A968), 522—528.
Баррар, Лоуб, Берн ер (Barrar R. В., Loeb H. L., Werner M.)
[74] On the existence of optimal integration formulas for analytic functions,
Numer. Math. 23 A974), 105—117.
Бахвалов Н. С
[59] О приближенном вычислении кратных интегралов, Вестник Моск.
ун-та, сер. мат., мех., ..., 1959, № 4, с. 3—18.
[61] Оценка в среднем остаточного члена квадратурных формул, ЖВМ и
МФ, 1961, 1, № 1, с. 64-77.
[62а] Об оптимальных способах задания информации при решении
дифференциальных уравнений, ЖВМ и МФ, 1962, 2, № 4, с. 569—592.
[62Ь] Об оценке количества вычислительной работы, необходимой при
приближенном решении задач, Дополнение IV.— В кн.: Годунов С. К.,
Рябенький В. С. Введение в теорию разностных схем.—М.: Физмат-
гиз, 1962, с. 316-329.
[63] Оптимальные свойства формул численного интегрирования Адамса и
Грегори.— В кн.: Вопросы вычислительной математики и
вычислительной техники. Под ред. Л. А. Люстерника.— М.: Машгиз, 1963,
с. 9-26.
[64] Об оптимальных оценках скорости сходимости квадратурных
процессов и методов интегрирования типа Монте-Карло на классах функ-
ций.-*— В кн.: Численные методы решения дифференциальных и
интегральных уравнений и квадратурные формулы.—М.: Наука, 1964,
с. 5—63.
[67] Об оптимальной скорости интегрирования аналитических функций,
ЖВМ и МФ, 1967, 7, № 5, с. 1011—1020.
[68] Об оптимальных методах решения задач, Apl. Mat, I A968), 27—38.
[70] О свойствах оптимальных методов решения задач математической
физики, ЖВМ и МФ, 1970, 10, № 3, с. 555—568.
[71а] Об оптимальности линейных методов приближения операторов на
выпуклых классах функций, ЖВМ и МФ, 1971, И, № 4, с. 1014—1018.
[71Ь]0б оптимизации методов решения обыкновенных дифференциальных
уравнений с сильно осциллирующими решениями, ЖВМ и МФ, 1971,
11, № 5, с. 1318—1322.
[72] Оценки снизу асимптотических характеристик классов функций с
доминирующей смешанной производной, Мат. заметки, 1972, 12, № 6,
с. 655—664.
Бимер, Уайлд (Beamer J. H., Wilde D. J.)
[69] Time delay in minimax optimization of unimodal functions of one
variable, Management Sci. 15 A969), 528—538.
[70] Minimax optimization of unimodal functions by variable block search,
Management Sci. 16 A970), 529—541.
[71] Minimax optimization of a unimodal function by variable block
derivative search with time delay, J, Comb, Theory 10 A971), 160—173.
К части А 347
Бородин (Borodin A.)
[72] Complexity classes of recursive functions and the existence of complexity
gaps, J. Assoc. Comput. Mach. 19 A972), 158—174, 576.
Боянов (Bojanov B. D.)
[73] Оптимальная скорость интегрирования и е-энтропия одного класса
аналитических функций, Мат. заметки, 1973, 14, № 1, с. 3—10.
[74] Best quadrature formula for a certain class of analytic functions, Zastos.
Mat. 14 A974), 441—447.
[75] Наилучшие методы интерполирования для некоторых классов
дифференцируемых функций, Мат. заметки, 1975, 17, № 4, с. 511—524.
[76] Optimal methods of integration in the class of differentiable functions,
Zastos. Mat. 15 A976), 105—115.
Боянов, Черногоров (Bojanov В. D., Chernogorov V. G.)
[77] An optimal interpolation formula, J. Approx. Theory 20 A977),
264-274.
Брент, Виноград, Вулф (Brent R. P., Winograd S., Wolfe P.)
[73] Optimal iterative processes for root-finding, Numer. Math. 20 A973),
227 341
Брент, Кунг (Brent R. P., Kung H. T.)
[78] Fast algorithms for manipulating formal series, J. Assoc, Comput.
Mach. 25 A978), 581—595.
Бусарова Т. Н.
[73] Наилучшие квадратурные формулы для одного класса
дифференцируемых периодических функций, Укр, мат. ж., 1973, 25, № 3,
с. 291—301.
Бут (Booth R. S.)
[67] Location of zeros of derivatives, SIAM J. Appl. Math. 15 A967),
'1496—1501.
[69] Location of zeros of derivatives. II, SI AM J. Appl. Math. 17 A969).
409—415.
Вайнбергер (Weinberger H. F.)
[61] Optimal approximation for functions prescribed at equally spaced points,
J. Res. Nat. Bur. Std. Sect. В 65 A961), 99—104.
[72] On optimal numerical solution of partial differential equations. SI AM J.
Numer. Anal. 9 A972), 182—198.
Васильковский (Wasilkowski G. W.)
[79] Any iteration for polynomial equations using linear information has
infinite complexity. Dept. of Computer Science Rep., Carnegie-Mellon
Univ. A979).
Васильковский, Вожьняковский (Wasilkowski G. W., Wozniakowski H.)
[78] Optimallity of spline algorithms. Computer Science Dept. Rep.,
Carnegie-Mellon Univ. A978).
Великий В. Л.
[77] Оптимальная интерполяция периодических дифференцируемых функций
с ограниченной старшей производной, Мат. заметки, 1977, 22, № 5,
с. 663 — 670.
Вершульц (Werschulz A. G.)
[77а] Maximal order and order of information lor numerical quadrature.
Mathematics Research Rep. 77-2, Univ. of Maryland, Baltimore County
A977). See also J. Assoc. Comput. Mach. 26 A979), 527 — 537.
[77b] Maximal order for approximation of derivatives. Mathematics Research
Rep. 77 — 8, Univ. of Maryland Baltimore County A977). See also
/. of Comput. and Syst. Sci., 18 A979), 213 — 217
Вилански (Wilansky A.)
[78] "Modern Methods in Topological Vector Spaces", McGraw-Hill, New
York, 1978,
348 Литература
Виноград (Winograd S.)
[76] Some remarks on proof techniques in analytic complexity, in "Analytic
Computational Complexity" (J. F. Traub, ed.), pp. 5—14. Academic
Press, New York, 1976.
Витушкин А. Г.
[59] Оценка сложности задач табулирования.—М.: Физматгиз, 1959.
Вожьняковский (Wozniakowski H.)
[72] On nonlinear iterative processes in numerical methods (in Polish). Ph.
D. Thesis, Univ. of Warsaw A972).
[74] Maximal stationary iterative methods for the solution of operator
equations, SIAM J. Numer. Anal. 11 A974), 934—949.
[75] Generalized information and maximal order of iteration for operator
equations, SI AM J. Numer. Anal. 12 A975), 121 — 135.
[76] Maximal order of multipoint iterations using n evaluations, in
"Analytic Computational Complexity" (J. F. Traub, ed.), pp. 75—107.
Academic Press, New York, 1976.
Гайсарян С. С.
[69] Об одном оптимальном алгоритме приближенного вычисления
квадратур, ЖВМ и МФ, 1969, 9, № 5, с. 1015 — 1023.
[70] О выборе оптимальных сеток при численном решении задачи Коши для
системы обыкновенных дифференциальных уравнений, ЖВМ и МФ,
1970, 10, № 2, с. 465 — 474.
Ганшин Г. С.
[76] Вычисление наибольшего значения функций, ЖВМ и МФ, 1976, 16,
№ 1, с. 30-39.
[77] Оптимальные пассивные алгоритмы вычисления наибольшего значения
функций на отрезке, ЖВМ и МФ, 1977, 17, № 3, с. 562—571.
Гаффни (Gaffney P. W.)
[76] Optimal interpolation. D. Phil. Thesis, Oxford Univ. A976).
[77a] The range of possible values of f (x). Computer Science and Systems
Division Rep., AERE, Harwell, Oxfordshire A977).
[77b] To compute the optimal interpolation formula. Computer Science and
Systems Division Rep., AERE, Harwell, Oxfordshire A977). See also:
Math. Сотр. 32 A978), 763—777.
Гаффни, Пауэлл (Gaffney P. W., Powell M. J. D.)
[76] Optimal interpolation, in "Numerical Analysis" (G. A. Watson, ed.),
Lecture Notes in Math. Vol. 506, pp. 90—100. Springer Verlag, Berlin
and New York, 1976.
Голомб (Golomb M.)
[77] Interpolation operators as optimal recovery schemes for classes of
analytic functions, in "Optimal Estimation in Approximation Theory"
(C. A. Micchelli and T. J. Rivlin, eds.), pp. 93—138. Plenum Press,
New York, 1977.
Голомб, Вайнбергер (Golomb M., Weinberger H. F.)
[59] Optimal approximation and error bounds, in "On Numerical
Approximation" (R. E. Langer, ed.), pp. 117—190. The University of Wisconsin
Press, Wisconsin, 1959.
Гребенников А. И.
[78] Об оптимальном приближении нелинейных операторов, ЖВМ и МФ,
1978, 18, № 3, с. 762—766.
Гребенников А. И., Морозов В. А.
[77] Об оптимальном приближении операторов, ЖВМ и МФ, 1977, 17,
№ 1, с. 3—14.
Гросс, Джонсон (Gross О., Johnson S. М.)
[59] Sequential minimax search for a zero of a convex function, MTAC
(now Math. Сотр.), 13 A959), 44 — 51.
К части А 349
Гэл (Gal S.)
[72] Multidimensional minimax search for a maximum, SIAM. J. Appl.
Math., 23 A972), 513 — 526.
Гэл, Миккелли (Gal S., Micchelli C. A.)
[78] Optimal sequential and non-sequential procedures for evaluating a
functional. Univ. of Wisconsin-Madison Rep. 1871. See also Appl. Anal.,
10 A980), 105—120.
Гэри, Джонсон Д. (Garey M. R., Johnson D. S.)
[76] Approximation algorithms for combinatorial problems: An annotated
bibliography, in "Algorithms and Complexity: New Directions and Recent
Results" (J. F. Traub, ed.), pp. 41—52. Academic Press, New York,
1976.
Данилин Ю M.
[71] Оценка эффективности одного алгоритма отыскания абсолютного
минимума, ЖВМ и МФ, 1971, 11, № 4, с. 1026—1031.
де Бур (de Boor С.)
[77] Computational aspects of optimal recovery, in "Optimal Estimation in
Approximation Theory" (C. A. Micchelli and T. J. Rivlin, eds.), pp.69 —
91. Plenum Press, New York, 1977.
Джеттер (Jetter K.)
[76] Optimale Quadraturformeln mit semidefiniten Peano-kernen, Numer. Math,
25 A976), 23Э—249.
Джонсон Л., Рисе (Johnson L. W., Riess R. D.)
[71] Minimal quadratures for functions of low-order continuity, Math. Сотр.
25 A971), 831—835.
Джонсон С. (Johnson S. M.)
[56] Best exploration for maximum is Fibonaccian. RAND Corp. Rep. P—856
A956).
Емельянов К. В., Ильин А. М.
[67] О числе арифметических действий, необходимом для приближенного
решения интегрального уравнения Фредгольма II рода, ЖВМ и МФ,
1967, 7, № 4, с. 905-910.
Женсыкбаев А. А.
[76] О наилучшей квадратурной формуле на классе WrLv, ДАН СССР,
1976, 227, № 2, с. 277—279. Р
[77] О наилучших квадратурных формулах для некоторых классов
непериодических функций, ДАН СССР, 1977, 286, № 3, с. 531—534.
[78] Об одном свойстве наилучших квадратурных формул, Мат. заметки,
1978, 23, № 4, с. 551—562.
Жилейкин Я. М., Кукаркин А. Б.
[78] Об оптимальном вычислении интегралов от быстроосциллирующих
функций, ЖВМ и МФ, 1978, 18, № 2, с. 294—301.
Жилинскас А. Г.
[75] Одношаговый байесовский метод поиска экстремума функций одной
переменной, Кибернетика, 1975, № 1, 139—144.
Зализняк Н. Ф., Лигун А. А.
[78] Об оптимальных стратегиях поиска глобального максимума функции,
ЖВМ и МФ, 1978, 18, № 2, с. 314—321.
Зонневенд (Sonnevend G.)
[77J On optimization of algorithms for function minimization, ЖВМ и МФ,
1977, 17, № 3, с. 591-609.
Ибрагимов И. И., Алиев Р. М.
[65j Наилучшие квадратурные формулы для некоторых классов функций.
ДАН СССР, 1965, 162, № 1, с. 23-25.
Иванов В. В.
[72а] Об оптимальных алгоритмах минимизации функций некоторых
классов, Кибернетика, 1972, № 4, с. 81—94.
350 Литература
[72в] Об оптимальных алгоритмах вычислений сингулярных интегралов,
ДАН СССР, 1972, 204, № 1, с. 21-24.
[75] Об оптимальных по точности алгоритмах приближенного решения
операторных уравнений I рода, ЖВМ и МФ, 1975, 15, № 1, с. 3 — 11.
[77] Об оптимальных по точности алгоритмах приближения функций
некоторых классов на ЭВМ. — В кн.: Теория приближения функций.—
М.: Наука, 1977, с. 195 — 200.
Исмагилов Р. С.
[74] Поперечники множеств в линейных нормированных пространствах и
приближение функций тригонометрическими многочленами, УМН,
1974, 29, № 3, с. 161-178.
Карлин (Karl in С.)
[69] Best quadrature formulas and interpolytion by splines satisfying
boundary conditions, and the fundamental theorem of algebra for monosplines
satisfying certain boundary conditions and applications to optimal
quadrature formulae, in "Approximations with Special Emphasis on Spline
Functions" (I. J. Schoenberg, ed.), pp. 447 — 466, 467—484. Academic
Press, New York, 1969.
[71] Best quadrature formulas and splines, /. Approx. Theory 4 A971),
59—90.
Карп, Мирэнкер (Karp R. M., Miranker W. L.)
[68] Parallel minimax search for a maximum, /. Comb. Theory 4 A968),
19—35.
Каутски (Kautsky J.)
[70] Optimal quadrature formulae and minimal monosplines in La% J.
Austral. Mat. Soc. 11 A970), 48 — 56.
Кацевич (Kacewicz B.)
[75] Integrals with a kernel in the solution of nonlinear equation in N di*
mentions. Computer Science Department Rep., Carnegie-Mel Ion Univ.
A975). See also J. Assoc. Comput. Mach. 26A979), 239—249.
[76a] An integral-interpolation iterative method for the solution of scalar
equations, Numer. Math. 26 A976), 355—365.
[76b] The use of integrals in the solution of nonlinear equations in N
dimensions, in "Analytic Computational Complexity" (J. F. Traub, ed.), pp.
127 — 141. Academic Press, New York, 1976.
Кист (Keast P.)
[73] Optimal parameters for multidimensional integration, SI AM J. Numer.
Anal. 10 A973), 831-838.
Кифер (Kiefer J.)
[53] Sequential minimax search for a maximum, Proc. Amer. Math. Soc.
4 A953), 502-505.
[57] Optimum sequential search and approximation methods under minimum
regularity assumptions, J. Soc. Indust. Appl. Math. 5A957), 105—136.
Кнауфф, Кресс (Knauff W., Kress R.)
[74] Optimale Approximation linearer Funktionale auf periodischen Funktio-
nen, Numer. Math. 22 A974), 187 — 205.
[76] Optimale Approximation mit Nebenbedingungen an lineare Funktionale
auf periodischen Funktionen, Numer. Math. 25 A976), 149 — 159.
Кнут (Knuth D. E.)
[76] Big omicron and big omega and big theta, SJGACT News (April 1976),
18—24.
Колмогоров А. Н.
[36] Uber die beste Annaherung von Funktionen einer gegebenen Funktion-
klasse, Ann. of Math. 37 B) A936), 107—110.
[55] Оценки минимального числа элементов е-сетей в различных
функциональных классах и их применение к вопросу о представимости функ-
К части Л 351
ций нескольких переменных суперпозициями функций меньшего числа
переменных, УМН, 1955, 10, № 1, с. 192 — 194
Колмогоров А. Н., Тихомиров В. В.
[59] 8-энтропия и е-емкость множеств в функциональных пространствах,
УМН, 1959, 14, № 2, с. 3 — 86.
Коман (Coman Gh.)
[72] Monosplines and optimal quadrature formulae in Lpy Rend. Mat. 5
A972). 567 — 577.
Коман, Микула (Coman Gh., Micula Gh.)
[71] Optimal cubature formulae, Rend. Mat. 4 A971), 303—311.
Корнейчук Н. П.
[68] Наилучшие кубатурные формулы для некоторых классов функций
многих переменных, Мат. заметки, 1968, 3, № 5, с. 565—576.
[74[О новых результатах по экстремальным задачам теории квадратур.—
Добавление к кн.: Никольский С. М. Квадратурные формулы.—М.:
Наука, 1974, с. 136-223.
[76] Экстремальные за;ачи теории приближения.—М.: Наука, 1976.
Корнейчук Н. П., Лушпай Н. Е.
[69] Наилучшие квадратурные формулы для классов дифференцируемых
функций и кусочно-полиномиальное приближение, ИЛН СССР, сер.
мат., 1969, 33, № 6, с. 1416—1437.
Коробов Н. М.
[63] Теоретико-числовые методы в приближенном анализе.—М.: Физмат-
гиз, 1963.
Короткое В. Б.
[771 Об оценке снизу погрешности кубатурных формул, Сиб. мат. ж., 1977,
18, № 5, с. 1188-1191.
Кролак (Krolak P.)
[66] Property of the Krolak-Cooper extension of Fibonaccian search, SI AM
Rev. 8A966), 510—517.
[68] Further extensions of Fibonaccian search to nonlinear programming
problems SIAM J. Control. 6 A968), 258—265.
Кролак, Купер (Krolak P., Cooper L.)
[63] An extension of Fibonaccian search to several variables Comm. ACM 6
A963) 639—641.
Крылов В. И.
[67] Приближенное вычисление интегралов.—2-е изд.—М.: Наука, 1967,
гл. 11.
Кузовкин А. И., Тихомиров В. М.
[67] О количестве вычислений для нахождения минимума выпуклой
функции, ЭММ, 1967, 3, № 1, с. 95 — 103.
Кунг (Kung H. Т.)
[76] The complexity of obtaining starting points for solving operator by
Newton's method, in "Analytic Computational Complexity" (J. F. Traub,
ed.), pp. 35—57. Academic Press, New York, 1976.
Кунг, Трауб (Kung H. Т., Traub J. F.)
[74] Optimal order of one-point and multipoint iterations, J. Assoc. Comput.
Mach. 21 A974), 643-651.
[76] Optimal order and efficiency for iterations with two evaluations, SIAM
J. Numer. Anal. 13 A976), 84 — 99.
Ларкин (Larkin F. M.)
[70] Optimal approximation in Hilbert space with reproducing kernel
functions, Math Сотр. 24 A970), 911—921.
Левин А. Ю.
[65] Об одном алгоритме минимизации ' выпуклых функций, ДАН СССР,
1965, 160, № 6, с. 1244 — 1247.
352 Литература
Левин М. И., Гиршович К). /М
[77] Экстремальные задачи для кубатурных формул, ДАН СССР, 1977,
236, № б, с. 1303—1306.
Левин М. И., Гиршович Ю. М,
[77] Экстремальные задачи для кубатурных формул, ДАН СССР, 1977,
236, № 6, с. 1303—1306.
Левин М. И., Гиршович Ю. JVL, Арро В. К.
[76] О наилучших на множествах функций квадратурных формулах, ДАН
СССР, 1976, 226, № 1, с. 51—54.
Ли (Lee J. W.)
[77] Best quadrature formulas and splines, «/. Approx. Theory 20 A977),
348—384.
Лигун A. A.
[76] Точные неравенства для сплайн-функций и наилучшие квадратурные
формулы для некоторых классов функций, Мат. заметки, 1976, 19,
№ 6, с. 913-926.
Липоу (Lipow P. R.)
[73] Spline functions and intermediate best quadrature formulas, SI AM J.
Numer. Anal 10 A973), 127-136.
Лоренц (Lorentz G. G.)
[66] "Approximation of Functions", Holt, New York, 1966.
Лоуб, Вернер (Loeb H. L., Werner M.)
[74] Optimal numerical quadrature in Hp spaces, Math. Z. 138 A974),
Лушпай Н. E.
[66] Наилучшие квадратурные формулы на некоторых классах функций.—
В кн.: Материалы межвузовской конференции молодых
ученых-математиков.— Харьков, 1966, с. 58—62.
[69] Наилучшие квадратурные формулы на классах дифференцируемых
периодических функций, Мат. заметки, 1969, 6, № 4, с. 475—480.
[74] Наилучшая квадратурная формула на классе WrL2 периодических
функций, Мат. заметки, 1974, 16, № 2, с. 193—204.
Майстровский Г. Д.
[72] Об оптимальности метода Ньютона, ДАН СССР, 204, № 6, с. 1313—
1315.
Мангасарян, Шумейкер (Mangasarian О. L., Schumaker L. L.)
[73] Best summation formulae and discrete splines, SI AM J. Numer. Anal.
10 A973), 448-459.
Марчук А. Г., Осипенко К. Ю.
[75] Наилучшее приближение функций, заданных с погрешностью в
конечном числе точек, Мат. заметки, 1975, 17, № 3, с. 359—368.
Маунг Чжо Ньюн, Шарыгин И. Ф. (Maung Czo Njun)
[71] Оптимальные кубатурные формулы на классах D\ c и Dslf l%.— В сб.:
Вопросы вычислительной и прикладной математики. Вып. 5.—Ташкент,
1971, с. 22—27.
Меерсман (Meersman R.)
[76а] Optimal use of information in certain iterative processes, in "Analytic
Computational Complexity" (J. F. Traub, ed.), pp. 109—125. Academic
Press, New York, 1976.
[76b] On maximal order of families of iterations for nonlinear equations.
Doctoral Thesis, Vrije Univ. Brussel, Brussels, 1976.
Мейерз, Сард (Meyers L. F., Sard A.)
[50a] Best approximate integration formulas, J. of Math, and Phys. 28 A950),
118-123.
[50b] Best interpolation formulas, J. of Math, and Phys. 29 A950), 198—206.
К части А 353
Мелкмэн (Melkman А. А.)
[77] я-widths and optimal interpolation of time- and band-limited functions,
in "Optimal Estimation in Approximation Theory" (C. A. Micchelli and
T. J. Rivlin, eds.), pp. 55—68. Plenum Press, New York, 1977.
Мелкмзн, Миккелли (Melkman A. A., Micchelli C. A.)
[77] Optimal estimation of linear operators in Hilbert spaces from inaccurate
data. Univ. Bonn Rep. A977). See also SIAM /. Numer. Anal 16
A979), 87—105.
Менге (Meinguet J.)
[67] Optimal approximation and error bounds in seminormed spaces, Numer.
Math 10 A967), 370—388.
Миккелли (Micchelli G. A.)
[75] Optimal estimation of linear functionals. IBM Research Rep. 5729 A975).
|76] On an optimal method for the numerical differentiation of smooth
functions, /. Approx. Theory 18 A976), 189—204.
[78] Private communication A978).
Миккелли, Мирэнкер (Micchelli С. A., Miranker W. L.)
[75] High order search methods for finding roots, Л Assoc. Comput. Mach.
22 A975), 51—60.
Миккелли, Пинкус (Micchelli С. A., Pinkus A.)
[77] On a best estimator for the class Mr using only function values, Indiana
Univ. Math. J. 26 A977), 751—759.
Миккели, Ривлин (Micchelli С. A., Rivlin T. J.)
[77] A survey of optimal recovery, in "Optimal Estimation in Approximation
Theory" (G. A. Micchelli and T. J. Rivlin, eds.), pp. 1—54. Plenum
Press, New York, 1977.
Миккелли, Ривлин, Виноград (Micchelli С. A., Rivlin Т. J., Winograd S.)
[76] The optimal recovery of smooth functions, Numer. Math. 26 A976),
191—200.
Моторный В. П.
[73] О наилучшей квадратурной формуле вида 2*=i Pkf (xk) Для
некоторых классов периодических дифференцируемых функций, ДАН СССР,
1973, 211, № 5, с. 1060—1062.
[74] О наилучшей квадратурной формуле вида 2j?-i Pif (xi) Для некоторых
классов периодических дифференцируемых функций, И АН СССР, сер.
мат., 1974, 38, № 3, с. 583-614.
[76] Некоторые экстремальные задачи теории квадратур и приближения
функций, Мат. заметки, 1976, 19, № 2, с. 299—311.
Моцкус И. Б.
[72] О байесовых методах поиска экстремума, Автоматика и вычисл. техн^
1972, № 3, с. 53—62.
Мэнсфилд (Mansfield L. Е.)
[71] On the optimal approximation of linear functionals in spaces of bivariate
functions, SIAM J. Numer. Anal. 8 A971), 115—126.
[72] Optimal approximation and error bounds in spaces of bivariate functions,
/. Approx. Theory 5 A972), 77-96.
Никольский С. М.
[50] К вопросу об оценках приближений квадратурными формулами, УМН,
1950, 5, № 2, с. 165-177.
[58] Квадратурные формулы.—3-е изд.—М.: Наука, 1979.
Нильсон Г. (Nielson G. М.)
[73] Bivariate spline functions and the approximation of linear functionals,
Numer. Math. 21 A973), 138—160.
Ньюмэн (Newman D. J.)
[65] Location of the maximum on unimodal surfaces, Jt Assoc. Comput, Mack.
12 A965), 395-398.
12 м 564
354 Литература
Осипенко К. К).
[72] Оптимальная интерполяция аналитических функций, Мат. заметки,
1972, 12, № 4, с. 465—476.
[76] Наилучшее приближение аналитических функций по информации об
их значениях в конечном числе точек, Мат, эаметки, 1976, 19, № 1,
с. 29—40.
Паллашке (Pallaschke D.)
[76] Optimale differentiations und integralionsformeln in Co [a, b], Numer.
Math. 16 A976), 201—210.
Пан (Pan V.)
[78] Strassen's algoritms is not optimal: Trilinear technique of aggregating,
uniting and canceling for construction fast algorithms for matrix
operations, 19th Ann. Symp. Foundations of Comput. Sci., IEEE Computer
Society A978).
Паулик (Paulik A.)
[77] Zur Existenz optimaler Quadraturformeln mit freien Knoten bei
Integration analytischer Funktionen, Numer. Math. 27 A977), 395—405.
Пинкус (Pinkus A.)
[75] Asymptotic minimum norm quadrature formulae, Numer. Math. 24 A975),
163—175.
Пиявский С. А.
[72] Один алгоритм отыскания абсолютного экстремума функции, ЖВМ и
МФ, 1972, 12, № 4, с. 888—896.
Райнш (Reinsch Ch.)
[74] Two extensions of the Sard-Schoenberg theory of best approximation,
SI AM J. Numer. Anal. 11 A974), 45—51.
Райе (Rice J. R.)
[73] On the computational complexity of approximation operators, in
"Approximation Theory" (G. G. Lorentz, ed), pp. 449—456. Academic Press,
New York, 1973.
[76] On the computational complexity of approximation operators II, in
"Analytic Computational Complexity" (J. F. Traub, ed.), pp. 191—204.
Academic Press, New York, 1976.
Риттер (Ritter K.)
[70] Two dimensional spline functions and best approximations of linear
functional, /. Approx. Theory 3 A970), 352—368.
Рихтер (Richter N.)
[70] Properties of minimal integration rules, SI AM J. Numer Anal, 7 A970),
67—79.
Рихтер-Дин (Richter-Dyn N.)
[71a] Properties of minimal integration rules, II, SI AM J. Numer. Anal» 8
A971), 497—508.
Mil
[71b] Minimal interpolation and approximation in Hilbert spaces, SIAM J.
Numer. Anal. 8 A971), 583-597.
Сард (Sard A.)
[49] Best approximate integration formulas: best approximation formulas,
Amer. J. Math. 71 A949), 80—91.
[63] "Linear Approximation", American Math. Soc, Providence, Rhode Island,
1963.
[67] Optimal approximation, /. Functional Anal. 1 A967), 222—244.
[73] Approximation based on nonscalar observations, J. Approx. Theory 8
A973), 315-334.
Секрест (Secrest D.)
[64] Numerical integration of arbitrarily spaced data and estimation of errors,
SIAM J. Numer. Anal. Ser. B. 2 A964), 52—68.
[65a] Error bounds for interpolation and differentiation by the use of spline
functions, SIAM J. Numer. Anal. Ser. B. 2 A965), 440-147.
К части А 355
[65b] Best approximate integration formulas and best error bounds, Math.
Сотр. 19 A965), 79—83.
Смоляк С. А.
[60| Интерполяционные и квадратурные формулы на классах Wf и Ef
ДАН СССР, 1960, 131, № 5, с. 1028—1031.
[65] Об оптимальном восстановлении функций и функционалов от них,
Канд. дисс, МГУ, 1965.
Соболев С. Л.
[65] О порядке сходимости кубатурных формул, ДАН СССР, 1965, 162,
№ 5, с. 1005—1008.
{74] Введение в теорию кубатурных формул.— М.: Наука, 1974.
Соболь И. М.
[69] Многомерные квадратурные формулы и функции Хаара.— М.: Наука,
1969.
Стенгер (Stenger F.)
[78] Optimal convergence of minimum norm approximations in Hp, Nwner*
Math. 29 A978), 345—362.
Стеттер (Stetter F.)
[691 On best quadrature of analytic functions, Quart. Appl. Math. 27 A969),
270—272.
Стечкин С. Б.
[671 Наилучшее приближение линейных операторов, Мат. ваметки, 1967.
1, № 2, с. 137-148.
Стерн (Stern M. D.)
[67] Optimal quadrature formulae, Comput. J. 9 A967), 396—403.
Стронгин Р. Г.
[78] Численные методы в многоэкстремальных задачах.— М.: Наука, 1978.
Сухарев А. Г.
[71] Об оптимальных стратегиях войска экстремума, ЖВМ и МФ, 1971,
11, № 4, с. 910—924.
[72J Наилучшие стратегии последовательного поиска экстремума, ЖВМ и
МФ, 1972, 12, № 1, с. 35—50,
[75] Оптимальный поиск экстремума.— М.: Изд-во Моск. ун-та, 1975.
[76] Оптимальный поиск корня функции, удовлетворяющей условию
Липшица, ЖВМ и МФ, 1976, 16, № 1, с. 20—29.
[78а] Оптимальный метод построения наилучших равномерных
приближений для функций некоторого класса, ЖМВ и МФ, 1978, 18, № 2,
с. 302—313.
[78b] Optima) quadrature formulas for some functional classes. Report, 1978.
Тайков Л. В.
[68] Неравенства типа Колмогорова и наилучшие формулы численного
дифференцирования, Мат. заметки, 1968, 4, № 2, с. 233—238.
Тарасова В. П.
[78] Оптимальные стратегии поиска области наибольших значений для
некоторого класса функций, ЖВМ и МФ, 18, № 4, с. 886—896.
Тихомиров В. М.
[60] Поперечники множеств в функциональном пространстве и теория
наилучших приближений, УМН, 1960, 15, № 3, с. 81 — 120.
[65] Одно замечание об я-мерных поперечниках множеств в банаховых
пространствах, УМН, 1965. 20, № 1, с. 227—230.
[69] Наилучшие методы приближения и интерполирования
дифференцируемых функций в пространстве С[—1,1], Мат. сб., 1969, 80, № 2,
с. 290—304.
[76] Некоторые вопросы теории приближений.—М.: Изд-во Моск. ун-та,
1976.
12*
356 Литература
Тихонов А. Н., Гайсарян С. С.
[69] О выборе оптимальных сеток при приближенном вычислении
квадратур, ЖВМ и МФ, 1969, 9, № 5, с. 1170—1176.
Тодд (Todd M. J.)
[76] Optimal dissection of simplices. Department of Operations Research Rep.t
Cornell Univ. A976).
Трауб [Traub J. F.)
[61] On functional iteration and the calculation of roots, Preprints of Papers
16th Nat. ACM. Conf. Session 5A-1, pp. 1—4. Los Angeles,
California, 1951.
[64] "Iterative Methods for the Solution of Equations", Prentice-Hall, Engle-
wood Cliffs, New Jersey, 1964.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.)
[76a] Optimal linear information for the solution of nonlinear operator
equations, in "Algorithms and Complexity: New Directions and Recent
Results" (J. F. Traub, ed.), pp. 103—119. Academic Press, New York,
1976.
[76b] Optimal radius of convergence of interpolatory iterations for operator
equations, Dept. of Computer Science Rep., Carnegie-Mellon Univ. A976).
See also Aequationes Math., 21 A980), 159—172.
[77a] Convergence and complexity of Newton iteration for operator equations,
Dept. of Computer Science Rep., Carnegie-Mellon Univ. A977). See also
/. Assoc. Comput. Mach. 26 A979), 250—258.
[77b] Convergence and complexity of interpolatory-Newton iteration in a
Banach space. Dept. of Computer Science Rep., Carnegie-Mellon Univ.
A977). See also Сотр. and Maths with Appls, 6 A980), 385—400.
Троян (Trojan J. M.)
[79] Tight bounds on the complexity index of one-point iterations A979). See
also Сотр. and Maths with Appls. 6 A980), 433—441.
Уайлд (Wilde D. J.)
[64] Методы поиска экстремума.— M.: Наука, 1967.
Уилф (Wilf H. S.)
[64] Exactness conditions in numerical quadrature, Numer. Math.t 6 A964),
315—319.
Файн (Fine T.)
[66] Optimum search for the location of the maximum of a unimodal function,
IEEE Trans. Informat. Theory IT-12 A966), 103—111.
Форст (Forst W.)
[75] Zur Optimal itat interpolatorischer Quadraturformeln periodischer Funk-
tionen, Numer. Math. 25 A975), 15—21.
[77] Optimale Hermite-interpolation differenzier barer periodischer Funktionen,
J. Approx. Theory 20 A977) 333—347.
Холмз (Holmes R.)
[72] /^-splines in Banach spaces; I. Interpolation of linear manifolds, J. Math.
Anal. AppU 40 A972), 574—593.
Хэйбер (Haber S.)
[71] The error in numerical integration of analytic functions, Quart. Appl.
Math. 29 A971), 411—420.
Чавла, Кауль (Chawla M. M., Kaul V.)
[73] Optimal rules for numerical integration round the unit circle, BIT 13
A973), 145—152.
Ченцов Н. H.
[61] О квадратурных формулах для функций бесконечно большого числа
переменных, ЖМВ и МФ, 1961, 1, № 3, с. 418—424.
Черноусько Ф. Л.
[68] Оптимальный алгоритм поиска корня функции, вычисляемой
приближенно, ЖВМ и МФ, 1968, 18, № 4, с. 705—724.
К части А 357
[70а] Об оптимальном поиске минимума выпуклых функций, ЖВМ и МФ,
1970, 10, № 6, с. 1355-1366.
[70Ь] Об оптимальном поиске экстремума унимодальных функций, ЖВМ
и МФ, 1970, 10, № 4, с. 922—933.
Чжан Гуанцзюань (Chzhan Guan-Tszjuan)
[62] О минимальном числе узлов при численном интегрировании
уравнения теплопроводности, ЖВМ и МФ, 1962, 2, № 2, с. 80—88.
Шайдаева Т. А.
[59] Квадратурные формулы с наименьшей оценкой остатка для некоторых
классов функций, Труды Матем. ин-та им. Стеклова, 1959, 53,
с. 313-341.
Шарыгин И. Ф.
[63] Оценки снизу погрешности квадратурных формул на классах функций,
ЖВМ и МФ, 1963, 3, № 2, с. 370—376.
[77] Оценка снизу погрешности формулы приближенного суммирования на
классе Es Р(С), Мат. заметки, 1977, 21, № 3, с. 371—375.
Шёнберг (Schoenberg I. J.)
[64а] On best approximations of linear operators, Nederl. Akad. Wetensch.
Indag. Math. 67 A964), 155—163.
[64b] Spline interpolation and best quadrature formulae, Bull. Amer. Math.
Soc. 70 A964), 143—148.
[65] On monosplines of least deviation and best quadrature formulae,
SIAM J. N timer. Anal. Ser. В 2 A965), 144—170.
[66] On monosplines of least square deviation and best quadrature formulae II,
SIAM J. Numer. Anal. 3 A966), 321—328.
[69] Monosplines and quadrature formulae, in "Theory and Applications of
Spline Functions" (T. N. E. Greville, ed.), pp. 157—207. Academic
Press, New York, 1969.
[70] A second look at approximate quadrature formulae and spline
interpolation, Advances in Math. 4 A970), 277—300.
Шмайсер (Schmeisser G.)
[72] Optirnale Quadraturformeln mit semidefiniten Kernen, Numer. Math. 20
A972), 32—53.
Шульц (Schultz M. H.)
[74] The complexity of linear approximation algorithms, in "Complexity of
Computation" (R. M. Karp, ed), pp. 135—148. American Mathematical
Soc, Providence, Rhode Island, 1974.
Эвриэл, Уайлд (Avriel M., Wilde D. J.)
[66] Optimal search for a maximum with sequences of simultaneous function
evaluations, Management Sci. 12 A966), 722—731.
Эдварде (Edwards R. E.)
[65] Функциональный анализ.— M.: Мир, 1969.
Экхардт (Eckhardt U.)
[68] Einige Eigenschaften Wilfscher Quadraturformeln, Numer. Math. 12
A968), 1—7.
Элхей (Elhay S.)
[69] Optimal quadrature, Bull. Austral. Math. Soc, 1 A969), 81—108.
Энслоун, Лоран (Anselone P. M., Laurent P. J.)
[68] A general method for the construction of interpolating or smoothing
spline functions. Numer. Math. 12 A968), 66—82.
Юдин Д. Б., Немировский А. С.
[76а] Оценка информационной сложности задач математического
программирования, ЭММ, 1976, 12, № 1, с. 128—142.
[76Ь] Информационная сложность и эффективные методы решения выпуклых
экстремальных задач, ЭММ, 1976, 12, № 2, с. 357—369.
[77] Информационная сложность строго выпуклого программирования,
ЭММ, 1977, 13, № 3, с. 550—559.
358 . Литература
Яфиль (Hyafil L.)
[77] Optimal search for the zero of the (n — l)st derivative, IRIA/LABORIA
Rep. No. 247 A977).
К части В
Ахо, Хопкрофт, Ульман (Aho А. V., Hopcroft J. E., Ullman J. D.)
[74] Построение и анализ вычислительных алгоритмов.— М.: Мир, 1979.
Брент (Brent R. Р.)
[72] The computa~ onal complexity of iterative methods for systems of
nonlinear equations, in "Complexity Symp". (R. E. Miller and J. W.
Thatcher, eds.), pp. 61—71. Plenum Press, New York, 1972.
[76] A class of optimal-order zero-finding methods using derivative
evaluations, in "Analytic Computational Complexity" (J. F. Traub, ed.),
pp. 59—75. Academic Press, 1976.
Брент, Виноград, Вулф (Brent R. P., Winograd S., Wolfe P.)
[73] Optimal iterative processes for rootfinding, Numer. Math. 20 A973),
327—341.
Васильковский (Wasilkowski G. W.)
[77] W-Evaluation conjecture for multipoint iterations for the solution of
scalar nonlinear equations. Master's Thesis, Dept. of Mathematics, Univ.
of Warsaw A977). See also J. Assoc. Comput. Mack. 28 A981), 71—80.
[78] Can any stationary iteration using linear information be globally
convergent? Dept. of Computer Science Rep., Carnegie-Mellon Univ. A978).
See also /. Assoc. Comput. Mack. 27 A980), 263—269.
[79] Any iteration for polynomial equations using linear information has
infinite complexity. Dept. of Computer Science Rep., Carnegie-Mellon
Univ. A979).
Вершульц (Werschulz A. G.)
[77a] Maximal order and order of information for numerical quadrature.
Mathematics Research Rep. 77-2, Univ. of Maryland, Baltimore County
A977). See also /. Assoc. Comput. Mach. 26 A979), 527—537.
[77b] Maximal order for approximation of derivatives. Mathematics Research
Rep. 77-8. Univ. of Maryland, Baltimore County A977). See also J. of
Comput. System Sci. 18 A979), 213—217.
Вожьняковский (Wozniakowski H.)
[72] On nonlinear iterative processes in numerical methods. D. Thesis, Univ.
of Warsaw A972) (in Polish).
[74] Maximal stationary iterative methods for the solution of operator
equations, SI AM J. Numer. Anal. 11 A974), 934—949.
[75] Generalized information and maximal order of information for operator
equations, SI AM J. Numer. Anal., 12 A975), 121—135.
[76] Maximal order of multipoint iterations using n evaluations, in
"Analytic Computational Complexity" (J. F. Traub, ed.), pp. 75—107.
Academic Press, New York, 1976.
Кацевич (Kacewicz B.)
[75] Integrals with a Kernel in the Solution of Nonlinear Equations in N
Dimensions. Dept. of Computer Science Rep., Carnegie-Mellon Univ.
A975). See also J. Assoc. Comput. Mach. 26 A979), 239—249.
[76a] An integral-interpolation iterative method for the solution of scalar
equations, Numer. Math. 26 A976), 355—365.
[76b] The use of integrals in the solution of nonlinear equations in N
dimensions, in "Analytic Computational Complexity" (J. F. Traub, ed.),
pp. 127—141. Academic Press, New York, 1976.
[77] Private communication.
Кацевич, Вожьняковский (Kacewicz В., Wozniakowski H.)
[77J A survey of recent problems and results in analytic computational comp-
К части В 359
lexity. "Mathematical Foundations of Computer Science 77" (J. Gruska,
ed.), Lecture Notes in Computer Science No. 53, pp. 93—107. Springer-
Verlag, Berlin and New York, 1977.
Кнут (Knuth D. E.)
[76] Big omicron and big omega and big theta, SIGACT News (April 1976),
Кунг (Kung H. T.)
[76] The complexity of obtaining starting points for solving operator
equations by Newton's method, in "Analytic Computational Complexity"
(J. F. Traub, ed.), pp. 35-57. Academic Press, New York, 1976.
Кунг, Трауб (Kung H. Т., Traub J. F.)
[74] Optimal order of one-point and multipoint iterations, J. Assoc. Compute
Mach. 21 A974), 643-651.
[76a] All algebraic functions can be computed fast. Dept. of Computer
Science Rep., Carnegie-Mellon Univ. A976). See also J. Assoc. Comput.
Mach. 25 A978), 245—260.
[76b] Optimal order and efficiency for iterations with two evaluations,
SIAM J. Numer. Anal. 13 A976), 84—99.
Меерсман (Meersman R.)
[76a] Optimal use of information in certain iterative processes, in "Analytic
Computational Complexity" (J. F. Traub, ed.), pp. 127—141. Academic
Press, New York, 1976.
[76b] On maximal order of families of iterations for nonlinear equations,
D. Thesis, Vrije Univ. Brussels, Brussels A976).
Ортега, Рейнболдт (Ortega J. M., Rheinboldt W. C.)
[70] Итерационные методы решения нелинейных систем уравнений со
многими неизвестными.— М.: Мир, 1975.
Плешаков Г. Н.
[77] Об эффективности многомерных интерполяционных итераций, ЖВМ
и МФ, 1977, 17, № 5, с. 1153-1160.
Саари, Саймон (Saari D. G., Simon С. Р.)
[78] Effective price mechanisms, Econometrica, 46 A978), 1097—1125.
Трауб (Traub J. F.)
[61] On functional iteration and calculation of roots, Preprints Papers, 16th
Nat. ACM Conf., Session 5A-1, pp. 1—4. Los Angeles, California A961).
[64] "Iterative Methods for Solution of Equations", Prentice-Hall, Englewood
Cliffs, New Jersey, 1964.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.)
[76a] Strict lower and upper bounds on iterative computational complexity,
in "Analytic Computational Complexity" (J. F. Traub, ed.), pp. 15—34.
Academic Press, New York, 1976.
[76b] Optimal linear information for the solution of nonlinear equations, in
"Algorithms and Complexity: New Directions and Recent Results"
(J. F. Traub, ed.), pp. 103—119. Academic Press, New York, 1976.
[76g] Optimal radius of convergence of interpolatory iterations for operator
equations. Dept. of Computer Science Rep., Carnegie-Mellon Univ.
П976). See also Aequationes Math., 21 A980), 159-172.
[77a] Convergence and complexity of Newton iteration for operator equations.
Dept. of Computer Science Rep., Carnegie-Mellon Univ. A977). See also
/. Assoc. Comput. Mach. 26 A979), 250-258.
[77b] Convergence and complexity of interpolatory-Newton iteration in a Ba-
nach space. Dept. of Computer Science Rep., Carnegie-Mellon Univ.
A977). To appear In Сотр. and Maths, with Appls.
Янковская (Jankowska J.)
[Щ Multivariate Secant Method. Ph. D. Thesis, Univ. of Warsaw A975),
See also SIAM Jt Numer, Anal. 16 A979), 547-562.
360 Литература
К части С
Брент, Виноград, Вулф (Brent R. P., Winograd S., Wolfe P.)
[73] Optimal iterative processe for rootfinding, N timer. Math. 20 A973),
327—341.
Виноград (Winograd S.)
[76] Some remarks on proof techniques in analytic complexity, in "Analytic
Computational Complexity" (Jb F. Traub, ed.), pp. 5—14. Academic
Press, New York, 1976.
Вожьняковский (Wozniakowski H.)
[75] Generalized information and maximal order of information for operator
equations, SIAM J. Numer. Anal. 12 A975), 121—135.
Голом б, Вайнбергер (Golomb M., Weinberger H. F.)
[59] Optimal approximation and error bounds, in "On Numerical
Approximation" (R. E. Langer, ed.), pp. 117—190. Univ. of Wisconsin Press,
Madison, Wisconsin, 1959.
Кифер (Kiefer J.)
[53] Sequential minimax search for a maximum, Proc, Amer. Math, Soc, 4
A953), 502—505.
Миккелли, Ривлин (Micchelli С. A., Rivlin T. J.)
[77] A survey of optimal recovery, in "Optimal Estimation in Approximation
Theory" (C. A. Micchelli and T. J. Rivlin, eds.), pp. I—54. Plenum
Press, New York, 1977.
Никольский С. М.
[50] К вопросу об оценках приближений квадратурными формулами, УМН,
1950, 5, № 2, с. 165-177.
Сард (Sard A.)
[49] Bstt approximate integration formalas; Best approximation formulas,
Amer. J. Math. 71 A949), 80—91.
Смоляк С. А.
[65] Об оптимальном восстановлении функций и функционалов от них,
Канд. дисс, МГУ, 1965.
Трауб (Traub J. F.)
[61] On functional iteration and calculation of roots, Preprints Papers, 16th
Nat. ACM Con].y Session 5A-1, pp. 1—4. Los Angeles, California, 1961.
[64] "Iterative Methods for Solution of Equations". Prentice-Hall, Englewood
Cliffs, New Jersey, 1964.
[72] Computational complexity of iterative processes, SIAM J, Comput. 1
A972), 167-179.
Трауб, Вожьняковский (Traub J. F., Wozniakowski H.)
[76] Optimal linear information for the solution of nonlinear equations, in
"Algorithms and Complexity: New Directions and Recent Results"
(J. F. Traub, ed.), pp. 103—119. Academic Press, New York, 1976,
[77] General theory of optimal error algorithms and analytic complexity,
part A: General information model. Dept. of Computer Science Rep.,
Carnegie-Mellon Univ. A977).
[78] General theory of optimal error algorithms and analytic complexity,
part B: Iterative information model. Dept. of Computer Science Rep,,
Carnegie-Mellon Univ. A978).
Шёнберг (Schoenberg I. J.)
[64] Spline interpolation and best quadrature formulae, Bull, Amer. Math,
Soc, 70 A964), 143—148,
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ
Обозначения приводятся в порядке их появления.
К части А
S оператор решения (назы- гл. 1# B.1)
ваемый иногда задачей),
•S*. \Sq > ^29 Vq CZ -Jj
30 область определения one- гл. lf B.1)
ратора S
3j линейное пространство, гл. 1* § 2
30c3f
3g пространство значений гл. 1, § 2
оператора S
е параметр погрешности, гл. 1, § 2
е>0
x~x(f) е-приближение (или е-ап- гл. 1, B.2)
проксимация), ре—о||<в
/ элемент задачи, /€30 гл. lf § 2
а элемент решения, a = S(f) гл. 1, § 2
$1 информационный опера- гл. 1, B.3)
тор, 31: Ди-*3з
Зд пространство значений гл. 1, B.3)
оператора ?1
d($l> S) диаметр информации 91 гл. 1, опр. 2,1,
для задачи 5 B.9)
r($l,S) радиус информации Ш для гл. 1, опр. 2.1,
задачи 5 BЛ0)
Ф алгоритм, ср: 9?C0)--*32 гл. 1, § 2
е(ф) погрешность алгоритма ф гл. 1, опр. 2.2,
B.13)
Ф(Ш, S) класс всех алгоритмов, гл. 1, § 2
использующих
информацию Ш для задача 5
Ф1 интерполяционный алго- гл. 1, опр. 2.3t
ритм для задачи 5 при B.16)
использовании
информации 91
362 Указатель обозначений
e($l,S) оптимальная погрешность гл. 1, опр. 2.4,
B.18)
<рое оптимальный по точности гл. 1, опр. 2.4,
алгоритм для задачи S B.19)
при информации Ш
Фс центральный алгоритм для гл. 1, опр. 2.6,
задачи S при использо- B.23)
вании информации 91
Р набор простейших опера- гл. 1, § 3
ций
сотр(9?(/)) информационная слож- гл. 1, § 3
ность вычисления 9?(jf),
где Ш—допустимый
информационный оператор
comp(q>(#)) комбинаторная сложность гл. 1, § 3
вычисления ф(#), где
Ф —допустимый
алгоритм
Ф(е) класс всех допустимых гл. 1, § 3
алгоритмов, для
которых е(ф) < е
г (9t, S)^e задача S при использова- гл. 1, § 3
нии информации 91
является е-неразрешимой
г(91, S) < 8 задача S при допустимом гл. 1, § 3
9Z и Ф (г) Ф 0 является
е-неразреш'имой по
отношению к Р
сотр(ф) сложность алгоритма ф гл. 1, C.1)
comp(9l, S, е) е-сложность задачи S при гл. 1, опр. 3.1,
использовании инфор- C.2)
мации Ш
Фос оптимальный по сложно- гл. 1, опр. 3.1,
сти алгоритм для зада- C.3)
чи S при использовании
информации 9?
comp(9t) информационная слож- гл. 1, C.4)
ность
? класс допустимых инфор- гл. 1, C.8)
мационных операторов
compDrjS>e) е-сложность задачи S в гл. 1, опр. 3.2,
классе ? C.9)
Фос оптимальный по слож- гл. 1, опр. 3.2,
ности алгоритм для за- C.10)
дачи S в классе W
SftjC^a ker 9l2 с ker % (см. также гл. 2, опр. 2.1
К части А 363
более общее определение
в § 2 гл. 7)
5RiX9t2 ker9l! = ker^2 (см. также гл. 2, опр. 2.1
более общее определение
в § 2 гл. 7)
Лх алгебраическое дополне- гл. 2, B.1), B.2)
ние к А
сосНтЛ коразмерность А гл. 2, B.2)
card (Ш) кардинальность информа- гл. 2, опр. 2.2,
ции Ш (см. также более B.5)
общее определение в § 2
гл. 7)
Т оператор ограничений, гл. 2, C.1)
Т: 3,^34
34 пространство значений гл. 2, C.1)
оператора Т
d($l>S,T) диаметр информации Ш гл. 2, § 3
для задачи (S, Т)
ind {S,T) индекс задачи (S,T) гл. 2, опр. 3.1
А(Т, S) алгебраическое дополне- гл. 2, C.3)
ние к подпространству
ker Т П ker S в
пространстве кегТ
Ц ...,?** базис в А(Т, S), л*= гл. 2. C.3)
= ind (S, Т)
01* информационный опера- гл. 2, D.1)
тор, такой что card(9t*)=
ind(S, 7) и кегЭТ*П
П кег Г с ker S
Т~х оператор, обратный к Т гл. 2, D.3)
1?п класс всех информацион- гл. 2, § 4
ных операторов ЭТ,
таких что 9?* с 9i и
card (97) ^ п (см. также
более общие
определения в § 6 гл. 2 и § 2
гл. 7)
d(ny S, Т) п-й минимальный диаметр гл. 2, опр. 4.1,
информации D.6)
$1% п-я оптимальная информа- гл. 2, опр. 4.1,
ция (см. также более D.7)
общие определения в § 6
гл. 2 и § 3 гл. 7)
К линейный оператор, К =« гл. 2, D.9)
«= ST-*
364 Указатель обозначений
b(m,K) tn-я минимальная норма гл. 2, D.9)
линейного оператора К
Вт т-е минимальное подпро- гл. 2, D.10),
странство линейного D.11)
оператора К
d(S,T) диаметр погрешности за- гл. 2, опр. 4.2,
дачи D.15)
) = +оо задача (S, Т) сильно не- гл. 2, опр. 4.2
разрешима
T)^2e задача (S, Т) е-неразре- гл. 2, опр. 4.2
шима
d(S9 T) = 0 задача обладает свойством гл. 2, опр. 4.2
сходимости
^?п класс всех линейных ин- гл. 2, § 6
формационных
операторов с card (ЭД) ^ п
(обобщение определения из
§ 4 гл. 2; см. также § 2
гл. 7)
sd(n, 5, 30) /г-й минимальный диаметр гл. 2, опр. 6.1,
информации F.2)
9Й1 n-я оптимальная информа- гл. 2, опр. 6.1,
ция (обобщение опреде- F.3)
ления из § 4 гл. 2; см.
также § 3 гл. 7)
dn(X, 32) ^-поперечник по Гельфан- гл. 2, F.4)
ду множества X в 32
dn==sdrt(iSC0), 32) л-поперечник по Гельфан- гл. 2, F.5)
ду множества значений
в 32 оператора решения
Ап я-е экстремальное подпро- гл. 2, F.12)
странство для SC0) в
смысле Гельфанда
91* адаптивный линейный ин- гл. 2, G.2)
формационный оператор
<Dl(/z) класс линейных алгорит- гл. 3, § 5
мов, использующих
линейную информацию
кардинальности не
выше п
%,(п) = X (n, S) п-я минимальная линей- гл. 3, E.1)
ная погрешность
1Й(А,32) линейный /г-поперечник по гл. 3, E.2)
Колмогорову
множества X в пространстве За
К части А 365
, 32) м-поперечник по Колмого- гл. 3, E.3);
рову множества X в 32 гл. 7, D.1)
, 32) линейный л-поперечник по гл. 3, E.5)
Колмогорову множества
значений оператора
решения в 32
e((p,f) локальная погрешность гл. 4, B.3)
dev(<p) отклонение алгоритма ф гл. 4, опр. 2.1,
B.5)
а (у) сплайн, интерполирую- гл. 4, опр. 3.1,
щий у C.2)
q>s сплайновый алгоритм для гл. 4, опр. 4.1,
задачи S (при использо- D.1)
вании информации Щ
<DS класс всех сплайновых гл. 4, опр. 4.1,
алгоритмов D.1)
фпоо почти оптимальный по гл. 4, опр. 4.1,
сложности алгоритм для D.1)
(S, Т) при Ш
m(Wt 5, Т, г) е-кардинальность задачи гл. 5, опр. 2.1,
(S, Т) в классе ^ B.5)
Чц класс всех линейных ин- гл. 5, § 2
формационных
операторов 9J, таких что
()
= Lp(X) пространство веществен- гл. 6, A.1)
ных скаля рных функций,
таких что lflp< + oo
(X—интер вал
вещественной оси R)
Wrp(X) пространство веществен- гл. 6, A.3)
ных скалярных
функций f, таких что
производная fir~u
абсолютно непрерывна, а /(г)?
€М)
Wrp пространство веществен- гл. 6, A.5)
ных скалярных
функций /, таких что
f?W'p(X)u\\f^\\p^l
Wrp(X) пространство веществен- гл. б, A.6)
ных скалярных
периодических функций f, таких
что fGW'p(X)
Wp пространство веществен- гл. 6, § 1
ных скаля рных периоди-
366 Указатель обозначений
ческих функций /, таких
что f?Wrp
что f?Wrp
Drp линейный оператор, дейст- гл. 6, A.4)
вующий из WUX) в Lp,
Dp линейный оператор, дейст- гл. 6, A.7)
вующий из WP(X) в Lpy
С = С(Х) пространство непрерывных гл. 6, § 1
функций с sup-нормой
С = С(Х) пространство периодичес- гл. 6, § 1
ких непрерывных
функций с sup-нормой
в символ «тэта большое» гл. 6, § 1
Кг постоянная Фавара гл. 6, C.16)
Yj» класс всех информацион- гл. 6, D.2)
ных операторов вида
D.2) гл. 6
З^сЯ, Vtf, 9?2)cV(f, Sfyv/GSo гл. 7, опр. 2.1
(обобщение определения
из § 2 гл. 2)
«tX». V(f,9t*) = VQ, %) V/e30 гл. 7, опр. 2.1
(обобщение определения
из § 2 гл. 2)
card (9Z, 30) кардинальность инфор- гл. 7, опр. 2.2,
мации 9Z в 30 (обобщение B.9)
определения card (Щ) из
§ 2 гл. 2)
Ч^ класс всех линейных или гл. 7, § 3
нелинейных
информационных операторов с
card ($1, 30) ^ п
(обобщение определений из §§ 4
и 6 гл. 2)
d(n, S) /г-й минимальный диаметр гл. 7, опр. 3.1,
информации для зада- C.1)
чи S
Ш% п~я оптимальная инфор- гл.- 7, опр. 3.1,
мация (обобщение опре- C.2)
делений из §§ 4 и 6 гл. 2)
© мощность множества веще- гл. 7, C.7)
ственных чисел
ФлE{) класс алгоритмов, исполь- гл. 7, D.2)
зующих информацию ЭТ
и имеющих множество
К части А 367
значений размерности не
выше п
Фп объединение классов ФП(ЭТ) гл. 7, D.3)
по всем возможным Щ
), 32) n-поперечник по Колмо- гл. 7, D.4)
горову множества
значений оператора
решения в пространстве 32
#(е, X) е-энтропия множества X гл. 7, D.7)
Фаос асимптотически оптималь- гл. 8, B.11)
ный по сложности
алгоритм для S в Yj/
Si > S2 comp OF, Si, e) > cornp гл. 9, опр. 2.1,
0P,S2,e)VeG4 B.1)
StXS2 comp {W, Si, е) = в (comp гл. 9, опр. 2.1,
(?,S,,e)) при 8^0 B.2)
Si>S2 comp (T, Si, s) = o(comp гл. 9, опр. 2.1,
(?, Slf e)) при &-+0 B.3)
DIF(r) оператор дифференцирова- гл. 9, § 2
ния
INP(A) \ операторы интерполяции гл. 9, § 2
ШР(Я) J
INT (Wr) \
тмт )wr\ ( опеРатоРы интегрирования гл. 9, § 2
iJN 1 (wp) J
операторы аппроксимации гл. 9, § 2
C) f
С) i
PAR (г) параболический оператор
ELL(r) эллиптический оператор
HYP (г) гиперболический оператор
NON оператор решения нели-
нейного скалярного
уравнения
UNI оператор поиска максиму- гл. 9# § 2
ма унимодальной
функции
INP оператор интерполяции гл. 9, § 2
INT оператор интегрирования гл. 9, § 2
АРР оператор аппроксимации гл. 9, § 2
Wf™ класс всех неадаптивных гл. 9, § 3
информационных
операторов вида
гл.
гл.
гл.
гл.
9,
9,
9,
9,
§
§
§
§
2
2
2
2
368Указатель обозначений
К части В
3W)
/(**)]'
*)]
класс всех адаптивных ин- гл. 9, § 4
формационных
оператоов вида
]
класс всех линейных не- гл. 9, § 5
адаптивных
информационных операторов вида
^(f) [L(/)L(/)
класс всех линейных адап- гл. 9, § б
тивных информационных
операторов вида
9ntfitW,)y
класс всех нелинейных гл. 9, § 7
информационных
операторов кардинальности
единица
compos, e)= гл. 9, опр. 8.1
= G(comp (?2, S, е)) при
8-+О
comp (Vt9 S, г) = гл. 9, опр. 8.1
= о (comp Q?2i S, е)) при
0
S оператор решения, назы- § 2, B.1)
ваемый иногда задачей,
О. О0 —>" ^2> ^0 5"
30 область определения one- § 2
ратора S
3j линейное пространство, § 2
ЗосЗх
32 пространство значений one- § 2
ратора S
а элемент решения, a = S(/) § 2
/ элемент задачи, /€30 § 2
е- параметр погрешности § 2
л:0 заданное начальное при- § 2
ближение
е'-приближениеЫ/)—а|)^ § 2
К части В 369
9? итеративный информацион- § 2
ный оператор, 91*. Аи—*33
33 пространство значений one- § 2
ратора 9i
/ /1 D7—30, fglF, § 2, опр. 2.1
IF класс, описывающий ре- § 2, опр. 2.1
гулярность функций /
K(f) множество функций / § % опр. 2.1
S) предельный диаметр ин- § 2, опр. 2.2
формации 9? для
задачи S
Ф алгоритм, ф: Офс32Х § 2, B.11)
, S) класс всех алгоритмов, ис- § 2
пользующих
информацию 9i, для задачи S
?(ф) предельная погрешность § 2, B.13)
алгоритма ф
Ф1 интерполяционный алго- § 2, B.15)
ритм
порядок информации 91 § 2, опр. 2.5
для задачи S
порядок алгоритма ф § 2, опр. 2.6
Р набор простейших опера- § 3
ций
сотр (91 (ff х)) информационная слож- § 3
ность вычисления
9i(f, x)f где
91—допустимый информационный
оператор
комбинаторная сложность § 3
вычисления ф(х, 9?^, х)),
где ф—допустимый
алгоритм
индекс сложности ф для / § 3, C.10)
г(ф) индекс сложности алго- § 3, C.11)
ритма ф
индекс сложности задачи 5 § 3, опр. 3.1
при использовании
информации 91
класс всех допустимых ал- § 3, опр. 3.1
горитмов
алгоритм минимального § 3, опр. 3.1
индекса сложности
370 Указатель обозначений
compE?) информационная слож- § 3, C.17)
ность
$1° оптимальный в классе УР § 3, опр. 3.2
информационный опера-
91г с % ker 9ft, (•, х) с ker % (., х) § 4, опр. D.1)
Stti XSR« ker9^(•, *) = ker*ft2(., л:) § 4, опр. D.1)
Л1 алгебраическое дополнение § 4, D.4)
codim (А) коразмерность А § 4, D.5)
card (SR) кардинальность информа- § 4, опр. 4.2
ции Ш
Lip (k) класс fe раз дифференци- § 4, D.16)
руемых функций, у
которых fe-я производная
удовлетворяет условию
Липшица
91 € Lip (Л) Ш принадлежит классу § 4, опр. 4.3
Up (А)
IT (§R, S) класс всех итерационных § 5, опр. 5.1
алгоритмов,
использующих информацию 91, для
задачи S
ind(S) индекс задачи S § 6, опр. 6.1
SR* основной линейный инфор- § 6, F.7)
мационный оператор
S € Lip @) оператор решения S при- § 6, опр. 6.2
надлежит классу Lip @)
ind (S, m) tn-fi индекс задачи § 7, опр. 7.1
91*7 m-й основной линейный § 7* G.10)
информационный
оператор
)) оператор решения 5 при- § 7, опр. 7.2
надлежит классу
Lip(k(m))
п класс всех регулярных ли- § 8
нейных
информационных операторов $1 g
p{n>S) п-и максимальный порядок § 8, опр. 8.1
задачи
0lmo м-я информация макси- § 8, опр. 8.1
мального порядка для
задачи S
К части В 371
z(n, S) м-й минимальный индекс § 8, опр. 8.2
сложности задачи S
ttopt(S) оптимальная относительно § 8, опр. 8.2
индекса сложности
кардинальность для
задачи S
9?oi оптимальный информаци- § 8, опр. 8.2
онный оператор для
задачи S
ИМЕННОЙ УКАЗАТЕЛЬ
Курсивом выделены номера страниц ,
относящихся к библиографии
Адамский (A. Adamski) 27 , 190 , 287
345
Айхьхорн (В. Н. Eichhorn) 27 , 189 ,
190 , 287 , 345
Аксень М. Б. 128 , 132 , 136 , 257 , 345
Алберг (J. Н. Ahlberg) 26 , 76 , 86 ,
287 , 345
Алиев P.M. 128 , 132 , 136 , 309 , 349
Алхимова В. М. 75 , 128 , 136 , 288 ,
345
Арестов В. В. 115 , 288 , 345
Арро В. К. 75 , 128 , 317 , 352 •
Аттэйя (М. Atteia) 88 , 345
Афанасьев А. Ю. 27 , 190 , 288 , 345
Ахо (А. V. Aho) 28 , 345 , 358
Бабенко В. Ф. 128 , 288 , 345
Бабушка (I. BabuSka) 26 , 81 , 128 ,
139 , 187 , 288 , 289 , 345 , 346
Барнхилл (R. E. Barnhill) 119 , 128 ,
138 , 289 , 346
Баррар (R. В. Ваггаг) 128 , 290 , 346
Батчер (J. С. Butcher) 290
Бахвалов Н. С. 5 , 26 , 65 , 67 , 70 , 81 ,
119 , 128 , 155 , 187 , 290 — 292 , 346
Бимер (J. H. Beamer) 27 , 190 , 292 ,
293 , 346
Блум (М. Blum) 8
Бодэ (G. M. Baudet) 293
Бородин (A. Borodin) 106 , 293 , 347
Боянов (В. D. Bojanov) 75 , 76 , 86 ,
111 , 113 , 119 , 128 , 136 , 142 , 171 ,
293 , 294 , 347
Бояньчик (A. Bojanczyk) 8
Брассфилд (N. К. Brassfield) 8
Брент (R. P. Brent) 27 , 35 , 241 , 274 ,
278 , 286 , 294 — 297 , 347 , 358 , 360
Бусарова Т. Н. 128 , 139 , 297 , 347
Бут (R. S. Booth) 27 , 189 , 297 , 347
Вайнбергер (Н. F. Weinberger) 26 ,
76 , 86 , 155 , 160 , 161 , 163 , 165 ,
285 , 297 , 298 , 304 , 347 , 348 , 360
Вайнтрауб (S. Weintraub) 328
Ваккер (H , J. Wacker) 298
Варайя (P. Varaiya) 314
Васильковский (G. W. Wasilkows-
ki) 8 , 85 , 216 , 231 , 241 , 279 , 298 ,
299 , 347 , 358
Великий В. Л. 119 , 299 , 347
Вернер (М. Werner) 128 , 290 , 318 ,
346 , 352
Вершульц (A. G. Werschulz) 8 , 27 ,
114 , 242 , 299 — 301 , 347 , 358
Вёрнер (J. H. Verner) 316
Вилански (A. Wilansky) 46 , 347
Виноград (S. Winograd) 26 , 27 , 33 ,
86 , 121 , 141 , 142 , 152 , 153 , 241 ,
285 , 286 , 296 , 301 , 321 , 347 , 348 ,
353 , 358 , 360
Витушкин А. Г. 5 , 186 , 187 , 348
Вожьняковская (G. Wozniakowska) 7
Вожьняковский (Н. Wozniakowski)
27 , 28 , 85 , 201 , 231 , 238 , 240 — 243 ,
245 , 247 , 252 , 262 , 263 , 267 , 274 ,
278 — 280 , 286 , 287 , 299 , 301 , 302 ,
311 , 335 , 336 , 344 , 347 , 348 , 356 ,
358 — 360
Вольфовиц (J. Wolfowitz) 285
Вулф 5 (P. Wolfe) 27 , 241 , 286 , 296 ,
347 , 358 , 360
Гайсарян С. С. 128 , 129 , 155 , 302 ,
303 , 332 , 348 , 356
Ганшин Г. С. 27 , 190 , 303 , 348
Гаффни (P. W. Gaffney) 86 , 119 , 120 ,
303 , 304 , 348
Гельфанд И. М. 7
Гермейер Ю. Б. 304
ГиршовичЮ. М. 75 , 128 , 317 , 352
Голомб (М. Golomb) 26 , 76 , 81 , 86 ,
119 , 124 — 126 , 142 , 285 , 304 , 348 ,
360
Гребенников А. И. 26 , 86 , 304 , 305.
348
Гросс (О. Gross) 27 , 189 , 305 , 348
Гэл (S. Gal) 26 , 27 , 65 , 76 , 190 , 305 ,
349
Гэри (М , R , Garey) 34 , 305 , 306t 349
Именной указатель
373
Данилин Ю. М. 27 , 190 , 306 , 349
де Бур (С. de Boor) 86 , 142 , 153 , 306 ,
349
ден Хейер (С. den Heijer) 306
Джаррэтт (P. Jarratt) 306
Джентлмэн (W. M. Gentleman) 306
Джеттер (К. Jetter) 128 , 307 , 349
Дживс (Т. A. Jeeves) 307
Джозефсон (D. Josephson) 8
Джонсон Д. (D. S. Johnson) 34 , 305 ,
306 , 349
Джонсон Л. (L. W. Johnson) 128 , 307 ,
349
Джонсон С. (S.M.Johnson) 27 , 189 ,
190 , 305 , 307 , 348 , 349
Емельянов К. В. 155 , 307 , 349
Женсыкбаев А. А. 75 , 128 , 137 , 139 ,
307 , 308 , 349
ЖилейкинЯ. М. 128 , 308 , 349
Жилинскас А. Г. 27 , 190 , 308 , 349
Зализняк Н. Ф. 27 , 65 , 190 , 308 , 349
Зонневенд (G. Sonnevend) 27 , 189 ,
190 , 308 , 349
Ибрагимов И. И. 128 , 132 , 136 , 309 ,
349
Иванов В. В. 26 , 27 , 128 , 142 , 190 ,
309 , 349
ИльинА. М. 155 , 307 , 349
Исмагилов Р , С. 82. 350
Казули (V. Casuli) 309 , 310
Карлин (S. Karlin) 73 , 86 , 128 , 136 ,
310 , 350
Карп (R. М. Кагр) 8 , 27 , 190 , 310 ,
350
Кауль (V. Kaul) 76 , 129 , 339 , 356
Каутски (J. Kautsky) 128 , 132 , 136 ,
310 , 350
Кацевич (В. Kacewicz) 8 , 27 , 242 ,
278 — 280 , 311 , 350 , 358
Келбасиньский (Kieibasinski) 8
Кист (P. Keast) 128 , 139 , 311 , 350
Кифер (J. Kiefer) 5 , 7 , 26 , 27 , 63 , 65 ,
76 , 128 , 188 — 190 , 205 , 209 , 285 ,
286 , 311 , 312 , 350 , 360
Кнауфф (W. Knauff) 26 , 76 , 312 , 350
Кнут (D. E. Knuth) 109 , 245 , 350 ,
351 , 359
Колмогоров At H» 5 , 7 , 74 , 182 , 184 ,
187 , 350
Коман (Gh. Coman) 86 , 128 , 136 , 312 ,
351
Копперсмит (D , Coppersmith) 33
Корнейчук Н. П. 75 , 82 , 86 , 128 130
131 136 , 139 , 142 , 149 - 151 ; 313
351 '
Коробов Н. М. 119 , 128 , 139 , 313 ,
Ь51
Короткое В. Б. 62 , 313 , 351
Корытовский (A. Korytowski) 27 , 190 ,
Коэн (A. I. Cohen) 314
Кресс (R. Kress) 26 , 76 , 312 , 350
Кролак (P. Krolak) 27 , 190 , 314 351
Крылов В. И. 75 , 128 , 136 , 314 351
Кузовкин А. И. 27 , 190 , 314 351
Кукаркин А. Б. 128 , 308 , 349
Кунг (Н. Т. Kung) 8 , 27 , 35 , 243 , 252 ,
351 SI 279' 296' ЗМ 3J6> 347>
Купер Дж. (G.J. Cooper) 316
Купер Л. (L. Cooper) 27 , 190 , 314 ,
351
Ларкин (F. M. Larkin) 26 , 76 128
138 , 316 , 351 ' '
Левин А. Ю. 27 , 190 , 317 , 351
Левин М. И. 75 , 128 , 317 , 352
Ли (J W. Lee) 73 , 86 , 128 , 136 , 317 ,
352
Лигун А. А. 27 , 65 , 75 , 86 , 128 , 139 ,
190 , 308 , 317 , 349 , 352
Липоу (P. R. Lipow) 73 , 86 , 128 , 136 ,
317 , 352
Липсон (J. Lipson) 318
Лоран (P. J. Laurent) 88 , 357
Лоренц (G. G. Lorentz) 182 , 184 , 187 ,
352
Лоуб (Н. U Loeb) 128 , 290 , 318 , 346 ,
352
Лушпай Н. Е , 75 , 86 , 128 , 132 , 136 ,
139 , 313 , 318 , 351 , 352
Майстровский Г. Д. 27 , 189 , 318 , 352
Мак-Кордакк (P. McCorduck) 7
Мангасарян (О. L. Mangasarian) 26 ,
73 , 86 , 319 , 352
Манроу (I. Munro) 293
Марчук А. Г , 26 , 72 , 319 , 352
Маунг Чжо Ньюн (Maung C2o Njun)
128 , 319 , 352
Меерсман (R. Meersman) 27 , 278 , 279
319 , 352 , 359 '
Мейерз (L. F. Meyres) 26 , 73 , 119 ,
128 , 136 , 319 , 320 , 352
Мелкмэн (A. A. Melkman) 26 , 76 , 81
86 , 119 , 142 , 320 , 353
Менгё (J. Meinguet) 26 , 76 , 320 , 353
Миккелли (С. A. Micchelli) 21 , 22 , 24 ,
26 , 27 , 60 , 65 , 72 , 76 , 81 , 86 , 94 ,
374
Именной указатель
115 , 121 , 141 , 142 , 152 , 153 , 189 ,
195 , 286 , 305 , 320 , 321 , 349 , 353 ,
360
Микула (Gh. Micula) 128 , 312 , 351
Мирэнкер (W. L. Miranker) 27. 189 ,
190 , 195 , 310 , 320 , 322 , 350 , 353
Митковский (W. Mitkowski) 27 , 190 ,
287 , 345
Морозов В. А. 26 , 86 , 305 , 348
Моторный В. П. 75 , 128 , 136 , 137 , 139 ,
142 , 322 , 353
Моцкус Й. Б. 27 , 190 , 322 , 353
Мэнсфилд (L. E. Mansfield) 27 , 73 ,
76 , 86 , 128 , 322 , 353
Немировскии А. С. 27 , 190 , 343 , 357
Никольский С. М. 5 , 7 , 16 , 26 , 67 ,
69 , 74 , 75 , 128 , 136 , 285 , 286 , 323 ,
353 , 360
Нильсон Г. (G. M. Nielson) 27 , 76 ,
86 , 323 , 353
Нильсон Э. (Е. N. Nilson) 26 , 76 , 86 ,
287 , 345
Новиков В. А. 27 , 190 , 288 , 345
Ньюмэн (D. J. Newman) 27 , 190 , 323 ,
353
Обэн (J. P. Aubin) 323
Ортега (J. M. Ortega) 274 , 323 , 359
Осипенко К. Ю. 26 , 27 , 72 , 112 , 119 ,
123 , 142 , 186 , 319 , 324 , 352 , 354
Островский (A. Ostrowski) 324
Паллашке (D. Pallaschke) 115 , 128 ,
324 , 354
Пан (V. Pan) 30 , 33 , 354
Паркер (D. S. Parker , jr.) 324
Паулик (A. Paulik) 128 , 324 , 354
Пауэлл (М. J. D. Powell) 86 , 119 , 120 ,
304 , 348
Пашковскии (S. Paszkowski) 325
Пинкус (A. Pinkus) 27 , 60 , 81 , 86 ,
128 , 138 , 142 , 321 , 325 , 353 , 354
Пиявский С. А. 27 , 190 , 325 , 354
Плешаков Г. Н. 274 , 325 , 359
Пэтерсон (М. S. Paterson) 325
Райнш (Ch. Peinsch) 27 , 76 , 86 , 326 ,
354
Райе (J. R. Rice) 27 , 142 , 326 , 354
Рассел (В. Russell) 10
Рейнболдт (W. С. Rheinboldt) 274 ,
323 359
Ривлин'(Т J. Rivlin) 21 , 22 , 24 , 27 ,
72 , 76 , 81 , 86 , 94 , 121 , 141 , 142 ,
152 , 153 , 286 , 321 , 353 , 360
Рисе (R. Df Riess) 128 , 307 , 349
Риссанен (J. Rissanen) 326
Риттер (К. Ritter) 27 , 73 , 86 , 327 ,
354
Рихтер (N. Richter) 128 , 327 , 354
Рихтер-Дин (N. Richter-Dyn) 27 , 76 ,
119 , 128 , 327 , 354
Саари (D. G. Saari) 279 , 327 , 359
Саймон (С. Р. Simon) 279 , 327 , 359
Сард (A. Sard) 5 , 7 , 16 , 26 , 27 , 67 , 69 ,
72 — 74 , 119 , 128 , 136 , 285 , 319 ,
320 , 327 , 328 , 352 , 354 , 360
Секрест (D. Secrest) 76 , 86 , 115 , 119 ,
129 , 136 , 328 , 354
Сивкинг (М. Sieveking) 329
Сикорский (К. Sikorski) 8
Смоляк С. Л. 16 , 27 , 67 , 69 , 70 , 119 ,
129 , 139 , 285 , 329 , 355 , 360
Соболеве. Л. 26 , 81 , 129 , 187 , 289 ,
329 , 346 , 355
Соболь И. М. 129 , 329 , 355
Стенгер (F. Stenger) 129 , 330 , 355
Стеттер (F. Stetter) 129 , 330 , 355
СтечкинС. Б. 115 , 330 , 355
Стёрн (М. D. Stern) 129 , 136 , 330 , 355
Стронгин Р. Г. 27 , 190 , 330 , 355
Сухарев А. Г. 5 , 8 , 27 , 65 , 129 , 142 ,
189 , 190 , 330 , 331 , 355
ТайковЛ. В. 115 , 331 , 355
Танана В. П. 332
Тарасова В. П. 27 , 190 , 332 , 355
Тихомиров В. М. 27 , 56 , 60 , 82 , 85 ,
141 , 142 , 147 , 149 , 151 , 187 , 190 ,
314 , 332 , 351 , 355
Тихонов А. Н. 129 , 332 , 356
Тодд (М. J. Todd) 27 , 189 , 332 , 356
Трауб (J. F. Traub) 5 , 7 , 26 , 27 , 201 ,
229 , 231 , 234 , 238 , 240 — 243 , 245 ,
247 , 252 , 262 , 263 , 267 , 270 , 274 ,
278 , 279 , 281 , 285 — 287 , 297 , 316 ,
333 — 338 , 351 , 356 , 359 , 360
Триджанте (D. Trigiante) 309 , 310
Троян (J.M.Trojan) 35 , 337 , 356
Турецкий А. X. 128 , 132 , 136 , 287f
345
Уайлд (D. J. Wilde) 27 , 190 , 292 , 293 ,
337 , 342 , 346 , 356 , 357
Уиксом (J. A. Wixom) 119 , 128 , 289 ,
346
Уилф (Н. S. Wilf) 129 , 337 , 356
Ульман (J. D. Ullman) 28 , 345 , 358
Уолш (J. L. Walsh) 287
Файерстоун (R. M. Firestone) 338
Файн (Т , Fine) 27 , 190 , 337 , 356
Именной указатель
375
Фёлдстайн (A. Feldstein) 337 , 338
Форст (W. Forst) 86 , 113 , 119 , 129 ,
139 , 338 , 356
Херцбергер (J. Herzberger) 338
Хиндмарш (А. С. Hindmarsh) 339
Холмз (R , Holmes) 88 , 356
Хопкрофт (J. E. Hopcroft) 28 , 345 ,
358
Хэйбер (S. Haber) 129 , 339 , 356
Чавла (М. М. Chawla) 76 , 129 , 3391
356
Ченцов Н. Н. 129 , 339 , 356
Черногоров (V. G. Chernogorov) 76 ,
119 , 142 , 294 , 347
Черноусько Ф. Л. 27 , 189 , 190 , 339 ,
340 , 356
Чжан Гуанцзюань (Chzhan Guan-
Tszjuan) 81 , 155 , 340 357
Шайдаева Т. А. 75 , 129 , 136 , 340 , 357
Шаманский В. Е. 340
Шарыгин И. Ф. 128 , 129 , 319 , 340 ,
352 , 357
Шёнберг (I. J. Schoenberg) 27 , 73 , 74 ,
86 , 129 , 130 , 136 , 285 , 341 , 357 ,
360
Шмайсер (G. Schmeisser) 129 , 342 , 357
Шульц (М. Н. Schultz) 27 , 49 , 81 ,
142 , 342 , 357
Шумейкер (L. L. Schumaker) 26 , 73 ,
86 , 319 , 352
Звриэл (М. Avriel) 27 , 190 , 342 , 357
Эдварде (R. E. Edwards) 39 , 357
Экхардт (U. Eckhardt) 129 , 342 , 357
Элхей (S. Elhay) 129 , 343 , 357
Энслоун (P. M. Anselone) 88 , 357
Эрманн (Н. Ehrmann) 343
Юдин Д. Б. 27 , 190 , 343 , 357
Ян (D. Y. Y. Yun) 344
Янковская (J. Jankowska) 274 , 344 ,
359
Янковский (М. Jankowski) 344
Яфйль (L. Hyafil) 27 , 189 , 344 , 358
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Адаптивность 63
алгебраическое дополнение 39 , 247
алгоритм 21 , 236
— асимптотически оптимальный по
сложности 193
сходящийся 226
— бисекции 189
— допустимый 28 , 242
— интерполяционный 22 , 238 , 269
— итерационный 251
— линейный 66
— максимального порядка 241
— минимального индекса
сложности 245
— оптимальный 284
в смысле Никольского 74
Сарда 72
по сложности 30 , 32
точности 23 , 284
— почти оптимальный по сложности
103 , 104
— прямой 240
— с памятью 269
— сп лай новый 89
— стационарный 269
— сходящийся 237 , 269
— центральный 24
аппроксимация решения 233
асимптотическая скорость сходимости
226
асимптотически оптимальная
последовательность алгоритмов 227
информационных операторов
227
— оптимальный по сложности
алгоритм 193
— сходящаяся последовательность
алгоритмов 226
информационных
операторов 226
диаметр информации 20
минимальный л-й 48 , 56 , 177
предельный 234 , 268
— множества 20
— погрешности задачи 51
допустимость 28 , 242
задача 19
— аппроксимации 65 , 142
— бесконечной сложности 34
— дифференцирования 113
— интегрирования 115 , 127
— интерполяции 110 , 118
— конечной сложности 34
— линейная 42
— обладающая свойством
сходимости 51
— сильно неразрешимая 51
— е-неразрешимая 29 , 51
— е-разрешимая 29
затраты 28
индекс задачи 44 , 254
т-й 260
— сложности алгоритма 244 , 275
задачи 245
минимальный /г-й 267
информационный оператор (см.
также информация) 19
адаптивный 63
допустимый 28 , 242 •
итеративный 229 , 234
линейный без памяти 278
— — — — многоточечный 278
одноточечный 278
с памятью 278
класса Lip (k) 250
неадаптивный 63
неполный 35
оптимальный 60 , 246 , 267
основной линейный 256
/тг-й 261
подходящий в большей
степени 246
полный 35
с памятью 268
информация (см. также
информационный оператор) 19
— адаптивная 63
Именной указатель
377
— допустимая 28 , 242
— итеративная 229 , 234
— максимального порядка п-я 265
— неадаптивная 63
линейная п-я 191
— неполная 35
— общая 15
— оптимальная 60 , 246 , 267
неадаптивная линейная 191
п-я 48 , 56 , 128 , 177
— полная 35
— расходящаяся 235
— стандартная 41 , 239
— стационарная без памяти 234
— сходящаяся 235 , 268
итерация 251
кардинальность задачи 103
— — оптимальная относительно
индекса сложности 267
— информации 41 , 177 , 248
конечномерный оператор 45
Кунга —• Трауба гипотеза 233 , 279
липшицевость 251
мера асимптотической скорости
сходимости 226
модель асимптотическая 225
— наихудшего случая 221
— с возмущениями 224
итеративной информацией 229
общей информацией 15
относительной погрешностью
221
— среднего случая 221
— типа Уилкинсона 225
-<* 12
-р 12
неадаптивность 63 , 191
норма минимальная ш-я 49
оператор аппроксимации 142 , 144 ,
147 , 148 , 151
— гиперболический 166
— дифференцирования 133
— интегрирования 115 , 127 , 129 , 136
— интерполяции 110 , 119 , 122 , 124
— информационный 19
— ограничений 42
— ограничивающий 42
— параболический 159
— поиска максимума унимодальной
функции 202 , 205
— решения 19
нелинейного скалярного
уравнения 190 , 193
— эллиптический 163
оптимальность в смысле Никольского
74
— Сарда 72
— информации 48 , 56 , 60 , 177 , 191 ,
246 , 267
— по сложности 30 , 32
асимптотическая 193
точности 23 , 284
отклонение алгоритма 85 , 87
поглощающее множество 45
погрешность алгоритма 21
— локальная 24
— минимальная линейная п-я 81
— оптимальная 23
— предельная 237 , 269
подпространство минимальное пг-е 49
— зкстремалы-юе я-е (в смысле Гель*
фанда) 59
поперечник по Гельфанду 56
Колмогорову 82 , 182
линейный 81
порядок алгоритма 240 , 272
классический 281
максимальный 241
— задачи максимальный /г-й 265
— информации 239 , 270
— точности алгоритма 107
принцип соперничества 20 , 27
простейшая операция 28 , 242
равенство относительно информации
234 , 268
радиус информации 21
— — минимальный п-й 128
относительный 222
— множества 19
решение задачи 19 , 233
сложнее 211
сложность 10 , 28
— аналитическая вычислительная 36
— бесконечная 34
— задачи 32
— информационная 28 , 31 , 242 , 245
— комбинаторная 29 , 36 , 242
— конечная 34
Смоляка теорема 70
содержится (одна информация р
другой) 39 , 247
сплайн , интерполирующий у 88
сплайн-функция натуральная 95
стоимость 28
существенно сложнее 212
378
Именной указатель
— эффективнее 219
теория аналитической
вычислительной сложности 35
узел 67
унимодальная функция 202
уравновешенное множество 43
устойчивость алгоритма 225
Фавара постоянная 121
центр 20
число обусловленности 225
штраф 162
эквивалентность информационных
операторов 39 , 175 , 219 , 247
элемент задачи 19 , 233
— решения 19 , 233
энтропия 184
эффективнее 219
Б-сплайн 120
я-поперечник по Гельфанду 56
Колмогорову 82 , 182
линейный 81
е-кардинальность 103 , 192
е-неразрешимость 29 , 51
е-приближение 19 , 233
е-разрешимость 29
е-сложность 30 , 32
е-штраф 162
8-энтропия 184
в-сложность 211
0-эквивалентность информационных
операторов 219
ОГЛАВЛЕНИЕ"
От редактора перевода и переводчика 5
Предисловие к русскому изданию 6
Предисловие 7
Рекомендации по чтению книги . 9
Обзор содержания книги 10
ЧАСТЬ А
МОДЕЛЬ С ОБЩЕЙ ИНФОРМАЦИЕЙ
Введение , 15
Глава 1. Основные понятия 17
1. Введение 17
2. Диаметр и радиус общей информации 19
3. Сложность общей информации 28
Модель вычислений . . 28
4. Предмет теории аналитической вычислительной сложности . s . 34
Глава 2. Теория линейной информации 37
1. Введение 37
2. Кардинальность линейной информации , 39
3. Индекс линейной задачи 42
4. Оптимальные линейные информационные операторы 47
5. Сходимость и минимальные подпространства для случая
гильбертова пространства 52
6. Связь с я-поперечниками по Гельфанду 55
7. Адаптивная линейная информация 62
Глава 3. Линейные алгоритмы для линейных задач 66
1. Введение 66
2. Предварительные замечания 68
3. Линейные оптимальные по точности алгоритмы для линейных
функционалов 69
4. Линейные алгоритмы для линейных операторов 76
5. Оптимальные линейные алгоритмы и линейные /г-поперечники по
Колмогорову 81
1) Глава 4 ч. А написана совместно с Г. В. Васильковским (Варшавски й
университет), §§ 4—8 ч. В—совместно с Б. Кацевичем (Варшавский
университет).
380 Оглавление
Глава 4. Сплайновые алгоритмы в линейных задачах 85
1. Введение , 85
2. Отклонение 87
3. Сплайны 88
4. Сплайновые алгоритмы 89
5. Гильбертов случай . . . '. 93
6. Негильбертов случай 96
7. Резюме 100
Глава 5. Сложность в линейном случае 100
1. Введение 100
2. Сложность линейной информации 101
Модель вычислений в линейном случае 101
Глава 6. Приложения к линейным задачам 107
1. Введение 107
2. Линейные функционалы 109
(i) Интерполяция: 5/ = / (*0), хо?[— 1, 1] 110
(И) Дифференцирование: Sf = f'(Q) 113
+ 1
(in) Интегрирование: Sf= [ ? (х) f (х) дх 115
3. Интерполяция 118
(|) Интерполяция для Wroo 119
(И) Интерполяция для аналитических функций 122
(iii) Интерполяция для случая гильбертова пространства с
воспроизводящим ядром 124
4. Интегрирование 127
(i) Интегрирование функций из Wrp 129
(ii) Интегрирование функций из Wrw 136
(iii) Связь с «-поперечником по Гельфанду 139
5. Аппроксимация 142
(i) Аппроксимация в абстрактном гильбертовом пространстве 142
(ii) Аппроксимация для W\ в L2 144
(iii) Аппроксимация для W\ в L2 147
(iv) Аппроксимация для Wr<x> в С 148
(v) Аппроксимация для Wr<x> в С 151
6. Линейные дифференциальные уравнения с частными производными 154
(i) Линейный оператор в гильбертовом пространстве .... 155
(ii) Параболические дифференциальные уравнения 159
(iii) Эллиптические дифференциальные уравнения 163
(iv) Гиперболические дифференциальные уравнения 166
7. Резюме и открытые вопросы 169
Глава 7. Теория нелинейной информации 174
1. Введение 174
2. Кардинальность нелинейной информации 174
3. Оптимальная нелинейная информация 177
4. Связи с /г-поперечниками по Колмогорову и энтропией ..... 182
Оглавление 381
Глава 8. Приложения к нелинейным задачам 187
1. Введение 187
2. Оптимальная неадаптивная линейная информация для нелинейных
скалярных уравнений 190
3. Адаптивная линейная информация для нелинейных скалярных
уравнений 193
4. Нелинейная информация для нелинейных скалярных уравнений 195
5. Нелинейные операторные уравнения 198
6. Почти оптимальная неадаптивная линейная информация при
поиске максимума унимодальных функций 202
7. Адаптивная линейная информация при поиске максимума унимо
дальных функций 205
Глава 9. Иерархия сложности . 211
1. Введение 211
2. Основные определения 211
3. Иерархия сложности для класса У"оп 213
4. Иерархия сложности для класса Wf 215
5. Иерархия сложности для класса Yl00 216
6. Иерархия сложности для класса ?? 217
7. Иерархия сложности для класса Ynon 218
8. Иерархия сложности для фиксированной задачи 5 219
9. Резюме 220
Глава 10. Другие модели аналитической сложности 220
1. Введение 220
2. Модель среднего случая 221
3. Модель с относительной погрешностью 221
4. Модель с возмущениями 224
5. Асимптотическая модель 225
ЧАСТЬ В
МОДЕЛЬ С ИТЕРАТИВНОЙ ИНФОРМАЦИЕЙ
1. Введение » 229
2. Диаметр и порядок информации 233
3. Сложность итеративной информации 242
Модель вычислений 242
4. Кардинальность линейной информации 247
5. Когда класс итерационных алгоритмов пуст? 251
6. Индекс задачи S 254
7. Итерации /п-го порядка 259
8. Индекс сложности для итеративной линейной информации . . . 263
Модель вычислений для итеративной линейной информации 263
9. Информационный оператор с памятью 268
10. Некоторые дополнения и открытые проблемы 276
11. Сравнение результатов для общей и итеративной информационных
моделей 280
Добавление 280
382 Оглавление
ЧАСТЬ С
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
И АННОТИРОВАННАЯ БИБЛИОГРАФИЯ
1. Введение t . 283
2. Краткий исторический очерк 285
3. Аннотированная библиография 287
Литература 345
К части А 345
К части В 358
К части С 360
Указатель обозначений 361
К части А 361
К части В , , , f t , 368
Именной указатель 372
Предметный указатель 376
УВАЖАЕМЫЙ ЧИТАТЕЛЬ!
Ваши замечания о содержании книги, ее
оформлении, качестве перевода и другие просим присылать по
адресу: 129820, Москва, И-110, ГСП, 1-й Рижский
пер., д. 2, издательство «Мир».