Текст
                    СТАТИСТИЧЕСКИХ
ИЗМЕРЕНИЙ


В. В. ГУБАРЕВ Алго¬ ритмы СТАТИСТИЧЕСКИХ ИЗМЕРЕНИЙ МОСКВА ЭНЕРГОАТОМИЗДАТ 1985
УДК 681.3.06:519.2 Губарев В. В. Алгоритмы статистических измерений: М.: Энергоатомиздат, 1985. 272 с. Дано систематизированное изложение основ алгоритмов статистических измерений путем расчленения их на элемен¬ тарные операции, изучаемые отдельно в общем виде и в при¬ ложении к одномерным и многомерным законам распределе¬ ния вероятностей, моментным, в том числе корреляционным, и спектральным характеристикам случайных функций. Для научных работников и инженеров в области стати¬ стических измерений, математической статистики и статисти¬ ческого программирования. Табл. 21. Ил. 13. Библиогр. 161. Рецензент Э. И. Цветков Василий Васильевич Губарев АЛГОРИТМЫ СТАТИСТИЧЕСКИХ ИЗМЕРЕНИИ Редактор В. В. Ольшевский Редактор издательства 3. И. Михеева Переплет художника Н. Т. Ярешко Художественный редактор Т. А. Дворецкова Технический редактор Н. П. Собакина Корректор 3. Б. Драновская ИБ № 3050 Сдано в набор 19.12.84 Подписано в печать 11.10.85 Т-2160 7 Формат 84ХЮ81/з2 Бумага типографская №2 Гарнитура литературная Печать высокая Уел. печ. л. 14,28 Уел. кр.-отт. 14,49 Уч.-изд. л. 15,53 Тираж 6250 экз. Заказ 192 Цена 1 р. 10 к. Энергоатомиздат, 113114, Москва, М-114, Шлюзовая наб., 10 Ордена Октябрьской Революций и ордена Трудового Красного Знаме¬ ни МПО «Первая Образцовая типография имени А. А. Жданова» Со- юзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 113054, Москва, М-54, Валовая, 28 ** 1502000000-058 051 (01 )-85 2‘85 © Энергоатомиздат, 1985
ПРЕДИСЛОВИЕ Эта книга задумана как работа^ посвященная рассмо¬ трению основ алгоритмов измерения таких характеристик и параметров физических объектов, теоретическими анало¬ гами которых являются характеристики и параметры слу¬ чайных элементов (величин, векторов и функций). При отборе материала ставилась цель по возможности макси¬ мального удовлетворения противоречивым * требованиям системности, общности, новизны и практической полезности включаемых в книгу результатов. Для достижения этого применены следующие приемы. Во-первых, на основе морфологического анализа алгоритмы измерения расчленяются на отдельные*части (операции), общие для многих используемых в настоящее время харак¬ теристик. Во-вторых, рассматриваются только' составные части, специфичные именно для статистических измерений, для алгоритмов оценивания вероятностных характеристик, всего в общем виде, без привязки к конкретным измеряе- В-третьих, операции исследуются отдельно, причем прежде мым характеристикам. В-четвертых, с достаточной для изложения основ полнотой освещаются современные изве¬ стные и оригинальные теоретические результаты по наме¬ ченной теме, а также приводятся замечания и справочные данные, необходимые для уяснения и правильного приме¬ нения алгоритмов. Все это позволило с единых позиций рассмотреть общие закономерности, свойственные «стати¬ стическим» частям различных алгоритмов измерения — алгоритмам оценивания разнообразных характеристик (гл, 1—3). В последующих главах в приложении к конкрет¬ ным характеристикам рассматриваются те составляющие алгоритмов, исследование которых с общих позиций мало продуктивно. Подобный прием*позволил в небольшой по объему книге осветить вопросы, наиболее важные при изу¬ чении и исследовании большого многообразия возможных алгоритмов оценивания различных вероятностных харак¬ теристик. Конечно, рассматривая алгоритмы статистиче¬ ских измерений с системных позиций, следовало бы все¬ сторонне на единой основе -исследовать по крайней мер,е следующее: сходство и особенности различных характери¬ стик как объектов измерений, все разнообразие возможных алгоритмов, различные показатели их качества; рассмо¬ треть вопросы анализа и синтеза, потенциальной реализуе¬ мости алгоритмов по различной совокупности показателей качества, эффективности требуемых для этого затрат, 3
области и особенности применения алгоритмов и т. д. Однако ограниченный объем книги не позволяет осве¬ тить все эти вопросы в должной мере. В связи с этим в книге рассматриваются с единых позиций лишь основы различных, алгоритмов оценивания вероятностных харак¬ теристик, в то время как другие вопросы затрагиваются только фрагментарно, по мере надобности. В частности, в работу не включены результаты, касающиеся подробно¬ го описания объектов измерений, систематизации и упо¬ рядочения моделей, а также непараметрические и смешан¬ ные алгоритмы оценивания спектральных характеристик, которые публикуются отдельно. В связи с большим количеством публикаций (только статистическая литература насчитывает более 30 тыс. наи¬ менований [64]) в списке литературы и в ссылках, где это оказалось возможным, указаны не первоисточники, а монографии и обзоры, обобщающие результаты большого числа оригинальных исследований. Некоторые результаты и положения, излагаемые в книге, оформились благодаря беседам автора с Е. С. Вент- цель, В. А. Гераниным, А. Ф. Котюком и Г. М.Махониным, Г. Я. Мирским, В. В. Ольшевским, Б; С. Синицыным, В. Я. Розенбергом, Ф. П. Тарасенко, Г. Н. Хуснутдино- вым, М. П. Цапенког Э. И. Цветцовым, В. И. Чайковским, переписке с Ю. А. Алимовым, дискуссиям с аспирантами, с участниками традиционных всесоюзных симпозиумов «Методы представления и аппаратурный анализ случайных процессов и полей» и других симпозиумов и конференций, в работе которых автору довелось участвовать. Пользуюсь случаем выразить всем свою благодарность. Особенную признательность выражаю доктору физико-математических наук, проф. С. Я. Виленкину, доктору техн. наук, проф. Э. И. Цветкову и канд. техн. наук В. В. Ольшевскому за конструктивные замечания, способствовавшие улучшению работы. Некоторые из затронутых в книге вопросов ранее не публиковались или впервые освещаются в литературе по статистическим измерениям, некоторые носят дискуссион¬ ный характер и требуют дальнейших исследований. Поэто¬ му автор с благодарностью примет любые конструктивные замечания и пожелания по содержанию книги. Автор
ВВЕДЕНИЕ В процессе развития и применения теории вероятностей; и математической статистики для математического описа¬ ния физических объектов рассматривались два варианта построения моделей. Первый основан на использовании аксиоматики А. Н. Колмогорова, второй, статистический, развиваемый в последнее время рядом ученых (см. [5]),—■ аксиоматики фон Мизеса. В свою очередь каждый из этих вариантов на практике реализуется в виде априори вводи¬ мых или апостериори получаемых моделей. Назовем пер¬ вый способ_априорным, а второй — апостериорным. Априорный способ введения моделей основан на том, что вероятностная или статистическая модель исследуемого объекта, задаваемая с точностью до известных или неиз¬ вестных параметров, вводится априори из каких-то исход¬ ных соображений,-лежащих за пределами математики (на основе опыта описания аналогичных объектов той же или иной физической природы, физико-химических и других особенностей объекта, физически обоснованных и экспери¬ ментально проверенных моделей элементарных состав¬ ляющих объекта и т. п.), на основе математических прие¬ мов или логических заключений. Затем-проводится экспе¬ римент с объектом и получаются экспериментальные дан¬ ные, содержащие информацию о реальных значениях исследуемых показателей объекта. После этого апосте¬ риори на основе принятого способа измеренйя входящей в модель вероятностной или статистической характеристи¬ ки и производных от нее характеристик путем соответст¬ вующей обработки определяются неизвестные параметры модели, проверяется адекватность модели эксперименталь¬ ным данным и объекту и в случае необходимости-коррек-' тируется модель объекта. Отличительные особенности такого подхода: ясная физическая интерпретация парамет¬ ров модели, возможность широкого использования модели для анализа, синтеза, моделирования, прогнозирования и управления поведением объекта в широких пределах. 5
Апостериорный способ введения моделей основан на подборе и подгонке по экспериментальным данным как вида модели из заданного класса моделей (например, вида закона распределения, если объект описывается на уровне случайных величин), так и ее параметров, которые наилуч¬ шим или приемлемым в смысле заданного критерия обра¬ зом соЪтветствуют результатам статистической обработки экспериментальных данных. При этом чаще всего на мо¬ дель не накладывается никаких принципиальных ограниче¬ ний, кроме формальных математических требований к модели (неотрицательность плотности распределения вероятности и спектральной плотности мощности, неотри¬ цательная определенность корреляционных матриц и функций, характеристических функций и т. п.), требований простоты обработки данных, получения и использования модели и пр., а также некоторых внешних дополнительных условий, например критериев селекции, обеспечивающих единственность или принципиальную возможность решения поставленной задачи. Такой подход, вообще говоря, не строится на строгих теоретико-вероятностных предпосыл¬ ках, основанных на физической природе объекта, и поэто¬ му зачастую не позволяет дать физическую интерпретацию Полученным результатам, параметрам модели, а порою Даже может ввести в заблуждение, стимулировать ложные пути исследований. Тем не менее при аккуратном примене¬ нии он позволяет успешно решать задачи своей области, связанные с наглядной и компактной формой описания Объекта [71], с анализом, интерполяцией и интерпретацией в тех пределах, в которых получены экспериментальные Данные, с проектированием и управлением объектами, Давать отправные модели элементов объектов для по¬ строения вероятностной модели всего объекта и (или) по¬ становки имитационного машинного эксперимента, решать задачи, которые другими методами решить пока не удается с той же точностью. В ряде случаев результаты добро¬ совестного и вдумчивого использования апостериорного подхода могут послужить основой для более Детальной физической теории (как это имело место, например, при исследовании атмосферной турбулентности) и гносеологи¬ ческой модели объекта, а сам подход — основой для по¬ строения машинных ассистентов. Подобный подход может быть применен для описания в указанном смысле объектов с неопределенными исхода¬ ми результатов экспериментов, для которых вероятностный подход принципиально не применим. Однако при этом 6
нельзя полученным результатам давать какую-либо веро¬ ятностную трактовку, для них нельзя использовать соот¬ ветствующие разделы математической статистики, опи¬ рающиеся на обязательное гипотетическое расширение объема данных до некоторой бесконечности генеральной совокупности, тем более данных независимых экспери¬ ментов. Апостериорный подход используется, например, для построения кибернетической или информационной модели физического объекта, когда объект рассматривается как некоторая система, осуществляющая преобразование вход¬ ных воздействий в состояния выходов, и считается пол¬ ностью описанным, если описано это преобразование в абстрактной форме, не зависящей от физической природы входных и выходных переменных и процессов, происходя¬ щих в системе. Именно факт отсутствия физического на* полнения подобной аппроксимации чаще всего и вызывает скептическое, критическое отношение к данному подходу. В связи с этим уместно напомнить слова Б. Рассела «хотя это может показаться парадоксом, вся наука основана на идее аппроксимации». В отличие от вероятностных статистические модели используют аксиоматику фон Мизеса [5]. При этом модель строится на основе характеристик, получаемых предель¬ ным "переходом от эмпирических .характеристик при неог¬ раниченном увеличении объема экспериментальных данных, длины протокола испытаний. Такие модели имеют опреде¬ ленные --преимущества в предпосылках к физической ин¬ терпретации их содержания и обоснования. Однако в настоящее время они не имеют очевидных преимуществ математического плана по сравнению с хорошо разрабо¬ танным аппаратом в аксиоматике А. Н. Колмогорова. Адекватность использования подобных моделей для опи¬ сания физических объектов так же проблематична, как и вероятностных, а в нестационарных случаях не столь оче¬ видна. Ответ на вопрос о том, какие модели и какие спо¬ собы их получения использовать в конкретном случае, зависит от поставленной цели исследования, вида решае¬ мой задачи, сопутствующих условий, априорной неопреде¬ ленности и т. п. - Несмотря на принципиальные различия математиче¬ ского; плана* все варианты введения моделей имеют прин-г ципиальное сходство в способе измерения возможности появления событий (вероятности в смысле аксиоматики Колмогорова или фон Мизеса при априорном подходе либо
эмпирической вероятности при апостериорном подходе) через частоту (частость) событий. Отсюда следует общность в измерении (но не в. интерпретации и исполь¬ зовании) любых других характеристик и параметров мо-- делей: Как отмечает С. М. Рытов, вероятности, используе¬ мые в аксиоматике Колмогорову, имеют генетическую связь с эмпирической вероятностью, т. е. с частотой событий. Однако эта связь касается внематематических вопросов происхождения и измерения аксиоматических вероятностей, а не их содержания, из которого все эмпирическое уже исключено. Указанное сходство всех подходов позволяет для них использовать единые вероятностно-статистические методы, основанные на алгоритмах оценивания, используе¬ мых в статистических измерениях, лежащих в основе по¬ строения первичных, атомарных элементов технических средств, предназначенных для автоматизации вероятно¬ стно-статистического описания различных физических объектов. В работе под статистическими измерениями (Gil) 1 по¬ нимается опытное определение путем сравнения с образцо¬ вой величиной2 с помощью аппаратных и программных технических средств значений характеристик и (или)'па¬ раметров физических объектов, совпадающих по опреде¬ лению с характеристиками и параметрами абстрактных вероятностных и статистических моделей, используемых для описания данных объектов. В частности,* если при прямых измерениях в качестве образцовой величины используется (образцовая) характеристика, аналогичная измеряемой, то статистические измерения сводятся к дей¬ ствиям, направленным на установление количественных соотношений между измеряемой и образцовой характери¬ стиками. Это определение, отражающее ответ на воярос «что делать?», несколько отличается от известных [85, 86, 110, 131]. Отличие касается распространения на статисти¬ ческие модели и на измерения не только характеристик, но и параметров физических объектов,, эквивалентных пара¬ метрам моделей, заданных в операторной Форме. В [93— 95] даются определения, согласно которым под статисти¬ ческими измерениями понимается «установление модели исследуемого объекта, а также определение количествен¬ ных значений вероятностной характеристики случайного 1 О корректности термина «статистические измерения» см. [131]. 2 Образцовая величина должна быть физически однородной с изме¬ ряемой. 8
процесса, соответствующего этой модели, с помощью экс¬ периментально полученного выборочного процесса и вы¬ числение статистической оценки., вероятностной характери¬ стики» [93], «установление количественных связей между двумя объектами исследования, один из. которых является изучаемым (статистическая характеристика), а второй принят за образец, эталон (вероятностная характеристи¬ ка)» [95]. Принципиальным отличием данных определе¬ ний от предложенных в настоящей работе является отличие & объекте измерения. В данной работе объектом являются физические характеристики и параметры реальных физи¬ ческих объектов, абстрактными теоретическими аналогами, образами которых служат характеристики и параметры математических моделей, а в определениях, данных в [93— 95], — характеристики, параметры абстрактных моделей. На наш взгляд установление модели, построение моделей физических объектов по экспериментальным данным есть задача идентификации, решение которой, безусловно, не обходится без измерения характеристик и параметров фи¬ зических объектов. Вопрос об отождествлении измерения с вычислениями оценки вероятностной характеристики бу¬ дет обсужден ниже. .. Назначение статистических измерений (ответ на вопрос «для чего делать?»), определяющее требования к ним и их специфические особенности, может быть разным: стати¬ стический анализ, классификация, распознавание образов, техническая диагностика, идентификация объектов и т. д.. Заметим, что в работе статистические' измерения не ото¬ ждествляются, как это иногда-имеет место, «^аппаратур¬ ным (прикладным) статистическим анализом и оценива¬ нием. Отличие статистических измерений (СИ) и аппара¬ турного статистического анализа (СА) сводится к отличию целей и перечня решаемых задач, которое имеет место даже при совпадении назначений (конечных целей иссле¬ дования объекта) и используемых приемов. Цель стати¬ стических измерений — получение значений характеристик и параметров физических объектов, описываемых вероят¬ ностными моделями. Цель прикладного (аппаратурного) статистического анализа1 — исследование свойств объек- Под ним понимается опытное исследование (анализ) с помощью (аппаратных и программных) технических средств свойств и основных особенностей физических объектов на основе описания вероятностными или статистическими моделями. Средства аппаратурного статистического анализа относятся к кибернетической технике, в то время как средства статистических измерений относятся к измерительной технике. 9
тов на основе измеренных характеристик и их параметров. Для достижения этой цели в СА должны быть решены следующие задачи: (В)—выбор вида модели из заданно¬ го класса; (С) — статистические измерения характеристи¬ ки и (или) параметров ее; (Г) — проверка статистических гипотез; (П)—построение итоговой модели (подгонка мо¬ дели); (А)—анализ свойств модели; (М)—статистиче¬ ское моделирование (в случае необходимости). При этом цель собственно СА выступает цак внешняя цепь, т. е. каик назначение, задание по отношению к статистическим изме¬ рениям, используемым в СА. Наоборот, цель СИ, допол¬ ненная конкретными требованиями (заданная точность, минимум затрат, максимум-информации и т. д.), может вы¬ ступать как назначение для СА в тех случаях, когда в ите¬ рационном процессе решения конкретной задачи СА ис¬ пользуется как вспомогательное средство достижения цели СИ с учетом указанных требований. Отличие СИ от оценивания сводится к следующему. При оценивании ставится и решается математическая за¬ дача определения значений искомых характеристик гене¬ ральной совокупности путем вычисления (т. е. получения с помощью числовых преобразований) их по значениям выборки из абстрактных реализаций модели, описывающей эту совокупность. В практической реализации оценивания под элементами выборки понимают готовые результаты, полученные в опыте, которые полагаются равными значе¬ ниям реализаций модели. При этом не имеют значения физический смысл элементов выборки и способ получения их значений. При измерении же ставится и решается прак¬ тическая задача именно измерений значений характеристик физического объекта, описываемого вероятностной или статистической моделью, т. е. опытного определения харак¬ теристик путем сравнения с образцовой величиной по ре¬ зультатам эксперимента над исследуемым* объектом. Полу¬ ченные результаты измерения затем переносятся на характеристики и параметры моделей, описывающие ис¬ следуемый физический объект, например, приравниванием их к оценкам этих характеристик й параметров. Таким образом, одно из отличий сводится к хналичию операций сравнения с образцовой величиной в статистических изме¬ рениях. Конкретное отличие зависит от того, на каком этапе производится это сравнение. Например, если при статистическом измерении вначале, на первом этапе, осу¬ ществляется измерение «первичных» данных (параметров объекта), т. е. физически получаются элементы выборки, Ю
а потом уже, на втором этале, по ним определяются значе¬ ния характеристик с помощью числовых преобразований, т. е. практически осуществляется оценивание, то отличие сводится к наличию первого этапа' в статистических изме¬ рениях. Именно этот случай и будет рассматриваться в дальнейшем. Второе отличие сводится к охвату согласно требованиям обеспечения единства измерений при стати¬ стических измерениях всех процедур, в том числе число¬ вых преобразований, поверочной схемой. Сходство же статистических измерений и оценивания заключается в тож¬ дественности числовых преобразований, осуществляемых над первичными количественными данными.— элементами выборки, т. е. в сходстве вычислительных процедур, фор¬ мул для преобразования данных. В свою очередь наличие именно этих процедур отличает статистические измерения от нестатистических. Другими словами, статистические измерения характеристик и параметров материальных объ¬ ектов сводятся к задачам теории оценивания характери¬ стик и параметров случайных элементов — оценивание есть математический аналог статистического измерения. Поэтому в дальнейшем при описании алгоритмов СИ будут рассматриваться «статистические» части полных алгоритмов измерения, а именно — совокупность правйл и формул преобразования, которые относятся лишь к вычис¬ лительным процедурам, т. е, алгоритмы оценивания.
Глава первая Алгоритмы статистических измерений как объект исследования с системных позиций 1.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Для правильного понимания и применения дальнейших результа¬ тов в настоящей главе рассматриваются некоторые вопросы, которые нельзя обойти при системном-подходе к рассмотрению основ алгорит¬ мов статистических измерений (АСИ). Это прежде всего некоторые важные системные принципы, которых надо придерживаться при анализе, синтезе и применении алгоритмов; краткая характеристика объектов измерений — подлежащих измерению «вероятностных» харак¬ теристик; элементы морфологического анализа алгоритмов и некоторые принципы, которые ,обычно лежат в основе разработки алгоритмов оценивания вероятностных характеристик. 1.2. ОСНОВНЫЕ СИСТЕМНЫЕ ПРИНЦИПЫ И ПРАВИЛА В ПРИЛОЖЕНИИ К МЕТОДАМ И СРЕДСТВАМ МНОГОФУНКЦИОНАЛЬНЫХ СТАТИСТИЧЕСКИХ ИЗМЕРЕНИЙ И АНАЛИЗА (МСИА) Для того" чтобы в рамках системного подхода грамотно исследо¬ вать (анализировать, синтезировать) и применять средства МСИА, решать вопросы повышения их качества, по некоторой совокупности показателей и другие вопросы; необходимо придерживаться соответст¬ вующего набора системных прйнципов и вытекающих из них правил. Приведем нёкоторые из них. 1. Принципы системности (П1). Конкретная задача может быть грамотно решена только при условии, что ее постановка и решение осуществляются с позиций системного подхода. Это значит, что иссле¬ дуемый объект следует рассматривать как систему, как комплекс взаимосвязанных между собой и с внешней средой элементов, обра- 12
зующих некоторую целостность, с учетом всех системообразующих и системоизменяющих факторбв, выделяя место задачи и связь ее со все¬ ми другими задачами, возникающими в цепочке исследуемый мате¬ риальный объект — результаты ^ исследования — исследуемый объект. 2. Принцип обоснованности и согласованности (П2) можно пред¬ ставить в виде, совокупности следующих принципов й правил. Принцип ясности цели (П2.1). Правильный результат может быть прлучен лишь при условии правильно, ясно сформулированной конечной цели иссле¬ дования и уяснении места данной задачи в достижении этой цели. Например, в приложении к алгоритмам статистических измерений это означает, что исследованию (анализу, синтезу, модернизации или при¬ менению) алгоритма должно предшествовать уяснение назначения изме¬ рения и алгоритма, объекта измерения, вида конечного продукта и правила его применения, конечной х цели исследования материального объекта и т. д. Лишь после этого Ъ учетом других необходимых для данной цели принципов конкретизируются цели и задачи исследования алгоритма, выбираются соответствующие показатели качества и их конкретные значения (прц синтезе), рассматриваются конкретные раз¬ новидности алгоритма и проводятся их исследования. Принцип согла¬ сованности глобальной и локальных. целей (П2.2). Стратегия и такти¬ ческие решения (вид ,и' качество результата, используемые средства, требования' к ним и пр.) каждой частной задачи (например, стратегия поиска оптимального решения частной задачи), должны .быть подчинены стратегии достижения конечной (глобальной) цели и согласованы с ней. В. частности, должно выполняться требование согласованности (баланса) точностей (погрешностей) результатов в последовательной цепочке задач, подчиненное требованию по точности конечного результата в заданных условиях. Принцип обоснованности выбранных критериев и показателей качества средств МСИА СП2.3). Хорошим может быть лишь критерий, обоснованный всесторонне — аналитическими исследованиями, натурными и имитационными экспе¬ риментами, на основе мирового общественного и личного опыта реше¬ ния подобных задач, в которых применяются аналогичные средства МСИА, согласованные с конечной целью исследования. Принцип обос¬ нованности требований к значениям показателей качества средств МСИА (П2.4).ч Лучше требования приемлемые, реально нетрудно {дешево) достижимые, заниженные, чем необоснованно высокие. Фор¬ мулируя и выбирая требования, следует тщательно обосновать их, учитывая ограничения на показатели качества конечного результата исследования, потенциально достижимые значения показателей, затра¬ ты и т. д. Принцип обоснованности объекта исследования, выбора модели материального объекта и объекта измерения (П2.5). Чем про¬ ще (по описанию и по достижению требуемых значений показателей качества конечного результата в заданных условиях) и обоснованнее модель объекта и измеряемые характеристики, позволяющие достичь 13
той же глобальной цели, тем лучше. Выбирать нужно только хорошо обоснованные модель и подлежащие измерению характеристики (объекты измерения). 3.. Принцип полноты используемых средств (ПЗ). Используемые средства должны обеспечивать получение хотя бы одного результата требуемого качества в заданных условиях. Принцип локальной полноты (П3.1). Каждый вариант средств МСИА, предназначенных для реше¬ ния данной задачи с требуемым качеством, должен обеспечивать, получение не менее одного результата в заданных условиях — следует по возможности стараться выбирать именно такие средства. Принцип поливариантности (П3.2). Верные, наиболее полезные и глубокие результаты можно получить лишь путем многовариантного, много¬ гранного, разностороннего и детального решения задачи, обеспечив возможность варьировать средствами: моделями, измеряемыми харак¬ теристиками, алгоритмическими, агйхаратными -и программными средст¬ вами аналогичного или сходного назначения. 4. Принцип корректности (П4). Решаемая задача должна быть корректно поставленной, т. е. решение должно существовать, одно¬ значно определяться условиями и непрерывно зависеть от исходных данных задачи. Принцип устойчивости результата (П4;1). Выбирать следует средства, прежде всего устойчивые к внешним факторам (например, устойчивые, робастные алгоритмы), а потом уже из них оптимальные; средства, инвариантные к мешающим факторам, предпоч¬ тительнее средств, учитывающих эти факторы. Необходимо, исключить влияние мешающих факторов вместо того, чтобы организовывать их учет. Принцип минимума априорной информации (П4.2). Предпочти¬ тельнее те средства, которые требуют меньше априорных данных и (или) позволяют учитывать все имеющиеся априорные й апостериор¬ ные данные. 5. Принцип правдивости (истинности) результата (П5). Получен¬ ные данные можно считать результатом решения измерительных задач только при условии, что их получение должным образом обосновано и они представлены вместе с их метрологическими показателями. Прин¬ цип обеспеченности единства измерений (П5.1). Используемые средства МСИА должны удовлетворять существующим стандартам, определяю¬ щим обеспечение единства измерения — для измерительных задач вибирай только такие средства. Принцип метрологической обеспечен¬ ности (П5.2). Используемые модели, характеристики, алгоритмические, аппаратные и программные средства должны предусматривать воз¬ можность получения для них значений всех требуемых стандартами метрологических показателей качества результата решения задачи, а средства МСИА должны содержать элементы, позволяющие находить эти значения при затратах как можно меньших, чем общие затраты на получение искомых результатов решения задачи. 6. Принцип максимума эффекта и минимума потерь в данных 14
условиях (П.6) представим следующими принципами. Принцип огра¬ ниченности ресурсов (775.7). Результаты требуемого качества необхо¬ димо получать при минимальных затратах. Превышение ресурсов (денежных, временных и, т. ц.) по сравнению с минимально достаточ¬ ными недопустимо. Принцип максимума пользы (П6.2). Нужно так выбрать модель, измеряемые характеристики, алгоритмические, аппа¬ ратные и программные средства, чтобы получить максимум пользы от достижения глобальной цели (например, получить максимум информа¬ ции об исследуемом объекте, наилучшие значения показателей качест¬ ва конечного результата и т.д.). Принцип минимальной избыточности (775.3). Глобальная и локальная полнота при минимальной избыточ¬ ности — набор средств, обеспечивающих глобальную и локальную пол¬ ноту (см. принцип ПЗ), должен быть минимальным, не должен иметь пересечений по области применимости в тех же условиях^ должен обеспечивать равенство коэффициентов использования для каждого средства. Принцип дополнительности (П6.4). Поливариантность вместе с дополнительностью — выбирать _ средства аналогичного назначения следует так, чтобы, пересекаясь в области назначения, они дополняли друг друга по другим характеристикам и показателям. Принцип мно¬ гофункциональности (775.5). Наиболее эффективными и жизнеспособ¬ ными являются средства МСИА, в которых расширение функциональ¬ ных возможностей элементов, находящихся на разных уровнях органи¬ зации, опережает рост их сложности, т;е. плата за возможное ухуд¬ шение некоторых показателей всего* средства из-за обеспечения много¬ функциональности окупаете^ выигрышем по сравнению с затратами на совокупность специализированных средств, выполняющих те жё функции порознь. 7г Принцип интеллектуальности (П7). Средства МСИА — это не «бездумные» измерители и анализаторы (идентификаторы, имитаторы), a сред^ва решения интеллектуальных задач измерения, идентифика- кации, имитации, анализа. Они должны выполнять функции эксперта, ассистента, советчика, учителя, изобретателя и т. п., т. е. уметь авто¬ матически или автоматизированно адаптироваться, самоприспосабли- ваться, самообучаться, выбирать модели, характеристики, алгоритмы, аппаратные и программные средства, наиболее пригодные (эффектив¬ ные) для решения поставленной задачи, достижения глобальной цели. Приведенный перечень принципов может быть дополнен и. детали¬ зирован. Необходимо отметить взаимосвязь данных принципов: выполнение одних принципов может привести к частичному или полно¬ му выполнению либо, наоборот, препятствовать, противоречить выпол¬ нению других принципов. Учет всех принципов позволяет избежать однобокости, опасности абсолютизировать какой-то один из них, дости¬ жение которого может превратиться в самоцель. При практическом применении этих принципов необходимо стремиться формализовать их, поставить в соответствие принципу некоторый количественный крите- 15
рий. Если это удается сделать, можно попытаться найти множество оптимальных решений (например, множество эффективных решений Парето), удовлетворяющих векторному критерию, соответствующему всей совокупности принятых принципов. Затем, используя принцип дополнительности С. Бира, следует пытаться найти единственное ито¬ говое решение. Приводимые в настоящей работе результаты позво¬ ляют облегчить практическое применение данных принципов, в част¬ ности, в вопросах выбора измеряемых характеристик и параметров, алгоритмов их измерения, критериев качества оценок и т. д. 1.3. ОБЪЕКТЫ СТАТИСТИЧЕСКИХ ИЗМЕРЕНИЙ Системные вопросы выбора объектов измерений. Как уже .упоминалось во введении, объектами СИ являются характеристики й параметры физических объектов, пред¬ ставляющие собой физические аналоги характеристик и параметров вероятностных или статистических моделей, используемых для описания исследуемых физических объ¬ ектов. Именно поэтому в книге, во-первых, в применении к объектам измерений используется заключенное в кавыч¬ ки слово «вероятностные». Во-вторых, под объектами (луч-- ше было бы написать под «объектами») статистических измерений условно понимаются объекты оценивания, т..е. характеристики абстрактных вероятностных1 моделей, используемых для описания физических объектов. Это объясняется тем, что в книге рассматриваются лишь алго¬ ритмы оценивания, формально совпадающие с алгоритмами численных преобразований полных алгоритмов статисти¬ ческих измерений, а также тем, что в задачах идентифи¬ кации физических объектов результаты статистических измерений можно считать значениями оценок характери¬ стик абстрактных вероятностных или статистических моде¬ лей этих объектов. Обратим в связи с этим внимание на тот факт, что модель исследуемого объекта и модель полу¬ ченных при его исследовании экспериментальных данных должны быть отличными. Это отличие обусловлено тем, что экспериментальные данные отражают не только со¬ стояние объекта, значение его измеряемых параметров, но- и условия проведения эксперимента (наличие помех, не- идеальность средств измерения, неполную согласованность их с объектом, неидеальность других условий проведения эксперимента). Зачастую, правда, 1тим отличием можно- 1 В дальнейшем, как было указано ранее, рассматриваются только вероятностные .модели.
в первом приближении пренебречь. В противном случае необходимо учитывать, что результаты СИ отражают мо? дель и характеристики экспериментальных данных, а не объекта, и из них надо правильно извлекать необходимую информацию об объекте. Выбирая модели и измеряемые характеристики, необ¬ ходимо учитывать изложенные в предыдущем параграфе принципы, которые можно в каждом конкретном случае детализировать.. В частности, можно для детализации использовать принципы и правила Ю. Г. Полл яка [100], а именно: соответствия точности и сложности модели (Р1), баланса точностей (Р2), достаточного разнообразия эле¬ ментов модели (РЗ), наглядности модели для ее разработ¬ чика и потребителя (Р4), блочности модели (Р5), специа¬ лизации (Р6), динамичности (Р7). Сюда можно добавить принцип однозначности (Р8), согласно которому модель (или характеристика) должна однозначно, недвусмыслен¬ но отражать все эксперименты и позволять интерпретиро¬ вать каждый из них, и принцип физической обоснованности (Р9), согласно которому модель (характеристика) должна отражать существо физических процессов и явлений, ха¬ рактерных для исследуемого объекта, допускать ясную физическую интерпретацию своих параметров. Модель (характерифика) должна содержать по возможности мень¬ шее число параметров, ясно интерпретируемых. Зачастую более простые модели и характеристики дают более точ¬ ные результаты из-за измерительных и вычислительных трудностей (методических и аппаратурных погрешностей^ в сложных моделях [122]. ' __ Особо следует обратить внимание на тот факт, что одна и та же конкретная прикладная задача может быть реше¬ на с помощью разных характеристик исследуемого объек¬ та и описывающей его модели. Так, например, в качестве характеристики положения распределения можно исполь¬ зовать параметр сдвига, математическое ожидание, медиа¬ ну или квантили заданного порядка, моду, антимоду и т. д.; в качестве характеристик рассеяния—параметр масштаба, среднее квадратическое отклонение, срединное отклонение, интерквартильную широту и т. д.; в качестве характеристик связи — параметр связи, корреляционные и кумулянтные функции (коэффициенты)-разных поряд¬ ков, структурные и дисперсионные функции, причем каж¬ дая из подобных характеристик может вводиться по-раз¬ ному. Так, корреляционные функции могут быть аналого¬ выми (классические), цифровыми, полярными, релейными, 2—192 1Т
срединными, срединными релейными, срединными поляр¬ ными и т. д. Каждая характеристика аналогичного назна¬ чения имеет свои функциональные достоинства и недостат¬ ки, лучшие или худшие метрологические и прочие показа¬ тели сходных алгоритмов их измерения ‘в тех же условиях. Именно поэтому соблюдение названных выше принципов позволяет найти наилучшее решение в каждом конкретном случае. В последующих главах этот вопрос будет рассмо¬ трен на конкретных примерах оцениваемых характеристик и алгоритмов оценивания. Конкретные «объекты» измерений, рассматриваемые в книге. В дальнейшем будем рассматривать элементы Зс вида: случайные /г-мерные векторы Х={ХЬ Х2, ..., Хп}, стационарные и эргодические на уровне рассматриваемых характеристик скалярные Х(£) и «-мерные векторные -^(0=№(0> X2(t), • • •> Хпт случайные функции одного аргумента Ь, а именно процессы, если i непрерывно, и последовательности, если t дискретно (t=i или t=iAt, где At — шаг дискретизации). Обозначим через X, X область значений X, X (t) или X, X (t) соответственно. Для удобства X, X, X(t) и X (t) в дальнейшем будем обозначать одной буквой X. В качестве первого «объекта» статистических измерений (точнее, объекта оценивания) будем рассматривать ан¬ самблевые вероятностные характеристики Q('fl') ft-мерного (ft=0, 1, 2, ...) * векторного аргумента d={<h, •д*}, которые можно представить в виде <3(#)=м^№ #)}, (1.1) где М{-} — оператор математического ожидания — усред¬ нения по вероятностной мере случайного элемента X, a go (X] б) — функция, определяемая видом характеристи¬ ки Q(d). В качестве примера в работе рассмотрены сведенные в табл. 1.1 характеристики стационарных случайных про¬ цессов и последовательностей. Здесь 1(A) —индикатор события А, равный единице, если событие А имеет место, и нулю в противном случае; /= = У — 1 — мнимая единица; & == {^1> ^2»* • *» *п—1}> Хо == X(t) = X(t)-M{X(t)}; * Значение k=0 соответствует отсутствию аргумента. 18
X(j\)—([x(t) exp {/Ai}]t>, x{t\ — траектория (реализация) X(t); запись <[/(<)]<> означает 2 f (0. t — дискретное; <№>=■ fT — непрерывное, (1.2) г где Г — множество значений, принимаемых t. В таблицах и в дальнейшем используются дискретные •фй(т) и континуальные (непрерывные) -ф (Я, т) полные ортогональные функции, т. е. функции, для которых спра¬ ведливы соотношения где А — константа, равная единице для ортонормирован- ных функций; 6‘fc — символ Кронекера, т. е. 6^=1 при k=i и 6^=0 при k^i; б (и) —дельта-функция Дирака; ф0 (т) = = 1, ф(0, т) = 1; знак >(с означает комплексную сопряжент ность. При этом Обозначим через Л область значений аргумента Я спек-: тральных характеристик. Тогда при непрерывном t имеем Л= (—оо, оо) и будем обозначать Я=ю. При дискретном t—i или t=iAt имеем Я=л>=.соД£ и Л=[—я, я]. В качестве второго «объекта» статистических измерений будем рассматривать параметры конкретных характери¬ стик и моделей. А именно, будем рассматривать параметры сдвигй а, масштаба Я, формы а=аь аг, ..., an или и, р, у, б, ..., связи ф и т. д. функций и плотностей распределения вероятностей, параметры корреляционных функций й спектральных плотностей мощности случайных функций с дробно-рациональными спектрами. Неизвестные, подле¬ жащие оцениванию параметры будем обозначать буквой 0={0i, 02, ..., 0ft}. В качестве конкретных одномерных рас¬ пределений будем использовать широко употребляемые: нормальное N(a, Я) со средним а и дисперсией Я2, экспо¬ ненциальное Э(а, Я), заданное на интервале (а, оо), рав¬ номерное R(c, d) или R (а—Я, a+Я), заданное на [с, d] или на [а—Я, а+Я], и др. (см.-табл. 1.2), где всюду а — параметр сдвига, Я — параметр масштаба. <№*(') Ь* <’)Ь> = A*k, <[ф(у, х)ф*(н, *)Ь> = А8(и-|-о), (1.3) (1.4) <[Ф* К) Фа* К)]*> <[<М«, *,)Ф*(«*. ч)Ь> I 8^, если t дискретно, I ^ (хг — х2), если х непрерывно. 19
Таблица 1.1 Характеристики стационарных случайных функций Наименование характеристики Обозначение и определение характеристики Функция распределе¬ ния вероятностей {я-мерная, л=1,2,3,...) nF(x; т) =Р | Д X{(t, + xf_x) <xfJ. = = м|1|Д Плотность распределе¬ ния вероятностей {я-мерная, л= 1,2,3,...) хм jl [ Д хг-^<xt(ft +v-i) <1 Характеристическая функция {л-мерная; л=Г,2,3,...) „в(я; т) =м|ехр|/ S^^ + wj. Семиинвариантная (ку- мулянтная, логарифмиче¬ ская характеристическая) функция „Н(а; т) =1пяв(а; %) Начальный момент по¬ рядка ^1 + ^2 + • • • + kW = М { П X1l (ti +4-i)| Центральный момент порядка ^1+^2 + • • • + = М j П + Ч-х) j Кумулянт порядка ^1+^2+ • • • + ki,h,...,kn \x) — / X X * ,VH(tt:T) A • • -<4 tt=0 Квантиль порядка р xp =-• {*: ^(x) =/}' j Медиана
Продолжение таОл. 1.1 Наименование характеристики Обозначение и о предел ние характеристики Интерквантильная ши¬ рота Хр — X?. Р>Я Вероятностный момент порядка k 00 3k = J 1Щх)]ках, —00 00 3k =. 2 ^ = *»}1*. *п — значения X ~Л=—00 Мода xf = {х: Г(х) = max} X Дисперсия Среднее квадратичес¬ кое отклонение '=VD{X(t)} Коэффициент асиммет¬ рии Yi = Н-з/°3 = *з/а3 Коэффициент эксцесса Yj = (A4/e« — Ковариационная функ¬ ция Bxy(t)=cov{X(t), Y(t+ x)} = = M{^)W+x)} Корреляционная функ¬ ция fyy(T) = cor {*(/), Г(< +x)> = = M{A-(OW+x)> Нормированная корре¬ ляционная функция (x) P*V (t) V^(0)«Ky(0) Корреляционная функ¬ ция функций fl*(OL slY(t)] i„нелинейная* корреля¬ ционная функция) fyg(x) = M{f[*(0]|[r(/+x)]} Релейная корреляцион¬ ная функция %s(x)==M{i(Osl^ny(f+x)} 21
Продолжение табл. 1.Т Наименование характеристики Обозна1егие и определение характеристики Полярная корреляцион¬ ная функция Rssij) = м {sfgn ^(Osign >V+0} 'Срединная корреляци¬ онная функция Gxy (x) = M {[*(0 — x0,6] [У (;t + xj - Срединная релейная корреляционная функция G*S(*) = M {[*(/)-*o,s]X X s’gn [У«+х)-у0,5]} Срединная полярная корреляционная функция Gss(T)'=M {sign 1^(0 — *<>,»] X Xsign [У -hx) —y0,5I> Радиус корреляции X(t) 61' 11 to | ~ A 'X 1 V t Радиус абсолютной кор¬ реляции X(t) xlol — 2 ^ Интервал корреляции на уровне (порядка) е % = l p(x^Te) 1<е» £>°} Спектральная плот¬ ность мощности ^xy(^) == A^> = limM {Xr(jX)Yr(-j\)/T} T-+OD Спектральная функция (—оо для t = t; — 7z для t — i) X C(V = J Sxx(\)dl —00 (—1C) Линейчатый (дискрет¬ ный) обобщенный энер¬ гетический спектр S(k) » <[/?(х)ф*(х)]х> V Сплошной (непрерыв¬ ный) обобщенный энер¬ гетический спектр S(X)=<[tf(xH(X, x)]T> Структурная функция I рода Dlx(x)=M{[^(/ + x)-jy(0]2} Функция регрессии mx(y; x)=M{A’(t) |У(*+х)=</} 22
Продолжение табл. 1.1 Наименование характеристики Обозначение и определение характеристики Дисперсионная функция ■ПХ У(х) = oj' [М {ml (Y; т»Г‘/2 Корреляционная матри¬ ца R = {Rik> i= i. n\ k = \, n}, Rlk=cot{Xi, Xk} Норшфованная корре¬ ляционная матрица p = {p<a; »= i, л, k — i, n> Векторная (матричная) корреляционная функция R(t) = i, k=\, n}, RikW =Rx.xAz) i к Векторная нормирован¬ ная корреляционная функция t p(t) = {p<.t('c); i, k = \, n} Спектральная матрица ( матрица спе ктра льных плотностей мощности, векторная спектральная плотность) <sj> s(X) = {Sik(X); i = T~n, k=T7H}, SikW = Конкорреляционная функция KXy (x) - cor {Fx[X(f)b Fy [Y(t + x)]> = -M{Fx[X(/)]^[T(* + x)]> Нормированная конкор¬ реляционная функция **к{х) шшК„ М/УХххРЖууР) Конспектральная плот¬ ность мощности Va)=<lKxy (')e4UU> Кумспектральная плот¬ ность II рода 4-го по¬ рядка HS(\U X,, Xs) = <[[[*i,i,i,i(Ti» x*» х*)Х x exp { — НчК + xA + ^3]}]ti] tj T3 > 23
24
25
Из случайных процессов будем рассматривать гауссов- жие процессы, а также некоторые негауссовские процессы: эазличные марковские, в частности с одномерным распре- хелением Пирсона [125], процессы с линейной регрессией [37], гармонический процесс A(/)=Asin (Ш+Ф), (1.5) где А, £2, Ф — независимые случайные величины, а Ф име- гт равномерное на (0,2 я) распределение. В классе гаус¬ совских рассмотрим стационарный процесс, являющийся решением дифференциального уравнения 2 B„X<">(0= 2AftS(ft)(0, (1.6) ri—0 fc=Q где X(t), 2 (/)—стационарные m-мерные векторные про¬ цессы,с компонентами А«(<), Ss(0.» $=1» т, ЗЛО» ЗЛО— i-коррелированные процессы с корреляционными функци- хми ^s(t) = yr5jv/.5^i8(t); Sn —спектральная интенсивность; р<<7; A = {ars; г, s = l, т), B = {6rs; г, s= 1, т) — матрицы и G = {VsiTS^s\ г, s = 1, т). Как обычно, бу- хем полагать АФ = В0 = 1. Пусть р Я 00 А (/<в) =%К (/«>)*, в (/со) = 2 в„ (/<*>)". Н (Н = 2 Н* (/«о*. k=0 п=0 &=0 (1.7) Процесс X(t) допускает представление (1.6), если его матричная спектральная плотность мощности S(<o) = (ю); г, g= 1~т} равна sw=[^]°[-^w]=H(/“)0H‘<i4 причем корни числителя и знаменателя имеют отрицатель¬ ные действительные части. В скашярном случае из (1.8)' имеем S(a)) = - 2 «*()»)* fc=0 = Sn 2 bn(i<*)n n=о 2ck<*2k k=0 я 2 dn<*2n n=0 (1.9) 26
В качестве примеров случайных последовательностей рассмотрим стационарные случайные последовательности авторегрессии- и скользящего суммирования (среднего) лорядка р, q (АРССр, д), которые являются решением урав¬ нения SB aX(i-n)= S AftS (I — k). (1.10) n—0 6=0 Как и ранее, будем полагать, что S (t) ={Sj (i); /= 1, т} — ^-коррелированная m-мерная стационарная последователь¬ ность, т. е. последовательность с матричной корреляцион¬ ной функцией _ R(i, rt)={Pr,s(i. «); г, s=l, т)х равной R(/, л) = М{а(03т(й)} = Р(/-я) = 8г„О, (1.11) где 6*„={1 :t=n; 0:1фп)—символ Кронекера; т — сим¬ вол, транспонирования, a G={Gr,s; г, s=l, m}. Если Sr(t) и 3s(0 не коррелированы, то Gr,s= (ст2г: r=s=l; 0:r=^s}, в противном случае Grts=(orOsprs, г, s= 1, m}, где prs — коэффициент корреляции' между Вг(«) и В«(я). Если корни уравнения ч det В (z) = det S В„г" = 0 (1.12) п=О лежат вне круга |г|<1, то решением уравнения (1.10) является сходящийся в среднем квадратичном ряд i со X(i)= 2 H,_*S(*)= SH*S (?-*), (1.13) k=—оо 6=0 2l|HJs<oo, (1.14) k=a где | H |—норма матрицы Н={&г,«; r, s= 1, т). Представления (1.10), (1.13) имею.т место, если матрич¬ ная спектральная плотность мощности S(v) допускает факторизацию (115> а для (1.13) S (v) = Н (г) G [Н (г)]*, (1.16) 27
где Р q оо А (г) = 2 А*г*. В (г) = 2 В^, Н(г)= г=е{\ k— 0 л=0 &=0 (1.17) В скалярном случае имеем соответственно S(v) = o| | А(г)|2/ | В(г)\г, (1.18) S(v) = o| |tf(z)f, (1.Д9) где A(z), B(z),H(z) получаются согласно (1.17) при А*=а*, Вk—bk, Н*=Л*. Частными случаями АРССр,?— последовательности (1.10)—являются последовательность авторегрессии АР</=АРССо,<? порядка q и последовательность скользя¬ щего суммирования (среднего) ССр=АРССр,о конечного [в отличие от (1.13)] порядка р, получающиеся из (1.10) при р=0 и <7=0 соответственно. Их спектральные плотно¬ сти подучаются из (1.15) При р=0 и <7=0. Матричные корреляционные функийи R(t) m-мерйой последовательности X(i) вида (1.10) удовлетворяют урав¬ нениям. р 2 ' К G Н*_<, — оо < I < р\ &=max(0,‘i) 1.20) 0 i>p. 2 B„R («-<) = п=О При р=0, т. е. для АР?-последовательности X (i), из (1.20) получаются известные [6, 64, 128, 129] уравнения Юла — Уокера ч ч 2 B„R(п —<) = So G, i5* 0; 2В„р(я-0 = 0. *>0. (1-21) п=0 /=0 т. е.-в скалярном случае q q 2М(л-0 = 8о-4. <>0; 2^Р(«-0 = 0, i>0. (1.22) п=0 / = 0 Для ССр-последовательностей корреляционная функция R(t) определяется правой частью выражения (1.20), что в скалярном случае дает 28
p- m S afc< aft+|il> I * Я(г) = | *=o ' (1.23) o, ;>/>. Можно показать [138] , что максимальное.по всем скаляр¬ ным ССр-последовательностям значение, которого может достигать нормированная корреляционная функция р(0 — =R(i)/Я(0У, удовлетворяет неравенству | p(i) I < cos^J, (1.24) где. i=t/-+-l, .если i'— целое число, или i=E[i']-l-2, если |/ — нецелое, a E[i']—целая часть числа \?=p/i. Наконец, для последовательности (1.13) имеем R (0 = (.1.25) ft=0 Будем полагать, что коэффициенты А*, В* и, следова¬ тельно, с*, dk моделей '(1.6) и (1.10) зависят от парамет¬ ра %= {01, 02, ..., 0ft}. Тогда 'R(t) и S(X) будут.также за¬ висеть от этих параметров, т. е. R(t)==R(t; 0) и S (X) = =S (Я, 0). Именно подобные параметры 0 й будут рас¬ сматриваться нами как объекты измерений. В частности, может иметь место равенство aj==0i, a2=02, ■ ■ ->'ap=Vp, bi—Qp+i,..., b,j=Qk, k=p^-q. Помимо ансамблевых характеристик Q_(0) будем рас¬ сматривать также траекторные характеристики ко¬ торые в отличие от ансамблевых будем обозначать руко-, писными буквами. Траекторные характеристики @.(0) могут выступать сЗми в качестве конечного «объекта» из¬ мерения либо использоваться как оценки ансамблевых характеристик Q (0). Обозначим через x(t) траекторию (реализацию, выборочную функцию) функции'.Х(() и вве¬ дем финитный оператор усреднения по траектории j?r{\}s если t непрерывно', Г = Т, JIn {•}, если t дискретно, т. е. t = i (1.26) или t = iM, Г — N, где Жт{;} и Жц{-) определяются выражениями1 1 В дальнейшем оператор J(n{-} будем использовать так же, как оператор усреднения по ансамблю реализаций случайных величин, век¬ торов и функций. При этом под x(i) будем понимать значение i-й реа¬ лизации X/, (=0, N—1, случайной величины X, вектора X или случай¬ ной функции X(t) при <=const. 29
<Мт {*[*(<); *]} = -£-j* И*); *]dti (1.27) 0 N-1 {g [x (i); ♦]}=-y 2] 8 Iх (0; (i -28; i=0 Заметим, что в ряде случаев интегрировать в (1.27) целесообразно в пределах от —Т/2 до Т/2, а суммирова¬ ние в (1.28) вести от —N' до N' при N=2N'-{-l или от — (N'-— 1) до N' при N=2N' Однако в дальнейшем для удобства будем рассматривать операторы в виде (1.27), (1.28). Тогда траекторная характеристика С(Ф), получен¬ ная усреднением на отрезке (0, Г), -будет.иметь вид ©г (#} = {£q Ix (t); ♦]}, (1.29) если gQ[x(f); -б-] не содержит в качестве параметров зна¬ чений каких-либо траекторных характеристик. В против¬ ном случае будем рассматривать траекторные характерис¬ тики Qr(б), получаемые по (1.29) с заменой g<jl-] на £<?[•]» содержащие по определению в качестве парамет¬ ров вместо значений ансамблевых характеристик значения траекторных характеристик. Если функция X(t) нестационарная, то зачастую вмес¬ то зависящей от времени t ансамблевой характеристики Qr(6-; t) с помощью траекторной характеристики. @г (Ф) из¬ меряется (оценивается) совокупная (ансамблево-траектор- чая) характеристика <2г(Ф), получаемая двойным усред¬ нением: ; Qr(6) = ^r{Q(6; О}- (1-30) 1.4. МОРФОЛОГИЧЕСКИЙ АНАЛИЗ АЛГОРИТМОВ Вводные замечания. Под алгоритмом принято пони¬ мать формальное предписание, однозначно определяющее содержание и последовательность операций, переводящих совокупность исходных данных в искомый результат — решение задачи [70]. Для алгоритма характерна расчле¬ ненность определяемого алгоритмом процесса решения на отдельные элементарные акты, возможность выполнения которых не вызывает сомнения, а также однозначность результата процесса при заданных исходных данных и массовость — применимость для различных исходных дан¬ ных. Количество таких актов (операций, действий) опре-, 30
деляётся степенью детализации, необходимой для дости¬ жения решаемых задач анализа и реализации алгоритмов- Отсюда видно, 4fo многообразие различных алгоритмов определяется количеством комбинаций, которые можно образовать из допустимых кортежей различных реализа¬ ций каждого действия (операции). Поэтому для изложе¬ ния основ алгоритмов статистических измерений (АСИ) с системных позиций можно избрать два пути: описывать порознь все многообразие конкретных полных алгоритмов в приложении к конкретным характеристикам (что чаще всего встречается в публикациях) или описывать порознь многообразие реализаций составных частей полного алго¬ ритма. В чистом виде при системном рассмотрении основ. АСИ первый вариант мало приемлем из-за большого ко¬ личества различных АСИ. В то же время второй подход позволяет отдельно исследовать разные составляющие ал¬ горитма, реализации многих из которых не зависят от кон¬ кретных объектов измерений, а свойства и особенности реализаций этих составляющих зависят от конкретных объектов измерений лишь через обобщенные показатели. Если к тому же подобные составляющие выбрать так„- чтобы правила их соединения в полный алгоритм для раз¬ ных объектов измерения были очевидны для разработчи¬ ков и потребителей АСИ, то такое рассмотрение АСИЬ позволит компактно изложить именно основы, охватывают щие все возможное многообразие конкретных алгоритмов* вместо отдельного рассмотрения каждогр конкретного алг горитма в приложении к конкретной характеристике. В этом случае привязку к конкретным характеристикам, следует осуществлять лишь для тех составляющих алго¬ ритма, реализация и свойства которых в сильной степени зависят, от типа измеряемых характеристик или их парат' метров. Именно такой путь выбран при изложении основ, алгоритмов оценивания в настоящей книге. Однако для того чтобы реально осуществить подобный- путь, необходимо уметь осуществлять декомпозицию1 -г- расчленение алгоритма на составные части. Это можно сделать, если применить морфологический анализ, широко используемый при исследовании и проектировании раз¬ личных технических объектов. Прежде чем приводить ре^ 1 Согласно [91] декомпозиция сложных систем должна осуществ? литься в четыре этапа, связанных с выделением семантических, морфо¬ логических, алгоритмических и модульных подсистем и с построением соответствующих, этим подсистемам моделей. 31
зультаты применения морфологического анализа, необхо¬ димые для изложения основ АСИ, рассмотрим, что он со¬ бой представляет. Что такое морфологический анализ АСИ. Понятие «морфологический анализ» происходит от объединения двух понятий: «анализ» и «морфология». Анализ есть ло¬ гический прием, состоящий в том, что изучаемый объект расчленяется на составные элементы, каждый из которых затем исследуется в отдельности как часть расчлененного целого, для того чтобы выделенные в ходе анализа эле¬ менты соединить с помощью другого логического приема — синтеза — в целое, обогащенное новыми зданиями [70]. Морфология — раздел грамматики, изучающий структуру слова, компоненты слова и их функции, правила построе¬ ния и изменения слова в пределах предложения, а также способы образования формы слова, характер соотношений между значениями и формой грамматических единиц [70]. Следовательно, морфологический анализ следует рассмат-' ривать, с одной стороны, как раздел теории системного исследования объектов различной природы, изучающей правила декомпозиции — расчленения объекта на состав¬ ные элементы, структуру (архитектуру) объекта, его эле¬ менты и их функции, правила изменения и образования объекта из совокупности составляющих его элементов в- пределах той системы (или функциональных назначений и требуемых показателей'качества), составляющей частью которой является сам исследуемый объект, характер соот¬ ношений между структурой, назначением и показателями качества элементов системы. С другой стороны, в конкрет¬ ном приложении морфологический анализ объектов есть логический прием исследования, состоящий в том, что изу¬ чаемый объект расчленяется на составные элементы, каж¬ дый из которых исследуется отдельно, изучаются структу¬ ра, правила образования объекта из его элементов и т. п. В приложении к искусственным объектам применение мор¬ фологического анализа позволяет, в частности, выявить все возможные на современном уровне знаний и этапе разви¬ тия техники варианты построения и использования объек¬ та, включения его в систему. В свою очередь эти знания позволяют определить, какие из этих возможных решений используются, исследованы в настоящее время, а какие по известным или невыясненным причинам не нашли еще должного исследования и применения, позволяют синтези¬ ровать новые решения в виде новых комбинаций состав¬ ных элементов и т. д. 32
Поскольку алгоритм статистических измерений состо¬ ит из системы последовательно 'выполняемых действий — элементарных преобразований над физическими величина¬ ми, характеризующими'состояние исследуемого физическо¬ го объекта, — и правил, устанавливающих порядок выполнения этих преобразований от первичного измерения физических величин до выдачи готового результата ста¬ тистических измерений, расчленение его на составные эле¬ менты означает выделение этих элементарных или укруп¬ ненных (в зависимости от степени детализации) действий. Поэтому первым этапом морфологического анализа АСИ является исследование структуры (состава и связей) ал¬ горитма путем декомпозиции.— расчленения его на сово¬ купность из отдельных независимых, непересекающихся (математический аналог — ортогональных) действий Дг, i=l, /г, конкретное соединение возможных реализаций ко¬ торых соответствует конкретному алгоритму. Каждое та¬ кое действие Дг, t=l,n, характеризуется некоторой сово¬ купностью признаков Tlik, k=\,si, s,= l, 2 Отличие алгоритмов друг от друга сводится к отличию реализаций /А,*, /=1,<7/, <7/=1, 2,..., действий Дг, по призна¬ кам Я,-.ft, k=\,st, Й порядка соединения этих действий Дг в конкретный алгоритм. Поэтому вторым этапом морфоло¬ гического анализа СИ должно быть рассмотрение различ¬ ных известных (если производится систематизация, клас¬ сификация). или возможных (при анализе, синтезе) вари¬ антов реализаций jPi,k действий Дг по каждому- из отли¬ чительных признаков Яг,й. Результаты первых двух этапов морфологического анализа удобно представить в виде мор¬ фологических таблиц, которые могут дополняться деревь¬ ями детализации (или локальными морфологическими таблицами) по отдельным реализациям /А,*. При этом признаки можно оформлять в виде дискрипторов. В пр- добных таблицах обычно не отражаются возможные ком¬ бинированные решения, основанные на -простом сочетании реализаций /Рг,* внутри одного признака Яг,*. Такие со¬ четания' принимаются как само собой разумеющиеся, если эти сочетания допустимы (по физическим и прочим сооб¬ ражениям)', .и исследуются отдельно в случае особой не¬ обходимости. Кортеж последовательно соединенных ячеек по одной ячейке из разных строк морфологической табли¬ цы отождествляется с узлом многомерной решетки, т. е. с отдельным конкретным вариантом решения (алгоритмом
Дальнейшие виды морфологического и других анали¬ зов сводятся к исследованию связей, правил включения действий в алгоритм, особенностей, преимуществ и недо¬ статков, показателей качества отдельных реализаций }Pt,h, действий внутри признака Я<,ь и т. д. Результаты та¬ ких анализов оформляются в виде положительно-отрица¬ тельных матриц вариантов алгоритмов либо отдельно в виде формул погрешностей, потенциально достижимых результатов, совокупных экспертных баллов, выставляе¬ мых каждому варианту, показателей сложности, сигнали¬ зирующих функций1 и других показателей качества реше¬ ний. Положительно-отрицательная матрица^4 вариантов представляет собой сводку коллективных, представлений оценок преимуществ и недостатков вариантов*реализация jPi,k, приведенных в морфологической таблице, отдельно, по каждому Признаку Я,.*,. ' Одним из результатов морфологического анализа мо¬ жет быть морфологическое описание АСИ. Оно может быть задано, например, четверкой {Е, В, С, К), где Е — множество выделенных элементов (операций) АСИ; В — множество внутренних и внешних связей; С — множество, характеризующее структуру, т. е. множество всех возмож¬ ных отношений между элементами АСИ; К — множество, ^характеризующее композицию системы, т. е. множество способов объединения элементов в более крупные части АСИ. При синтезе морфологический анализ позволяет выя¬ вить все возможные варианты АСИ. Далее на основе ре¬ зультатов других анализов (положительно-отрицательных матриц, экспертных баллов, предельных значений погреш¬ ностей, других показателей • качества, матриц смежности и совместимости и т. д.) можно найти коэффициент значи¬ мости каждого варианта по г-му критерию. Затем, зада¬ ваясь критериями отбора и фиксированными ограничения¬ ми, методами отсечения типа ветвей и границ, можно про¬ извести выбор искомого варианта из всего множества их, удовлетворяющего требуемой совокупности критериев ка¬ чества, т. е. решить задачу векторного синтеза алгоритма, либо можно выделить набор вариантов с ^наибольшими общими коэффициентами значимости для их дальнейшего анализа, более детального исследования. 1 Сложность алгоритма определяет длину описания алгоритма, а сигнализирующая функция характеризует сложность реализации алгоритма, например процесса вычисления, осуществляемого по данно¬ му алгоритму [70]. 34
В настоящей работе будут рассмотрены лишь результа¬ ты первых двух этапов морфологического анализа АСИ. Морфологическая таблица АСИ. Известные и возмож-. ные АСИ можно представить различными морфологиче¬ скими таблицами в зависимости от того, алгоритмы изме¬ рения каких характеристик, каких случайных элементов (величин, векторов, функций) и на каком уровне детализа¬ ции рассматриваются. Некоторые варианты таблиц, близ¬ ких к морфологическим и учитывающих класс исследуемых случайных процессов, вид измеряемой характеристики, тип исподьзуемого оператора усреднения и вариант организа¬ ции измерительного эксперимента, получены в [131]. Условимся название алгоритма СИ образовывать из названий, присваиваемых реализациям jPi,k, а для сокра¬ щения каждой реализации присвоим свой идентификатор. Неочевидное название алгоритма ц идентификатора усло¬ вимся обозначать в морфологической таблице в скобках. Тогда в принятых обозначениях фрагмент морфологиче¬ ской таблицы алгоритмов измерения характеристик ста¬ ционарных случайных (процессов, являющийся результатом применения первого и второго этапов морфологического аюализа, можно представить в виде табл. 1.3. Если исклю¬ чить из табл. 1.3 действия Д\ и Дз, то получим фрагмент морфологической таблицы алгоритмов измерения характе¬ ристик случайных величин и векторов, которым соответ¬ ствуют, естественно, усреднение по ансамблю реализаций и "дискретное множество исходных данных. Отдельные реализации /Р,,* в табл. 1.3 допускают де¬ тализацию, которая может быть оформлена в виде дерева детализации, представленного таблично или в описатель¬ ной форме. Естественно, что эта детализация связана с ис¬ пользованием соответствующих признаков, которые могут совйадать или не совпадать с признаками детализации по другим пунктам табл. 1.3. Так, реализация 2^8,i (косвен¬ ный алгоритм) допускает следующую детализацию: 1) нахождение значений характеристик по оценкам: 1.1 вычисление значений одних характеристик по измеренным значениям других характеристик;. 1.2 — вычисление значе¬ ний характеристик по измеренным значениям их парамет¬ ров; 1.3; 1.4;... — прочие; 2) нахождение значений харак¬ теристик по измеренным коэффициентам разложения характеристик в ряд: 2.1 — по системе ортогональных функций: 2.1.1; 2.1.2;... — перечисляются используемые системы функций; 2.2 — по системе неортогональных функ¬ ций: 2.2.1, ' 2.2.2,—перечисляются сйстемы функций; 3* 35
« о о 0 ф 1 X 3 Ж «в ed sr S* ф н о 5 6 £ со о. со X ф 3 CQ О 3 н ж Q* • О и 4 <0 3 Ef В 4 \о СО н «в § и § о •& о. § н S ф 3 и со # ж S ч хо СО н оГ 3®ж н к S Ж 52 S о гг со 3 55 о я* VO ф 2 4 О- О с о С х 3 ж «вс оГ •я 3 Ж 04 g 4) Ч«0 04 Н •вс йГ »я § ф •ч VO 3 ж < о ж иэ OS' «а я о £ Я ф Е »ж 3 ж S' 04 ж 0 ж 1 о ж <5 2 <5 ф 3 ” * л g 5 s ■ в§ 4 2 |SL ja о CQ ф § cd СО я ^ Ф *я о. £ ж £ о г. ж ф О* SS g£, ж w 2>g S * 5 ф * £Р 2 §. ж СО U,s?' Н Л о ж t яЗ- Ф Sta ж ф г' ж- я 3 ф ж о н * « со Ж и со и аЯ gg И о. ф о. ж 3 к Н Я Я Я -I я* «*н 2 Sxg* о я я я d) * ж о о ж я о я 3 о. « 8. Ф е PQ 5 Я »Я К 3 Я Ж; 2 | |8 — • Я я оя 2 § 3 «0,0 со 2 5 ф &2 й 5 я Я S w СО я я CQ О , со ж о с о со ф UQ *« II V ** И I4 .Я я к я as я ф ж я ж Ф з я л Я *=1 ё S-S. a*t lie- * S Я ►-Ч О 04 С ж ф о а я о a о ю н о ф- г »к ж I о S3 о. л е 5 О 3 *1 ф я ^ Я ф g 2 g,s a о ф д С о" ж со со Я *=с о Я &S Я « о »ж о 2 я Я О ж в Ж со CQ 04^ СО ХО эД о. о о и Я ж н ф 04 ж о ж Ct II СО о 8 я СО О ж я ч СО к ° я с 2 % § ж ф £ is S X 2 i || si 3 §£ Я ф 2 Я4 СО Ц Я л н О ф с о- 8* йо ^ н ж ф СО СО Ж 9S " 5 Ф я ж в ж ж • я ч CQ Я о ф И 04 0 ж 2 2,я в я ж *ss. я >» Is II ё* ж ° II §8 я ю
Возможные реализации признака vo 8 § I 1 л . О) J3 й eg О 1^ .& ч Я '—' н 0 CtiS S «8.11 % с * э g £ I § 1 g у S Л ffl S 3 С о н я »я я «о <о 3 я со яг я а Я н я Я >Я и 3 >а Я я о я ii 55 ЗЯ IS я £ Я g^S e-sg « £ m 4 *5 2 5 2 jii я м Rao. я я H H »я >*-'эя ЗЯ 3 3 * я £ я ^ £ я 2 H я 2 - си £ £. G 2 <=» и *4 oT я я я о н, о я § ЗЯ 3 я я я я о о* о Ой я о я S, *3 я "•S3 Он я Ой я ^ О я Ь я я Ри 3 о я я •э£ и S £ о. <и *5 £ 5 £ Соя ул « * О S о о я ч с ЗЯ 3' я н Я »я 8.Я S3 ^2 й я &| Е! 5* я я - . я 2 я 2 Й я ю s а в-g ю *° Л-Й н £ « ° 2 с я « 3 я я я _ * я ь «я 5 **"!■* а« у S а* Я со я я я Я я ч S's- яё Я кй |S О я * . 1 с я я я Р § X «з •а| Is 11„ аг SB ё 2 2 о О.Я С 4 с я §£ 13 £*я я я СО ■ « « « Я, О И 2 я 5 я 5Гё Ой &° 9 а я н ь- О — я я « о >>Ч О Я я Я Я Он с н с а- S* s.* я я о я о си я 2 ■а§ <§•8 о 5 Я Я »я я я я ч я я я я § н я »я а2 л 3 сг1 Я 5^ К S Я$ я £ СО Я _ Я Ч »Я ч я я Я Я ^ о о Ой U 03 о О я я ~ 2 Н ft Я я Я Я »я Я 2 и 1*8 3 &{ -2J * < £ £ 5 я : 3 с о ► S с 2 с Он С 2 & .53 < я " S , S : я : CQ 1 37
Продолжение табл. 1.3 с4 2» *—» в и н £ я я 2 Я 4) Си g ^ W Н 2* s «* я 2 « * 3 9ft & fc 3 2 s я 2 v н * >>ft CO ft <D ft s a. <v S 5 ^ ^ s “f s >>5 * I 1 ill Is! 1*5 о ft i ч с 4) О ft ft 2. Cu 2L s_ X »я о ft о ft s 2 ca n ° 2 CO A ft 0 <u ft Ok 1 * §S CO S3 <§£ Ю О s ft CO b ft о & CO S Ли CO £ О o|g £ss S c <w 8b- g И O CO <y ft & г”*"» л ДО CO CO О ft ft sg 8® 2 ca SI M J-°e SB С о Ч к aJ ■в* w ft ft ft CL) ft а CO ft ft о ft CO CO b I cu cu о ft H a> CU s? 4§ ft 2 H н a ft a> <d * fe. s « CO S*33 ft я CQ я о ft о ft 3 <V A £ 5 H ft О CO ft ft <D _ ё яг § g i a) § g X х p 2 e s v— ft ft ft <D ft VO о о о с о о ft Я н S ft 2 со § S* ш я _ СО н с СО ft S S со и ft S . СО >? о ft a> 8 * Я ft 2 я я s ft 0J СО о> си О £Г Н PQ >> О vo а о о О) 2 |i Я о о ft _ О) я G м о о £ § 1 g-5.- 15 Is- &**> о> о ft о я v Я а с R *2 я я X я СО н я о S ft ' 0> S о ft я I >> ^ СО W О) си „ я о со <11 О О & * ft 2 о 5 0) я В* 5. И ^ £ « я 2 « § С^я §0) я я 0) <г ас си со а о а о> 38
Таблица 1.4. Морфологическая таблица многократных алгоритмоа Отличительный признак Возможные реализации признака Но¬ мер i Содержание р\.1 р*. if а 1 Точность результа¬ тов Равноточные Неравноточные 2 Очередность обра¬ Последователь¬ Параллельное (одно¬ щения ное. обращение временное) обращение 3 Перекрытие исход¬ ных данных Без перекрытия С перекрытием 3) компенсационные;'4) интерференционные и т. д. Реали¬ зация 2.Р 1,2 (многократный алгоритм) допускает детализа¬ цию в виде своей морфологической таблицы, фрагмент которой представлен в табл. 1.4. Реализация 2P3,i (дис¬ кретный алгоритм) допускает детализацию: дискретизация с равномерным или с неравномерным шагом. Неравномер¬ ная дискретизация мржет быть далее детализирована». Согласно табл. 1.3 применение морфологического ана¬ лиза позволило расчленить АСИ на составные элементы. Это в свою очередь позволит в дальнейшем рассматривать алгоритмы по их составным элементам, т. е. отдельно-по каждому признаку по каждой строке табл. 1.3. При этом действия Д\ и Д2, подробно исследованные в [ 131J, рас¬ сматриваться не будут. 1.5. ТИПОВЫЕ ПРИНЦИПЫ И ПОКАЗАТЕЛИ КАЧЕСТВА АЛГОРИТМОВ СТАТИСТИЧЕСКИХ ИЗМЕРЕНИЙ Вычислительные преобразователи в АСИ. Как указывалось во вве¬ дении, отличие алгоритмов статистических измерений от алгоритмов не- статистических измерений сводится прежде всего к наличию в АСИ вы¬ числительных преобразований, реализующих формулы оценивания ха¬ рактеристик или параметров случайных элементов по их выборкам. По¬ этому в дальнейшем будем рассматривать, только те действия из табл. 1.3, которые специфичны именно для алгоритмов оценивания, т. е. вместо полных АСИ будем рассматривать алгоритмы оценивания, по¬ лагая, что выборка х уже имеется в распоряжении исследователя. Условимся считать, что для случайных величин X выборка х есть мно¬ жество чисел Х\у х2, . ♦Xff, каждое из которых может принимать любое значение из области X задания величины X. Для /г-мерного вектора пХ={Хи Х2.у Хп} выборка *=(*,-; i= 1, N}y где Xi={xui, x2ti, Xn.i), a Xk,i есть i-я реализация величины Xk, 6=1, л. Для скаляр¬ ной случайной функции X(t) при ансамблевом отборе элементов выбор¬ ки х*={х\(t)t ..., xjy(f)}; /=const, а при траекторнюм отборе x=x(t)t
/е[О, Г), где Г=^7, если аргумент t непрерывный, и Г=ДГ, если аргу¬ мент t дискретный, т. е. t=iy t=i№ или t=tif i=\yN. Для n-мерной векторной функции ПЛ(0 при ансамблевом отборе элементов выборки *={*/(*); f=const, xi(t) = {xk,i(t), 6=1,n}, Xk,i(t)—реали¬ зация Xk(t)y а при траекторном отборе *={*л(0; k=\,n, te[0, Г)}, где xk(t)—траектория 6-го элемента Xk(t) векторной функции nX(t). Известно, что при оценивании характеристик случайных функций зачастую целесообразно осуществлять двойной отбор элементов выбор¬ ки, и двойное усреднение — по траектории и, по ансамблю, реализаций [93, 131]. В работе всюду рассматривается одинарное усреднение либо по ансамблю из N реализаций (тогда {*t(0; *=!> W, t=const}),, либо, как .правило, по одной траектории Xi(t) (тогда x—{xi(t); te[0, 7), i=const}, если осуществляется непрерывное усреднение по всей реали¬ зации, или х есть множество дискретных эквидистантных отсчетов /-й реализации Xi(t)y т. е. *={x,(6Af); 6=1yNy i=const, Af^const}). При¬ водимые в книге результаты справедливы для любых данных вариантов организации выборки и одийарНого усреднения. Будем также считать, чтр усреднению по ансамблю реализаций соответствует оператор Жы из (1.28), в ^котором под x(i) понимается **, т. е. значение /-й реали¬ зации случайной величины Ху вектора X или функции X(t)y X(t) при /=const. При этом следует помнить, что корреляция между элементами выборки, отстоящими на т,, относится к хф) и xt+t(f), i=*-l9N9 *= =const, при отборе и усреднении по ансамблю реализаций либо к */(0 и xi(t-\-т) при отборе и усреднении по одной траектории Xi(t). Обоб¬ щение результатов не представляет труда и может быть легко сделано читателем. В этих-обозначениях вычислительные преобразования сводятся к ре¬ ализации формулы 0=X¥v{x)y, (131) определяющей статистику1 О как оценку характеристики (U=Q) или параметра £/=0, где 'PtK*)—некоторый оператор (в частности, функ¬ ция или функционал). Для случайных величин и векторов U всегда представляет собой ансамблевую характеристику Q: Для процессов и последовательностей U может быть ансамблевой (U—Q)t траекторной (U—@) или совокупной (U—Q) характеристикой. Конкретный вид опе¬ ратора Wu определяется характеристикой (параметром) и алгоритмом оценивания Uy т. е. реализацией соответствующих признаков табл. 1.3. Поиск оператора 4ft; при заданных требованиях к показателям качества АСИ. является одной из задач синтеза алгоритма. Задачи же анализа АСИ сводятся к исследованию показателей качества алгоритма при фик¬ сированных видах оператора 4V Обычно в исследованиях и в проект- ' ' ч 1 Под статистикой принято понимать (любую) функцию от элемен¬ тов выборки. 40
го Порядка, рангов, баллов). Номинальных (шкала Наименований), ных задачах анализ и синтез дополняют друг друга и используются совместно. Наша задача в дальнейшем — рассмотреть основные разновидности операторов Ч'у для разных алгоритмов оценивания различных характе¬ ристик и дать некоторый анализ специфичных длй АСИ метро-' логических показателей качества получаемых при этом статистик U. Для этого мы должны договориться, о каких показателях качества АСИ пойдет речь и почему-именно они прежде всего-будут интересовать нас.. О показателях качества АСИ*. Как указывалось в § 1.2 (см. прин¬ ципы ПЗ и П4), анализу и синтезу АСИ должен предшествовать этап исследований, связанный с разработкой, всесторонним анализом и обос¬ нованием скалярных и векторных Показателей (критериев) качества алгоритмов. Удачно выбранная совокупность показателей позволяет" /правильно установить целесообразные области применения алгоритмов и, наоборот, при заданных фиксированных ограничениях правильно выбрать алгоритмы по скалярному или векторному критерию. Показатель качества алгоритма — это некоторая характеристика, определяющая соответствие алгоритма его назначению, т. е. пригодность алгоритма для получения решения поставленной задачи, и близость до¬ стижения цели. Показатель качества отражает одну из сторон функцио¬ нирования и область применения алгоритма. Показатели качества могут измеряться в разных шкалах: количественных (шкала интервалов, отно¬ шений, абсолютных разностей), порядковых (шкала порядка, частично¬ го порядка, рангов, баллов), номин;альных (шкала наименований). В книге рассматриваются только количественные показатели качества алгоритмов, тхе. показатели, измеряемые в количественных шкалах. Показатели качества могут быть проблемно-ориентированными, т. е. специфичными, наиболее удобными, физически понятными при ре¬ шении задач определенного класса, или универсальными, пригодными непосредственно или с ^пересчетом по известным правилам для различ¬ ных классов задач. Количественные показатели могут быть представ¬ лены в абсолютных или относительных единицах^ Например, относитель¬ ный (нормированный) показатель может характеризовать качество дан¬ ного алгоритма' в сопоставлении "его с оптимальным (в смысле мини^ мума или максимума этого показателя при тех же условиях)- алгорит¬ мом внутри данного признака (строки) морфологической - таблицы и определяться отношением абсолютных значений показателей данного и оптимального алгоритмов. Для функциональных характеристик, пред¬ ставляющих собой функции Q(fl) некоторого аргумента р, показатели могут.быть локальными или глобальными. Локальные показатели ха¬ рактеризуют качество^ оценки Q(fl) при фиксированных значениях аргу¬ мента О, а глобальные — вдоль всего диапазона изменения аргумента Ф. Локальным показателем, например, является дисперсия D {<?(#)},'гло¬ бальным шах D {Q (б1)}, значение меры близости функции 0(6:) Ь -41
к Qf'fr) и т. д. Вся совокупность показателей качества алгорйтма С Точ¬ ки зрения его применения при практической реализации техническими средствами может быть сгруппирована в четыре класса: функциональ¬ ные, метрологические, технические и экономические (эффективности и эксплуатации). В дальнейшем ограничимся лишь некоторыми количест¬ венными метрологическими показателями, специфичными для АСИ. Отличительной особенностью статистики О как результата оценива¬ ния является ее двоякий'характер: поскольку О есть результат приме¬ нения оператора Ч'у к выборке *, апостериори О есть неслучайный эле¬ мент (величина, вектор или функция), в. то время как априори О есть случайный элемент?. Причина этой случайности заключается в том, что элементы" выборки априори не известны и могут принимать любые зна¬ чения из области значений случайного элемента £, к которому отно¬ сится выборка. Иными словами, 0=у¥и(х) есть реализация случайного элемента Ч^ДЯ). В связи с этим, во-первых, к статистике £7 может быть применен оператор 1 М математического ожидания — (ансамблево¬ го) усреднения по вероятностной мере элемеюга Ж. Во-вторых, специ¬ фичными показателями качества АСИ должны быть показатели, учиты¬ вающие априори случайный характер результата измерения — О. Кон- крётный набор показателей определяется, исходя из следующих сообра¬ жений. Если не задаться какими-либо ограничениями, то оператор Ч^/ можно выбирать произвольно. Однако не все полученные при этом стат тистики О будут приемлемыми оценками для U. Для того чтобы О была пригодна в качестве оценки для £/, необходимо так выбирать Ч'у, чтобы О как оценка U обладала требуемыми свойствами. В свою оче¬ редь - свойства оценок являются следствием определенных принципов, которые должны быть положены в основу требований к качеству оце¬ нок. В связи с. этим рассмотрим^ основные принципы, используемые в теории оценивания, и связанные с ними метрологические показатели качества алгоритмов оценивания. Типовые принципы, используемые при построении оценок. Принцип несмещенности Согласно этому принципу оператор Ч^у должен выбираться так, чтобы оценка О была несмещенной или асимп¬ тотически несмещенной,/ т. е. чтобы выполнялось условие несмещенности мф) = и, vuev, __ (1.32) или асимптотической несмещенности HmM {£/)=(/. (1.33) г-м» Показателем качества алгоритма оценки в этом случае является значе¬ ние смещения ^ = М ф}-и. (1.34) 1 В дальнейшем при использовании оператора М{ ) элементы вы- борки, по которым осуществляется усреднение, будут, как это принято в книге, записываться не строчными, а прописными буквами, а .для — строчными. 42
Чем меньше , тем качественнее" алгоритм, а = 0 соответствует оптимальному по этому показателю алгоритму.- Принцип состоятельности яг- В качестве оценки О следует выби¬ рать состоятельнуюоценку, которая при неограниченном объеме вы¬ борки (Nt Т) сходится по вероятности к оцениваемой характеристике (параметру) С/. Заметим, что не всякая состоятельная оценка является несмещенной [65]. Однако всякая состоятельная оценка, имеющая асим¬ птотически конечное среднее, будет асимптотически несмещенной [65]. Показателем качества здесь может быть, например, значение объема выборки N, Т, начиная с которого вероятность' заданного отклонения О от U не превышает требуемую величину. Меньший объем выборки соответствует более качественной оценке. Принцип минимума среднего квадрата отклонения (эффективности) я3. Лучшей (более эффективной) считается та оценка, которая имеет меньшее^ значение среднего квадрата уклонения (ошибки, квадратично¬ го риска) 4 = М{(£-[/)2}=^ +<£, (1.35) 2 где op = D {U} — дисперсия оценки V, Показателем качества является значение Д^. Для каждой оцениваемой характеристики или параметра ^ 2 1 U можно попытаться найти нижнюю грань inf Д^. вдоль всех возмож- * 2 ных операторов Оценка JUt для которой достигается Inf , назы- тр U ~ вается эффективной *. Пусть, например, 0 есть неслучайный неизвестный параметр распре¬ деления F(x; 0) случайной величины X и выборка х объема N явля¬ ется независимой. Напомним, что N-мерную плотность или вероятност¬ ную функцию (ряд распределения) выборки называют функцией прав¬ доподобия (ФП) выборки L(xu x2f ..., *лг|0)=Ь(ж|0), где 0— векторный параметр. Для случайных процессов вместо функции правдоподобия вводится функционал правдоподобия [35, 75]. Если для всех 0Ь 02, ..., 0* существуют первые две частные про¬ изводные по 0/, функции £(*|0) и операции дифференцирования и инте-i гриров^ния (суммирования) могут быть переставлены местами, то су¬ ществует фишеровская информационная матрица I* (0) = (1,7 (0); i, /= = 1 уП} выборки *, где* ^ Т /т ™ [д1п£(ЛГ|0)д1п£(ДГ|0Л 1»(в)-м{—щ (1-36) Отметим существование других понятий эффективности и сверх (супер) эффективности [58, 60, 65, 103]. 43
В случае, если 0 =0 — скалярный параметр, информационная матрица вырождается в количество информации Фишера 1л(0), содержащейся в выборке объема N, которое равно [65] (137) Для независимой выборки 1лг0 = ЛПДО), 1^(0) = Wl,(0)f где' Л. (0) и 11 (в) — информационная матрица и количество информации, приходящиеся на одно'наблюдение (на один элемент выборки). Пусть О есть оценка некоторой функции t/(0) скалярного пара¬ метра 0 распределения случайной величины . X. При довольно общих условиях регулярности [58, 65, 71, 103, 104, 116] выполняется неравен¬ ство Крамера — Рао 4 > 4+[и'(9) + 4 Wl’a'/W») - ■4 (8). (1-38) где W (6) = dU (0)/d0, (в) = dz# / М. Если (/(0)=0, т. е. О есть оценка самого параметра 0, то в (1.38) необходимо положить очевидное (/'(0)=1. Заметим, что неравенство (1:38) учитывает только члены порядка 1 /N. Можно получить более точные границы для ^ [58, 103]. Величина Д|<(?) называется мини- .мальной границей среднего квадрата ошибки (МГСКО). В [103] пока¬ зано, что. если_в (1.38) имеет место равенство (подобные МГСКО-оцен- ки называются в [403, 116] эффективными), то О является несмещен¬ ной оценкой U (0) и, следовательно, подобные оценки совпадают с оценками по методу минимальной границы дисперсии (МГД) (см. сле¬ дующий принцип). С другой стороны, если равенство в, (1.38) имеет место, J. е. МГСКО и МГД-оценки существуют,, то существует сме¬ щенная оценка более точная, чем МГСКО (или МГД)-оценка, в смысле меньшего значения Д{/2(0). Так, если ^.(9)^5—(/(9) в точке истин¬ ного значения. 0о параметра 0, то такие смещенные оценки могут йметь существенно меньший средний квадрат ошибки Д^(9о)»^чем несмещен¬ ные МГСКО-МГД-оцеики. Для оценки (7(0) скалярной функции (7(0) векторного параметра 9={0Ь 02> . 0Й} неравенство Крамера —Рао имеет вид к к (в)+е<г(в» дiu,(Q)+^m ь »,—13 "*»• (1.39) 1 /=1 где \Jjl —элементы'матрицы, обратной 1^(0). 44
Часто рассматриваются оценки случайных параметров А = (Аь А2, ..А*} с плотностью распределения WА (0). В этом“случае в фор¬ мулах (1.36) — (1.39) щ им подобных используется дополнительное усреднение по плотности (0), т. е. вместо 1*/(0), 1лг(0) и используется M{I*/(A)}, М{1л^(А)}, М{ес/'(А)}. В [58, 103, 118] дано обобщение неравенства Крамера — Рао на векторный случай, т. е. для U={U'1, fj*, :.., (Тг}. Если выполняются необходимые условия регулярности [58, 103], то для любой переменной |={1ь Ы для ^-оценок (0lf 02, • ••» 9ft) fc-мерного векторного параметра 0 имеем |TR^ 1лг(в)^1. (>-40) где R-. = М{(0 —0) (§т—0Т)}—корреляционная матрица оценки, а 0 матрица, обратная квадратной4 матрице т^ с элементом msp(Q) = 0 WS(0) = M (?5}, s, /? = TTk. в [781 приведены подобные не¬ равенства для других показателей, используемых в статистике, а- в [8] дан обзор по неравенствам типа Крамера — Рао. Полезным является также неравенство A0rRflA0 ^ тг (А0Т [I (0)] 1 АО)—1, где А0 == 0^ 0. N Принцип минимума дисперсии или объема эллипсоида-рассеяния я^. В тех-случаях, когда смещение известно, его можно учесть в ре¬ зультатах измерений. В некоторых приложениях значение вр может не влиять ни результат решения той задачи, где О используется как вспомогательная характеристика. В этих случаях необходимо выбирать 2 такбй оператор Ч'у, который обеспечивает минимум дисперсии Для несмещенных оценок это эквивалентно минимуму . Для векторных параметров рассматривается минимум объема эллипсоида рассеяния. Можно попытаться найти нижнюю грань дисперсии. и соответствующий ей оператор Ч*1. В качестве ориентира можно вос¬ пользоваться неравенствами типа Крамера — Рао. Пусть О есть несме¬ щенная оценка некоторой функции £/(0)ч от скалярного \ параметра 0 распределения случайной величины X. Для нее при выполнении усло¬ вий регулярности из (1.38) имеем ^>[у#(в)1а/м<>)=4*- (М») 45
Из сопоставления" (1.41) с (1.38) с учетом (1.35) легко увидеть, / » » 9 что могут существовать смещенные оценки се^ — и в точке истин¬ ного значения 0=0О, дисперсии которых значительно меньше, диеперсий несмещенных оценок. Вопросы конструирования таких оценок рассмот¬ рены, например, в [7, 22, 24]. Существуют также нелинейные смещен¬ ные оценки, равномерно лучшие по среднему квадрату ошибки, чем не¬ смещенные. Если U есть несмещенная оценка функции С/(0Ь 02, Qk) = U(Q) векторного параметра 0, то (1.39) преобразуется к виду ,2 dU(9) 2 i=i /=i При оценивании случайного параметра А в (1.41), (1.42) необхо¬ димо заменить ^'(0), I//(0) и 1#(0) на M{t/'(A)}, М{!лг(А)} » М{1*(А)} соответственно [75, 126]. При оценивании векторного пара¬ метра минимальным граничным эллипсоидом рассеяния оценок будет эллипсоид [58, 118] (0-0)Т|дг(е)(0_(Г) = * + 2. / (1.43) Заметим, что если условия регулярности, приводящие к неравенству 2 Крамера — Рао, не выполнены, минимальное значение дисперсии может быть как больше, так и меньше нижней границы получаю¬ щейся при формальном применении этого неравенства [58, 65]. Более того, могут существовать сверхэффективные оценки, дисперсии которых зависят не от величины порядка ЛМ, а от величины порядка N~2 [58, 65, 71, 89]. Оценка t/*, дисперсия которой при всех в равна минималь¬ ной границе a^f называется МГД-оценкой [65]. Если условия, при которых существует МГД-оценка, не выполняются, то может сущест¬ вовать оценка, которая будет равномерно по 0 иметь дисперсию, мень¬ шую дисперсии любой другой оценки (по значению большую или мень¬ шую а2с/*). Такая оценка дает равномерно минимально достижимую дисперсию, т. е. info^, и называется МД-оценкой [65]. В многомер- чг и ном случае рассматривается оценка 0 векторного параметра 0, имею¬ щая минимальную обобщенную дисперсиюр* минимальный объем эллип¬ соида рассеяния, т. е. оценка, эллипсоид рассеяния которой лежит внутри эллипсоида рассеяния любой другой оценки 0 [71]. Такую оцен¬ ку будем называть МЭР-оценйрй. Сверхэффективную оценку назовем, СЭ-оценкой. Показателем качества оценки 0 является значение дисперсии оцен¬ ки D{0}, обобщенной дисперсии Д {0} = D (0J ... D{0^} ||р^]| или 0 46
Объема эллййбойда рйссеЯййя-либо значение М, при котором обеспечи¬ вается требование к дисперсиям, к объему эллипсоида. Относительным показателем качества несмещенной оценки О является мера ееч эффек¬ тивности eff (U) = Inf /о^ , (1.44) например (^) = °и*/0^ • (* *45) Для векторных параметров коэффициент совместной эффективности, определяется аналогично (1.44), (1.45) с заменой обычной дисперсии D{£?) на обобщенные дисперсии Д{0} или, что то же самое, на объем чэллипсоидов рассеяния [71].. Использование inf D {t/}, inffl {С/}или минимального значения объ- V V ема эллипсоида рассеяния позволяет определить потенциально достижи¬ мую точность [75, 131, 135] измерений в смысле данных составляющих статистических погрешностей. Принцип минимума ширины доверительных, толерантных и тому подобных интервалов л*. Показателем качества таких оценок является значение ширины интервала. По этому принципу обычно конструируют^- ся интервальные оценки. Принцип минимума меры близости, Яб. Показателем качества явля¬ ется значение меры, близости (например, типа приведенных в [43, 97, 120]) оценки и измеряемой характеристики. Принцип извлечения максимума информации, содержащейся в вы¬ борке, я7. Выбираются такие оценки 0У которые содержат в себе ма¬ ксимум информации, имеющейся в выборке об измеряемой характери¬ стике U. Показателем качества оценки является значение разности информаций, содержащихся в оценке и в выборке. Принцип минимума потерь от использования оценки и проблемной ориентации Яз. Выбирается оценка, дающая меньшие потери, если вме¬ сто истинного значения U принимаем О. Показателем качества могут быть абсолютные или отнесенные к наилучшей оценке значения средних потерь байесовского типа, различные показатели качества решения и потерь от неверного решения той задачи, где используется оценка. Принцип асимптотической опрёделенндсти я9, согласно которому асимптотические (при неограниченном увеличении объема выборки) свойства оценок должны быть четко определенными, что обеспечивает метрологическую определенность измерения характеристик. Асимптоти¬ ческая определенность может сводиться, например, к асимптотической нормальности оценок, их несмещенности, эффективности (в соответст¬ вующем смысле) и т. д. Принцип инвариантности по наблюдениям Яю и по измеряемой ха¬ рактеристике Яц. Оценка О характеристики U случайного элемента Ж 4F
называется инвариантной по наблюдением, если для любого взаимно однозначного отображения /(£) имеет место равенство #(*) = #[/;(*)]. Оценка О 'характеристики (параметра) V обладает свойством, инвари¬ антности по измеряемой характеристике £/, если для произвольной одно¬ значно определенной функции f выражение [(О) есть оценка длn^f(U) той же структуры, того же типа, что и оценка О. Принцип устойчивости и корректности П\г. Оценка С (ее значения >и свойства) должна быть мало критичной к отклонениям условий ее нахождения от номинальных (вида вероятностной модели, наличия по¬ мех и т. д.). Небольшие отклонения условий не должны приводить к большим отклонениям значений оценок, ее точностных показателей. Показателем качества оценок по данному признаку может быть абсо¬ лютное или относительное значение меры разброса смещений и диспер¬ сий оценок при переходе от одной модели к другой в заданном классе моделей или вдоль всевозможных моделей. Принцип минимума необходимой априорной информации Я|з. Луч¬ шей считается та оценка, которая при прочих равных или сходных усло¬ виях требует меньше априорных данйых. Из других принципов отметим принцип простоты вычислений (реа¬ лизации) Ян [118],. принцип адаптируемости к априорным, и исходным данным Я]5 [68, 132], принцип транзитивности Я|в [89] — независимо¬ сти результатов оценивания от способа разбиения алгоритмов на-части (например, разбиения совокупности уравнений, образующих фундамен¬ тальную систему, на подгруппы), принцип самообучения, самоорганиза¬ ции Я17 [112, 132] и принцип универсальности яи, пригодности для оценивания различных характеристик случайных элементов одного1 типа и (или) одинаковых характеристик разнотипных случайных элементов (величин, векторов, функций). ~ Поставив в соответствие каждому принципу показатель (крите¬ рий) качества оценки, можно на основе векторного, многокритериаль¬ ного синтеза построить оценки, наилучшиё (оптимальные) в смысле соответствующей совокупности таких критериев. Наоборот, рассматри¬ вая конкретные оценки, можно проанализировать их качество по тем или иным критериям. Обратим внимание читателя на взаимосвязь и противоречивость некоторых приведенных принципов: стремление, вы¬ полнить " один принцип противоречит возможности выполнить другой. Этот факт необходимо учитывать при векторном синтезе алгоритмов оценивания. Например, как указывалось, выполнение принципа несме¬ щенности Я! может противоречить выполнению принципа минимума дисперсии я4 или среднего квадрата ошибки Яз> выполнение принципа минимума дисперсии я4 или среднего квадрата ошибки Яз для данной .модели может противоречить принципу устойчивости я 12 и принципам инвариантности яю, Яп и т. д. Кроме того, выполнение некоторых прин¬ ципов' может оказаться принципиально невозможным. Например, могут не существовать МГД-оценки или асимптотически определенные оцен- 48
Таблица 1.5 Типовые принципы и соответствующие им показатели качества, используемые при построении оценок характеристик случайных элементов "
s о . * „5 to й ч a II I оь g R 0 CO я X В « Оф <u 2 1 Ш « * з ss м 5 s| / N to ’S' V/ , и ■fe ■* > to to с E '© I Jl S4 S4 to <5! ^ a X! CO E О to to to to * V/ to" to Г S' E II <s II (to to- v* to с S II to to X а 0 « A 4 H ^ CO 1 V/ to О to •S' to to II <to to 5? II to с to <N (1Э •5Ш |M N to <1 o,??, gUJ .0* Is + OJ to <1 0,7?. glD to 4 «j о KB о «в? V « 0 5 в 2 «2 & ® gs f§ 6s 2*b s H _ о S 2чз h W ^ 2 я s XO о о В s \o a * S. a> fig *1 o, н § g о £ a A i„ •S JQ О P 4 О I li H H о о >> a> Л * i5 50
ки, может быть не разработан аппарат построение инвариантных оце¬ нок тех или иных характеристик и' параметров. Все эти факторы не¬ обходимо учитывать при выборе принципов-для конструирования оце¬ нок и при выборе показателей качества алгоритмов оценивания. Для удобства некоторые принципы представлены в табл. 1.5. Используемые в работе показатели качества оценок. -Как уже не¬ однократно указывалось, выбор показателей качества зависит от при¬ ложений результатов измерения, т. е. от конечной задачи, которую над¬ лежит решить на основу найденных оценок. В связи с этим, поскольку конкретные приложения в данной работе не рассматриваются, будем учитывать прежде всего принципы, которые позволяют выбрать в каче¬ стве рабочего инструмента такие метрологические показатели качества алгоритмов оценивания, которые, во-первых, встречаются наиболее ча¬ сто в приложениях, т. е. являются типичными, вотвторых, сравнитель¬ но легко пересчитываются в показатели качества конечного результата исследования физического объекта, в-третьих, допускают сравнительно простую аппаратную и программную реализацию при их эксперимен¬ тальном нахождении (см. принцип метрологической обеспеченности П11). Такими показателями являются прежде всего локальные показа¬ тели вида:- смещение = е {Q*(О)}, дисперсия D^(ft)=[D {Q (О)} или сред¬ нее квадратическое отклонение и корреляция ч(д1} flg) = = cor{(f(fl1)> Ф(02)} оценки ^(Ф), а также нижеследующие произ¬ водные от них и сходные с ними показатели. Допустим, что измерению подлежат значения характеристики (пара¬ метра) Q(fl) в определяемом приложениями диапазоне изменения аргу¬ мента |/0н, Ов]. Обычно граничные значения диапазона Фн и б'в опре¬ деляются из условий вида I Q (# < Ъп)\ < max | Q (О) | , О IQ<*><>B)l<Siniax|Q(<>)|, v (1.46) J Q<*)<»>(l-b) {Q(«)dd, (.1.47) ГД® £г> £з — заданные положительные константы, имеющие неболь¬ шие значения, например 0,01 или 0,05. В приложениях наибольший интерес представляют не абсолютные значения локальных показателей, а нормированные относительные или приведенные. Относительные локальные показатели имеют вид V(d) =1 111 м I • ' (1 -48) 4* 51
^(*) = *§{*)П М {${*)} | (1.49) в предположении, что Из приведенных показателей -рассматриваются чаще всего показа¬ тели вида смещений и. среднеквадратических отклонений, приведенных либо к максимальному (или минимальному) значению при #ъ] математического ожидания оценки О (fl), т. е. >ЫО) = ^(#)/niax | М {£($)} | , (1,50) Q Q # М*) = <^(*)/тах | М {QW} | , (1.51) ч р либо к потенциально .достижимому в' данных условиях значению рас¬ сматриваемого показателя. Примером подобного приведенного показа¬ теля является коэффициент эффективности оценки (1.44), (1.45). Помимо рассмотренных в теории и приложениях широко исполь¬ зуются следующие локальные .(Л) и глобальные (Д, V» V) показатели: Д,(0)=М{|Е,(*)|}. Д/+з(«)=М{Е,Ч#)>, I = ГЗ? (1.52> Л* = <[ДИ%>. Vft = supAft(«), k =ТГб; (1.53) ; v V/ =Msup-| Et (Ъ) I , /=1“7з, (1.54) <► где Ег(0) = Q (О) — Q (О), Е2(#)=ЕiWIQ(4), Е3(0) = = Е'Х (О)/1/0(0); (1.55) Д4 (О) = (О) + ар (О) = Дq (О) 'есть средний квадрат отклонения оценки ф4(О). Именно данные показатели мы и будем использовать в дальней¬ шем, отдавая предпочтение простейшим из них: смещению e^s(O), дисперсии D {$(0)} и корреляции (Ох> 02). Г лава вторая Типовые параметрические и непараметрические алгоритмы 2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Как отмечено в [9], хотя многие статистики предпочитают, поль¬ зоваться интервальными оценками, не определяя точечных оценок и их дисперсий, для задач, решаемых учеными и % инженерами, наилучщиад 52
образом подходят точечные оценки вместе с мерами их4 надежности. Это хорошо подтверждается обзором монографий и статей в различных областях приложенийвероятностно-статистических методов. В данной книге рассматриваются только точечные оценки (см. признак' 6.1 в табл. 1.3). Прежде всего отметим принципиальную разницу между параметри¬ ческими и непараметрическими алгоритмами. Параметрические алгорит¬ мы предполагают известными функциональный* вид измеряемых (оце¬ ниваемых) характеристик (параметрических семейств характеристик). Измерение функциональных характеристик в этом случае может осу¬ ществляться двояко. В-первом варианте параметрическое оценивание характеристик; выполняется в два этапа. Вначале по выборке находят¬ ся оценки параметров базовых функциональных характеристик. Затем определяются необходимые значения исследуемых характеристик при требуемых значениях их аргументов по известной функциональной за¬ висимости значений характеристик от аргументов и параметров заменой параметров их оценками. При втором варианте характеристики оцени-* ваются непосредственно по выборке с учетом функциональной форхмы базовых характеристик. Непараметрические алгоритмы являются сво¬ бодными от функционального вида характеристики, гинвариантными к нему (например, свободными от распределений). Любопытно:отме¬ тить, что непараметрические алгоритмы могут использоваться для изме¬ рения не только функциональных характеристик, но и .их параметров, если параметры представляют собой известные функционалы от не¬ известных- .характеристик [58, 120]. Так, например, можно оценивать параметр сдвига всех симметричных распределений, если -определить его через медиану. Заметим, что в отличие от термина «параметр», используемого некоторыми авторами, всюду в книге слово «параметр» используется только в смысле* единичного или конечного множества ве¬ личин, входящих либо в аналитическое выражениё функциональной ха-, рактеристики (и определяющих семейство характеристик, их форму, сдвиг и. масштаб), либо в оператор, если, вероятностная модель задана в операторной форме. Например, в [120] под параметром понимается всякий функционал от распределения (мы его называем числовой ха¬ рактеристикой). ' Деление методов на параметрические и непараметрические услов¬ но. Многие характеристики при достаточно’ общих условиях могут быть представлены в виде ряда по известным ортогональным или неортого¬ нальным базисным функциям, в виде смесей и т. д., т. е. аналитически в виде'заданных функций от аргумента и счетного (а в приближенном представлении — конечного) числа параметров — коэффициентов разло¬ жения. Можно найти оценки таких7 коэффициентов разложения и затем вычислить значение характеристики при требуемом значении аргумента. К какому методу оценивания отнести такой метод — к параметрическо¬ му или к непараметрическому? Ответ на данный вопрос зависит or 53
того, в какой мере- при оценивании коэффициентов-параметров исполь¬ зуется конкретный ,;вид модели и оцениваемой характеристики. Напри¬ мер, при представлении плотности распределения конечными ортого¬ нальными рядами можно формально воспользоваться оцениванием ко¬ эффициентов-параметров параметрическими методами максимального правдоподобия, минимума X2 и т* Д-> а также «непараметрическим» ме¬ тодом ортогонального разложения (см. § 2.3), который не учитывает конкретного вида плотности распределения, модели. ^ Часто ставится вопрос: «следует ли в измерительных задачах использовать параметрические алгоритмы?»' Да. Есть круг задач, где их использование предпочтительнее. Это, например, оценивание при ве¬ роятностном подходе к описанию объектов, Ьценивание в задачах ими¬ тации, моделирования и идентификации п{)и известных моделях, сме¬ шанное оценивание (см.. § 2.4), выявление потенциальной точности н т. д. Аргументированные ответы на данный вопрос могут быть полу¬ чены из результатов, приводимых в следующих параграфах книги. Конкретные алгоритмы параметрического оценивания зависят от вида функциональной характеристики или оператора вероятностной мо¬ дели и используемого при этом метода оценивания. В связи с этим кон¬ кретные алгоритмы будут рассмотрены в последующих главах в при¬ ложении к конкретным характеристикам и моделям. Здесь же остано¬ вимся на некоторых основных, наиболее часто используемых (типовых) методах параметрического оценивания. В связи с тем что в большин¬ стве случаев оценивание параметров., случайных элементов, заданных в‘ операторной форме, сводится к оцениванию параметров характери¬ стик, соответствующих этой операторной форме, в данном параграфе рассмотрим в основном только оценивание параметров характеристик моделей. Пусть известны аналитические выражения некоторой совокупности характеристик Qi, Q2, случайного элемента £ (величины, векто¬ ра, функции), зависящие от параметра 0={0i, 02, 0*},. В первом варианте параметрические алгоритмы измерения >Qi, ..., Qs < сводятся к измерению параметра 0 и ^определению значений характеристик Qu •Qs. для интересующих экспериментатора значений аргументов этих характеристик с подстановкой в Q (fl, 0) вместо неизвестного зна¬ чения 0О результата его измерения 0. Возможны «универсальные» и специализированные процедуры на- хождения 0. В «универсальных» процедурах 0 - находится как оценка параметра 0 некоторой «универсальной» (базовой) характеристики Qr, через которую однозначно определяются все остальные характеристики Qpt р=1, s, рфг. При измерении вероятностных функциональных и чис¬ ловых характеристик в качестве Qr чаще всего используется функция или плотность распределения вероятностей, при корреляционно-спек¬ тральном анализе — спектральная плотность мощности пли корреляци- 54
Оййая функций, при" рёг{>есбйбйн6м йналйзё — услбвнбё матёМатийёекбё ожидание и т. п. В случае специализированных процедур алгоритмы на¬ хождения ^ специфичны для каждой характеристики Qpt p=l,s, или для некоторой их совокупности ъ выбираются из условия наилучших метрологических и прочих показателей качества измерения именно ха¬ рактеристики Qp, у p=f 1, s. Заметим, что если даже по метрологическим показателям эти два случая могут привести к одинаковым результатам, то ’в конкретных, ситуациях они могут отличаться другими показателями качества. Так, при многофункциональном анализе с точки зрения общих затрат на измерение всех характеристик чаще всего, по-видимому, предпочтитель- нее будет вариант универсальных оценок 0. Например, если найти 0 как достаточные оценки параметров плотности распределения, то, вос¬ пользовавшись соответствующими таблицами [43], можно найти по измеренным значениям S' значения любых других характеристик, свя¬ занных с распределением. Такой вариант построения многофункциональ¬ ных средств статистических измерений и анализа будет подробно рас¬ смотрен ниже. При второ^ варианте параметрического оценивания каждая харак¬ теристика оценивается по своему алгоритму непосредственно по вы¬ борке. - Все методы нахождения оценок 0 параметров 0 можно разбить на две группы [118]: явно и неявно определенных оценок. Явно опреде¬ ленные оценки образуется следующим образой; По одной или несколь¬ ким характеристикам Qr(ft, 0), ге{ 1, 2, ..., s} определяются их функ: ционалы Ui=<[fr(ft)Q(ftt 0)] />, *= l,k9 допускающие приемлемые по требуемым показателям качества непараметрические оценки. Для каж¬ дого конкретного вида характеристики Qr эти функционалы будут впол¬ не определенными функциями параметра©, т. е..£/j=t/,(0), *=1,£. По¬ этому, решая систему -уравнений такие что 0<(£/i(0o), Щво), .... *М0о))=0/о. Теперь, подставляя в (2.1) вместо -Ui их непараметрические оценки £?*, зависящие только о,£/элементов выборки х, поручаем явно опреде¬ ленные оценки 0* параметров 0*, т! е. £/|(0)=«/, можно найти явные и неявные обратные функции 0i=0<(£/b • ••» Uh)f \fc-l, k, (2.2) (2.1) Tf = e,(^, Оя,..., (4)=чу*)- -(2.3) 55
В неявно определенных оценкёх функции /|(д) заменяются на такие функции /Дд, 0), 1=Т7^кЧто Щ №) = <lfi (<►. в0) Q (О, 0о)]д> = О, l =Tk. Тогда оценка (Г определяется как решение системы уравнений C/i(0)= 0, i=-hk. (2.4) Трудность в использовании метода неявных оценок связана с тем, что уравнение (2.4) может иметь несколько решений. Поэтому жела¬ тельно, чтобы ^функции £/Д0) имели только по одному нулю. На практи¬ ке чаще всего уравнения (2.4) конструируют, .накладывая условия ми¬ нимума или максимума на некоторую другую функцию <рДй, 0), свя¬ занную с /Д#,0) соотношениями fl (О, 0) = — п (О, 0), / = 1Г£. (2.5) К методам явных оценок относятся, например, метод числовых ха¬ рактеристик и метод значений характеристик. К неявным относится ме¬ тод максимального правдоподобия, наименьших квадратов, минимума X2 и т. д. Обратим, внимание на следующие два обстоятельства: Л) при использовании параметрических методов оценивания всегда необходимо либо учитывать параметры сдвига и масштаба (там, где они имеют- смысл), либо так преобразовывать выборку, чтобы она соответстврвала стандартной форме исследуемой характеристики Q,- т. е. нулевому зна¬ чению параметра ^сдвига и единичному значению параметра масштаба; 2) функционалы* U\% ..., Uh* следует выбирать так, чтобы, во-первых, их оценки находились как можно ^точнее и проще, во-вторых, чтобы однозначно и как можно точнее и проще можно было выполнять пре¬ образования по "формулам (2.2), (2.4). Заметим, что всякие упрощения должны быть такими, чтобы возникающая, при этом потеря точности результата была допустимой. Теперь перейдем, к рассмотрению основных методов оценивания па¬ раметров характеристик, т. е.' правил получения операторов преобразо¬ вания Фу при оценивании параметров характеристик. 2.2.. ПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ' Метод числовых характеристик (ЧХ-оценивание). Это метод явно определенных оценок, в котором Ui9 i=l9k9 представляют собой числовые характеристики [43] неко¬ торой функциональной характеристики Qr или совокупно¬ сти характеристик Q. Чаще всего Ui представляют собой либо начальные и (или) центральные моменты распреде^ 56 -
ления [115, 144] или спектров (метод моментов, м-оцени- вание) 1, либо квантили (метод квантилей, К-оценивание). Примеры связи моментов с параметрами распределений, т. е. зависимостей £/<-(6) для м-оценок параметров распре¬ делений, даны в [18, 35, 43] и др. Примеры формул для К-оценивания параметров одномерных распределений мо¬ гут быть. получены -из таблиц работ [35, 43] решением уравнений F(xpi)=p{, где pt — фиксированные .вероятности. Аналогичные формулы для многомерных распределений могут быть получены либо по многомерным характеристи¬ кам, либо по одномерным и условным. . Область применения ЧХ-оценок. ограничивается теми моделями, для которых существуют требуемые для этого числовые характеристики £/,-. Если оценки £7,- являются со¬ стоятельными и преобразование (2.3) взаимно однознач¬ но, то 0* будут состоятельными и асимптотически несме¬ щенными оценками. Однако чаще всего м- -и К-оценци не являются эффективными, имеют значения показателей эффективности (1.44), (1.45), близкие к нулю (см. гл.' 4). Несомненным достоинством м-оценок является то, что на этапе нахождения непарамётрических оценок моментов обработка элементов выборок, объем которых зачастую является очень болыцим, осуществляется, как правило, по простым алгоритмам (см. глТ 7), пригодным для различ¬ ных величин, векторов и функций, допускающих м-оцени- вание. Метод значений характеристики (ЗХ-оценивание). Суть метода сводится к использованию в. качестве харак¬ теристик Ui k значений характеристики-Qr или совокуп¬ ности характеристик Q, найденных при разных значениях ffi,-i==\,k, аргумента Ф [46, 117]. В/качестве таких зна¬ чений могут использоваться экстремальные, нулевые, рав¬ ноотстоящие вдоль аргумента <► и тому подобные значе¬ ния. Функция (O’) при этом равна б (б'—<К)> г=1,£ Если число значений оценки <3 (О)' характеристики Q (б) превы¬ шает число оцениваемых параметров, поиск оценок пара¬ метров осуществляется на основе минимизации некоторой меры близости междуиЗ (вт) и Q(fh, 0) вдоль всех i=\,k (см. далее метод минимума меры близости). Метод достаточных статистик (Д-оценивание). Дан¬ ный метод реализует принцип я7 и довольно хорошо опи¬ 1 Чтобы отличить от робастных М-оценок, оценивание по методу моментов будем обозначать строчной буквой м, 67
сан в приложении к оценкам параметров распределений (см., например, [58, 120, 126]). Говорят, что векторная статистика U — O'(х) достаточна для U, если она содер¬ жит в себе столько информации (по Фишеру) об U , сколь¬ ко её содержится в первоначальных данных, т. е. в вы¬ борке %. В терминах распределений это означает, что ус¬ ловное распределение выборки nW (х | U) не зависит от U. Легко доказать, что если U является достаточной статис- тикой для U , то любая строго монотонная функция f (U) также будет достаточной статистикой для U, а также для f(U) (см. принцип яц). В частности, достаточными ста¬ тистиками неизвестных параметров распределения явля¬ ются вся выборка, т. е. x={xi, X2,...,xn}, и (или) соот¬ ветствующий ей вариационный ряд (ДС) = {х(о,.. .,Х(лг)). Такие статистики называются тривиальными [58] Г Суще¬ ствуют ли для неизвестных параметров данного распре¬ деления достаточные, статистики, отличные от тривиаль¬ ных? Ответ на этот вопрос дается факторизационной тео¬ ремой Неймана—'Фишера, согласно которой функция правдоподобия такого распределения должна быть пред¬ ставима в виде произведения измеримых неотрицательных функций: L(x\e)^g(0,Q)h(x), (2.6) Ч где h (х) не зависит от 0, a g (U, 0) зависит от элементов выборки лс; только через достаточную статистику /S /N /N = t/g}. Отсюда, например, следует, что если 0О— некоторое фиксированное значение параметра 0; то отно¬ шение правдоподобия* l(x \ .B)=L(x | Q)/L(x | 0О) (2.7) будет достаточной статистикой для 0. f Тривиальные достаточные статистики мало полезны в качестве оценок' параметров 0. Векторная достаточная ,—Ч /~Ч статистика U = {U1, U2,..., Us}, т. е. набор статистик Ои ч.., Os, будет .полезна как Ьцёнка V лишь в случа(е, когда она приводит к сокращению объема эксперимен¬ тальных данных, т. е. когда вместо всей выборки % мож¬ но будет использовать только s функций от элементов выборки, являющихся достаточными статистиками. Пусть U есть параметр 0 размерности k функции Q (ft, 0 ). §8
Возникает вопрос, можно ли при N^k и N^s найти s совместно достаточных для 0={0i,..., 0*} статистик по выборке объема N, когда s-<k, s=k или s>k и s не за¬ висит от N. В ряде случаев ответ на данный вопрос по¬ ложительный. Набор совместно достаточных статистик, имеющих наименьшее s, называется минимально доста¬ точным. В частности, если 0 есть параметр одномерного распределения, то класс распределений, для которых су¬ ществует набор минимально достаточных статистик при s=k, совпадает с классом экспоненциальных распределе¬ ний Дармуа-Купмена [9, 60, 65, 118]. При этом набор ста¬ тистик н и,= •(*<). /=*71; (2.8) <=1 является одним из возможных наборов k совместно до¬ статочных статистик для 0={0ь, 0*} [65, 118]. Анало¬ гичный вид имеет -подобное условие для дискретных рас¬ пределений [55]. Из последних результатов следуют два вывода. Во-пер¬ вых, класс распределений, допускающих существование минимально достаточных статистик, не зависящих Ьт ко¬ личества наблюдений, сильно ограничен. Так, для распре¬ деления типа смеси, £Г-распределения [43], распределения Лапласа с неизвестным параметром сдвига, для некоторых распределений Пирсона и т. п. единственными достаточ¬ ными статистиками являются тривиальные [58]. Правда, если некоторые параметры распределений фиксированы или отсутствуют, то могут существовать нетривиальные статистики (например, для гамма-распределения, распреде¬ ления Вейбулла и экспоненциальных распределений как частных случаев ^"-распределения). Во-вторых, мы приходим к распределению Дармуа— Купмена, если (а) : s=k\ (б): область задания X случай¬ ной- величины X не зависит от неизвестных параметров и (в): плотность допускает дифференцируемость по неизве¬ стным параметрам. Означает ли это, что если данные усло¬ вия не выполняются, то/распределения не допускают до¬ статочных статистик, кроме тривиальных? Вовсе нет. Так, Дармуа было показано, что если распределение не имеет единственной статистики для одномерного параметра 0, но для него выполняются условия (б), (в), то оно может иметь k деетаточных статистик, содержащих всю инфор¬ мацию о параметре. Класс таких распределений аналоги¬ чен классу распределений Дармуа — Купмена с заменой 59
векторнбко параметра 0 на скалярный 6 [55]. Если же Ш выполняются условия (б); (в), то также могут быть не тривиальные достаточные^ статистики [58]. Однако прг этом не обязательно s=k. Заметим, что если X зависит от неизвестных параметров, то такие модели называют се- лекционными [58]. -Поскольку, как указывалось, достаточными статисти: ками помимо U являются любые строго монотонные функ¬ ции f(O), в пределах выполнения признака Я7 остается открытым вопрос, какую из этих статистик взять в каче¬ стве оценки U: Для ответа на этот вопрос необходимо при¬ влечь дополнительные признаки, о чем пойдет речь далее. Метод максимального правдоподобия (МП-оценива- ние). Метод широко описан и состоит в том, что в каче¬ стве оценки параметра распределения 0 принимается то значение 0, при котором функция правдоподобия достига¬ ет наибольшего возможного значения. Обычно МП-оценка 0 находится, как корень системы уравнений правдоподобия —1пХ.(лг | 0) = О, i = (2.9] соответствующий абсолютному максимуму (или супреМу- му), т. е. максимуму максиморуму функции правдоподо¬ бия. Интерес, который привлекают к себе МП-оценки, обу¬ словлен рядом обстоятельств. Среди них следующие; 1. Если ^-параметрическое распределение (одномерное или многомерное) допускает k совместных минимально до¬ статочных статистик, т. е. является распределением класса Дармуа — Купмена, то. уравнение (2.9) имеет, единствен¬ ное решение, корни которого (МП-оценки) являются функ¬ циями совместно достаточных статистик (выполняется Принцип я7). Но если для k параметров 0'существует цф ФИ достаточных статистик и функция правдоподобия имеет более одного максимума, то решение ищется по мак¬ симуму максиморуму и МП-оценки могут не составлять достаточную систему [64] и не являться функциями ми¬ нимально достаточных статистик [58]. 2. При довольно общих условиях регулярности, наибо¬ лее важным из которых является независимость области определения X от неизвестных параметров 01,,.., 0*, МП- оценки (не обязательно достаточные) параметров 0 состо¬ ятельны, асимптотически' не смещены и имеют асимптоти¬ чески й-мерное^нормальное распределение с корреляцион¬ но
ной матрицей 1^-1 (в), обратной информационной In ФУ- Следовательно, для таких оценок' асимптотически выпол¬ няются принципы — я4, Я9- Если условия регулярности не выполняются, МП-оценки могут быть несостоятельными [58]. 3. МП-оценки удовлетворяют принципу инвариантностй. Яц. Если 0 -есть МП-оценка 0, то ф(0)—МП-оценка для <р(0) при любой функции ф(0), не обязательно взаимно однозначной. Любопытно, 5что поскольку в общем виде M{f(S)}^f(М{$}), (2.Ю) из несмещенности МП-оценки 0^ параметра 0 не следует несмещенность МП-оценки ф(0) функции ф(0). Обратим внимание на то, чта вопреки широко распро¬ страненному утверждению МП-оценивание является хоро¬ шей. процедурой не всегда и не должно применяться дог¬ матически. Бывают ситуации, особенно при малых N, ког¬ да МП-оценки не столь эффективны, как оценки других типов (см. [58, 60, 89, 120] и гл. 4). В частности, в ряде случаев смещённые МП-оценки должны уступать место несмещенным [81]. Методы минимальных дисперсий (МГД-, МД-, МЭР- и СЭ- оценивание) и минимума среднего квадрата ошибки (МСК-оценки). Данная группа методов основана на по¬ лучении оценок, удовлетворяющих принципу Я4 —миниму¬ му дисперсии (МГД-, МД-оценивание) или объема эллип¬ соида рассеяния (МЭР-оценивание) —или принципу я3—минимуму СКО, а-также на получении сверхэффек- тивных оценок (СЭ-оценок) [58, 60]). В приложении к- распределениям показано, что МГД-оценки существуют только для распределений Дармуа — Купмена и даются достаточными МП-оценками, т. е., если МГД-оценка суще¬ ствует, то она. является МП-оценКой, в то время как об¬ ратное утверждение, вообще говоря, неверно. Эффектив¬ ные оценки обязательно принадлежат''к классу достаточ¬ ных оценок, в то время как достаточная оценка не обязательно будет эффективной. Если МГД-оценки не существуют, то можно попытатВся найти МД- или МЭР- оценки. В частности, МД-оценка 0 параметра 0 может быть найдена методом регрессии (условного математиче¬ ского ожидания). Пусть 0i* — достаточная статистика для 0,-а 02* — произвольная несмещенная оценка 0. Тогда со¬ гласно теореме Рао — Блекуэлла — Колмогорова [107, 116, 61
120] в качестве МД-оцёнки (Г параметра 6 следует вы¬ брать f(9i*), где f(y) не. зависит от 0 и определяется ре¬ грессией (2.11) Если существует полная достаточная статистика, то вся¬ кая функция от нее является равномерно наилучшей не¬ смещенной МД-оценкой своего математического ожидания [107, 116]. Это справедливо также для произвольных вы¬ пуклых функций потерь. Если плотность распределения X — разрывная функция, причем расположение точек разрыва зависит от значения определяемого параметра 0, или если используются нере¬ гулярные оценки, для которых зависимость искомой оцен¬ ки от элементов выборки носит разрывный характер, сле¬ дует попытаться найти СЭ-оценки, значение коэффициента эффективности (1.44), (1.45) которых может стремиться к бесконечности при неограниченном увеличении объема выборки [58, 60, 65, 71, 89]. Такие оценки интересны, в частности, для определения 7 потенциальной точности. С рассмотренными оценками тесно связаны оценки, мини¬ мизирующие средний квадрат ошибки (МСК-оценки) [см. принцип ЗТз] . Методы минимума меры близости (ММБ-оценивание), наименьших квадратов (НК-оценивание) и наименьших модулей (НМ-оценивание). Данная группа параметриче¬ ских методов, требует меньше всего априорной информа¬ ции (принцип Я13). Пусть — такой результат i-ro измерения при определении Q (О; 0), что 1 Например, £г(0) есть результат несмещенного измерения Q (#) при известных значениях #=#<. Введем некоторую меру близости d(g, Q) вдоль всех N измерений (см. прин¬ цип Яб) прп одинаковых или разных значениях аргумента О. Тогда в качестве оценки 0 (ММБ-оценки) можно вы¬ брать такое значение 0, при котором мера d(g, Q) прини¬ мает минимальное значение, т. е. [ср. с (2.4) ] 1 Условие (2.12) может не выполняться. В этом случае свойства оценок будут отличаться от приводимых далее. мы#)}=<Э(о,- 0); *= i.tf. #={», М. в = {0, W- (2.12) (2.13) 62
В методе наименьших квадратов в качестве d{g, Q) берется квадратичная форма (при п=1 сумма) взвешен¬ ных квадратов 8i2 невязрк ti=gi—Q i-го измерения, а в ме¬ тоде наименьших модулей— |е*|. Чаще всего НК- и НМ- оценивание применяются для нахождения параметров функций регрессии и процессов типа авторегрессии и скользящего среднего. Пусть ту(х; 0) — линия регрессии вектора (У, Xi Х„), x={xi, хп}, 6={0ь •••» б/,} и Q($; 0)=my(x; 0). Тогда для каждого t-ro измерения при фиксированных значениях *,= {*i, х2 ,xn}i вектора А, т. е. для каждого шУ(дсг; 0), получается некоторое значение yi. В соответствии с методом НК-оценивания обыскивается минимум по 0. квадратичной формы d(у, mY) = [y- mY (х; 0)]т W [у - ту (х; 0)], (2.14) где W={©i/, i, j=l,N}—матрица весов, не зависящая от 0;' Ат — транспонированная матрица А; y,TttY— lV-мерные -векторы-столбцы. Пли в другой форме N 'N d(у, ту) =в S 2 тц [Уг ~ 6)1 \У; — ту{х}\ в)]. (2.15) i=i /=i Если W — диагональная матрица (при необходимости она всегда может быть диагонализирована), то d(y, ту) = 2«в,- [у] - ту(х1\ 0)]*. (2.16) i=i Аналогично при диагональной матрице весов W НМ- оценки 0 находятся из условия минимума по 0: N' d(y, ту) = 2 I У1 — Щ{*Г. б)|. (2.17) i= 1 Если — положительно определенная матрица, мат¬ рица вторых моментов У< остается ограниченной при ЛГ-4-оо и d (у, Му) имеет производные по 0 в области значений 0о, то одно из значений 0, обеспечивающих минимум d(y,mr), является состоятельной оценкой 0о. Важным частным случаём является линейный НК-ме- тод, когда Q(t0; 0) есть линейная функция 0|. Тогда ре¬ зультаты измерений g будут линейными по параметру _0. Например, для линейной по параметрам регрессии будем иметь 9=B6+fe, (2.18) 63
где у — вектор-столбец наблюдений (t/i, ..,*/лг)т; В — мат¬ рица JVx(n+l) известных коэффициентов (i/V>/i); мат¬ рица планирования (заданный набор значений 1* хь... ...,xN, где хг—n-мерный вектор1 значенией пХ) при ак¬ тивном эксперименте или матрица элементов выборки Xi, i=ltN, при пассивном эксперименте; е — JV-мерный вектор-столбец реализаций случайных ошибок (невязок, помех) Ё; 0= (0о,.. ., 0п)т — вектор-столбец. В этом случае НК-оценка определяется как и является единственной, если матрица BTWB не вырож¬ дена. Если известна корреляционная матрица Ry после¬ довательности наблюдений У* (или, что то же самое, оши¬ бок Е, при активном эксперименте) , то матрицу весов W следует выбирать из условия W=Ry-‘. При этом согласно теореме Гаусса — Маркова 0 будет несмещенной МД-оцен- кой (марковской оценкой, или оценкой по обобщенному методу НК), т. е. будет удовлетворять принципам яь яз, Я4. Дисперсии таких оценок равны диагональным элемен¬ там'корреляционной матрицы оценок Однако если в отличие от (2.19) в качестве оценки 0 до¬ пускаются также и нелинейные функции от у, то НК-оцен- ки в общем случае не являются несмещенными МД-оцен- ками. Это зависит от распределения Е/. Если Ё,- распре¬ делены нормально и независимы, то НК-оценки являются несмещенными МД-оценками в классе всех оценок, по¬ скольку Они являются функциями от минимальной систе¬ мы k достаточных статистик для k параметров 0, а также МП-оценками с нормальным распределением [65, 116]. Однако если рассматриваются все возможные распределе¬ ния Е., то НК-оценки очень редко являются МД-оценками в классе всех оценок [65]. Замечательным свойством НК-оценок является их тран¬ зитивность (см. принцип Я1б), что облегчает применение рекуррентных вычислительных процедур [89]. Одними из преимуществ НК- и НМ-оценок являются сравнительная простота и универсальность вычислительных процедур (ПРИНЦИПЫ Я12, Ям, Я15). ^ 0 = (BTWB)-'BTWy (2.19) Rj = (BTR71B)_I. (2.20) 1 i-я вектор-строка матрицы В (1, Х() = (1, Xi,t, x2,i, ..., xn,i). 64
Целесообразность применения в оценивании других мер d{g, Q) типа |gf—Q|р при рф\,~.рф2 обсуждаются в [89,118]. В заключение обратим внимание на необходимость раз¬ личать линейность оценок по отношению к оцениваемым параметрам, обусловленную линейностью модели, и линей¬ ность оценок по отношению к наблюдениям, к элементам| выборки. В последнем случае несмещенные оценки пара¬ метров могут быть весьма неэффективными [9, 58]. При¬ меры, подтверждающие это, будут приведены в следующей главе. Согласно теореме Гаусса — Маркова при независи¬ мых Е, НК-оценки обладают минимальной дисперсией в классе всех несмещенных линейных по у оценок парамет¬ ра 0. Однако в классе всех несмещенных оценок НК-оцен- ка в линейной модели не обладает, вообще'говоря, мини¬ мальной дисперсией [116]. ММБ-оценки при других мерах близости будут рас¬ смотрены далее. Методы асимптотически определенного оценивания (принцип яэ). Чаще всего эти методы сводятся к метог дам наилучших* асимптотически нормальных оценок (НАН-оценивание). Эти методы включают в себя МП-оце- ниванйе, методы минимума %2 . (МХК-оцени- вание), минимума хи-квадрат модифицированные (ММХК-оценивание),_ минимума расстояния Хеллингера (МРХ-оценивание), минимума дивергенции Кульбака — Лейблера (МДК-оценивание), минимума .меры расхожде¬ ния Холдейна (МРХд-оценивание) и т. д. [9, 65, 71, 107, 118]. При соответствующих условиях оценки, получаемые этими методами, являются состоятельными, асимптотиче¬ ски эффективными (в смысле вероятностной сходимости и (или) минимума дисперсии) и асимптотически имеют нормальный закон распределения. Отмечается, что при соответствующих условиях регулярности из этих оценок МП-оценки предпочтительнее в смцсле эффективности второго порядка [65, 107]. ' В приложении к оцениванию параметров одномерного распределения W{x) МХК-оценка конструируется следую¬ щим образом- Весь диапазон X значений аргумента х рас¬ пределения разбивается на п непересекающихся интерва¬ лов одинаковой длины !. 1 Для распределений дискретных величин и величин, полученных из непрерывных группированием, (например, квантованием по уровню), не¬ обходимость разбиения на интервалы может отпасть. S—192 65
Вероятность р,- попадания в i-й интервал, t—1,/г, будет функцией р,(0) параметров 0ь...,0*. распределения. Пусть Ni — число элементов выборки, значения которых попада¬ ют в t-й интервал. Тогда Nx-{- ... Nn=N,, М{Ni}=Npi. Строится статистика %2 в виде и находится МХК-оценка 0 как значение 0, при котором Xя принимает минимальное значение. Сопоставляя (2.21) с (2.16), убеждаемся, что МХК-оценки есть частный слу¬ чай НК-оценок (т.. е. ММБ-оценок), если в НК-оценках брать веса ю/ как функции неизвестного параметра 0. Из (2.21) видно, что х2 представляет собой сумму квадратов относительных ошибок оценок вероятностей р*, взятых с весом, пропорциональным- р/. , Для r-мерных распределений х2 строится аналогично, только вместо i-ro интервала надо взять t-й r-мерный «ин¬ тервал» — гиперпараллелепипед. Статистика типа х* мо¬ жет быть построена и для других характеристик, напри¬ мер для спектральной плЬтцости мощности, для которой Npi характеризует долю мощности процесса, попадающую в t-й интервал частот, a Ni — эмпирическое значе-ние этой мощности. Методы минимального риска (МР-оценивание). Мето¬ ды реализуют принцип я8. Пусть параметр 0 может при¬ нимать значение из некоторого множества А. Поставим в соответствие оценке 0 параметра 0 (или оценке <р(0) функции ф(0)) неотрицательную функцию потерь (штра¬ фа) П (0, 0 ), характеризующую ущерб от замены пара- метра 0 его оценкой 0 Усредняя JI ( 0; 0 ) по элементам выборки х. т. е. по. X, получим функцию риска которую примем за показатель качества статистики 0 как оценки 0 при заданной функции потерь П. МР-оценивание сводится, как правило, к выбору допустимых оценок (по отношению к функции потерь П). Говорят, что оценка 0 является по крайней мере столь же хорошей, как и оценка П (2.21) гп(0, 0) = М{П[0(А'), 0]}, (2.22) 66-
6* для всех 0е'А, если гп(0, 0) < rnf(0*, 0), и оценка"© лучше, чем 0*-(или 0 строго доминирует 0*), если гп (0, 0)<>п(0*, ®) по крайней мере-для одной точки 0 из А [58]. Оценка, которая не доминируется никакой другой оценкой, называется допустимой (в смысле Вальда) [58] Г При МР-оценивании выбирается оценка 0 с минимальным риском Гп(0, 0). Следовательно, с точки зрения выбора МР-оценки (если она существует) яснр, что недопустимые оценки- должны быть отвергнуты. Однако, необходимо сделать следующее замечание [58]. Имеется много при¬ меров, когда МР-оценка не является допустимой. С дру¬ гой стороны/многие допустимые оценки вообще нельзя рекомендовать к употреблению. —I Х-ч Если П(0, 0) имеет вид выпуклой функции 11(0—0) в ^-мерном евклидовом пространстве и плотность W (х; 0) допускает достаточную статистику а для 0, то согласно теореме -Блекуэлла [60] существует оценка 0, являющаяся функцией от а, такая, что для всех 0еА М{П [0(*)-0]}<М{.П[0*(Л-)- 0]}, (2.23) где 0* — произвольная оценка 0. Примером являются эк- вивариантные оценки: Питмейа параметров сдвига распре¬ делений' [60] (см. гл. 4). оценки Рао—-Блекуэлла — Кол¬ могорова. Заметим попутно, что в случае квадратичной функции потерь оценки Питмена для р-мерного нормального рас¬ пределения, когда корреляционная матрица известна, сов¬ падают с выборочными средними и допустимы при р^2 и недопустимы при р^З. При р^З они строго доминируют- ся равномерно по 0 оценками Стейна [58] (см. также §4.2). . При выпуклой квадратичной функции потерь, когда /*ч потери пропорциональны разности (U — U)2 либо (U — — U)T(U — £/) =11 ((/ — U) II , метод МР-оценивания перей¬ дет в оценивание по методу минимума среднего квадрата ошибки, МД-, МЭР-оценивания. Подробнее метод в более общей постановке будет рассмотрен как метод байесовско¬ го минимального риска. Здесь лишь отметим минимаксные 5* 67
'оценки (ММ-оценки) 0 по отношению к функции потерь, определяемые из условия поведения чв «худших» точках параметрического пространства А, т. е. из условия sup гп(в, 0) > inf sup rn (0*, 0). (2.24) 0eA - 0* 0GA Заметим, что ММ-оценка существует лишь в случае, когда в неравенстве * 4 inf sup гп(0, 0) > sup inf гп(0, 0), 0* 0 0 е справедливом всегда, достигается равенство [58]. В смыс¬ ле минимума риска качество оценок можно характеризо¬ вать отношением рисков, в частности отношением риска данной оценки 0 к минимальному значению риска МР- оценки 0*.- Методы непараметрических статистик (НПС-оценива- ние). Эти методы оценки параметров распределений мож¬ но отнести к непараметрическим (или полупараметриче- ским) методам параметрического оценивания, поскольку они позволяют оценивать некоторые параметры распреде¬ лений, например параметры сдвига и масштаба, по одним и тем же формулам для широкого класса распределений различной формы. Замечательным свойством таких оценок параметров и некоторых числовых характеристик, в част¬ ности оценок в виде порядковых статистик, является вы¬ полнение для них принципов jt8, Я12, Я13. Хотя в ряде слу¬ чаев при точном соответствии между выборкой и припи¬ сываемым ей распределением такие оценки не являются эффективными (но довольно близки к мм), при отсутст¬ вии такого соответствия их эффективность может быть существенно лучше эффективности МГЬ и других эффек¬ тивных оценок,, найденных по формулам распределений, которые мы приписываем выборке, вместо тех, к которым фактически относится выборка [120, 126]. Подрбные оцен- ки будут рассмотрены на конкретных примерах в гл. 4. Методы байесовского оценивания по апостериорному распределе¬ нию (БАР-оцениванйе). До сих пор мы рассматривали оценивание па¬ раметров, полагая, что их значение не известно, но фиксировано, не случайно. Байесовский подход основан на предположении, что значе¬ ния параметра случайны. Будем полагать, что .10— случайный параметр 0 с априорной плотностью W% (0). Байесовские методы можно приме¬ нять, например, при получении элементов выборки х* 68
После получения выборки % при известной плотности W q (0) мож¬ но найти 1 апостериорную плотность U70(0 | x)=We(Q)L(x | 0)/М {L(x | 0)}, (2.25) Самое широкое применение в БАР-оценивании нашел метод наи¬ большего (максимум максиморум) значения апостериорной плотности вероятностей (МАВ-оценивание), согласно которому в качестве оценки 0 параметра 0 выбирается мода №0(0|*)> соответствующая наибольше¬ му значению 1^0 (0|*)» т* е- «наиболее вероятное» значение 0^ Заме¬ тим, что при равномерном в области А задания параметра 0 распреде- лении И?0(0) МАВ-оценка совпадает с МП-оценкой, если решение 0 попадает в А. МАВ-оценка обладает свойством состоятельности (яг)’ и. асимптотической эффективности (яз, Я4), существует как для собст¬ венных, так и для несобственных *[9] апостериорных распределений, В одномерном случае вместо, моды в качестве оценки 0 случайного па¬ раметра 0 моЯсно взять медиану апостериорной плотности 0 (01 jc) [112]. Такая оценка называется минимаксной (мм-оценка), так как она минимизирует вероятность максимальной возможной ошибки. Широкое распространение получили оценки через апостериорное среднее (АС-оценивание). Согласно этому методу оценка 0 выбирается 'ч "eUM]©!*}. (2.26) Как MABs так и АС-оценка* являются несмещенными только при усред¬ нении по всем возможным значениям X и 0. При 'рассмотрении под углом двойного усреднения АС-оценка является при определенных усло¬ виях регулярности. МД-оценкой или в векторном случае МЭР-оцен- кой [135]. Однако данные оценки не робастны (не устойчивы) к малым изме¬ нениям априорного распределения [9] (принцип Я12). Методы байесовского минимального риска (БМР-оцениванйе). Эти методы являются обобщенным методом МР-оценивания на случайные па- ‘раметры и связаны с усреднением риска (2.22) по распределению пара- метра 0. При этом- гп (0, 0) представляют собой условную функцию риска, найденную при условии 0=0, а МР'-оценки, найденные по кри- терию минимума гп = (0, 0), называются условными байесовскими оцен¬ ками (УМР-оценками) по функции потерь П(0, 0). Показателем (кри¬ терием) качества в этом случае является средний риск Дц(0)=*М.{ГП ($ 0)}. (2.27) 1 Для случайных процессов она находится на основе многомерного распределения, канонического разложения процесса и1 т. п. в зависимо¬ сти от того, как образуется выборка {72].
В "качестве оценки 0 выбирается безусловная байесовская оценка, для которой средний риск принимает минимальнб возможное значение (БМР-оценка). Подставляя (2.22) в (2.27) с учетом (2.25), нетрудно убедиться,- что /?П(0)=М{/?(0Ч| X)}, (2.28) 00 где R (0 I X) = ]' П (в; 0) Н70(0 I X) rfe (2.29) —00 — апостериорный риск. Отсюда непосредственно следует, что, поскольку Й7(*)^0, минимизация функционала (2.28) сводится к минимизации (2.29) по [см. (1.31)]. В общем виде при произвольных функциях о потерь найти БМР-оценки затруднительно. Поэтому обычно рассматри¬ вают конкретные функции или классы функций/потерь. Пусть, напри- мер, функция потерь П(0, 0} является симметричной и выпуклой1, а апостериорная плотность W'q (0|*) есть симметричная функция отно¬ сительно' условного математического ожидания. Тогда БМР-оценка сов¬ падает с АС-оценкой (2.26) [9, 97, 126] независимо от конкретного вида функции потерь (принцип инвариантности к функции потерь л it, устой¬ чивости, к ним Я12). Частным случаем такой функции потерь является квадратичная функция, которая имеет вид П (0, 0) = (0 — 0)ТЛ (?, 0), (2.30) где Л — заданная положительно определенная матрица весов. При этом требование симметрии Wq (0|х) не является обязательным, а БМР- оценка, так как это AC-оценка, не зависит от матрицы весов А (прин- ницы л 12, яп). Различные виды функций потерь рассмотрены во многих работах, в частности в [72, 75, 97, 126]. Оказывается,, что выбором функции по¬ терь БМР-оценки'можно свести к некоторым ранее описанным оценкам. Так, при простой функции потерь БМР-оценка совпадает с МП- и МАВ-оценками, при равномерной (прямоугольной) функции потерь и унимодальной симметричной относительно моды плотности^ W q (0|*) — с МАВ-оценкой, при функции потерь^ равной модулю ошибки, — с ММ-оценкой, которая в свою очередь при унимодальной, симметричной относительно моды плотности Wq (0 |ж) совпадает с МАВ-оценкой, -и т. д. В случае, когда для распределения выборки существует доста¬ точная статистика, байесовская оценка параметра является фуйкцией достаточной статистики [81].. [_ Заметим, что если выпуклая функция потерь является неограни¬ ченной, то БМР-оценка может иметь бесконечный априорный .риск. Однако если апостериорный риск есть интегрируемая функция относи¬ тельно безусловного распределения выборки, то БМР-оценка будет ми¬ нимизировать также и априорный риск [58]. 70
Ограничительным моментом в широком применении байесовских эденок^является необходимость знания априорного распределения оце¬ ниваемого параметра (смг принцип Я13). В тех случаях, когда оно не известно, используется несколько^ решений. Во-первых,‘ можно попытать-' :я применить вероятностный подход, получить распределение из физи¬ ческих предпосылок (см. предупреждение в [118]). Во-вторых, можрр воспользоваться статистическим подходом. Для этого следует выбрать гип распределения ^0(0) из заданного класса на основе методов упо¬ рядочения и выбора, описанных в [43], и методов статистической клас¬ сификации, распознавания образов, проверки гипотез и т. д. (в частно¬ сти, байесовскими приемами [118]), затем оценить его параметры, Можно также использовать непараметрические оценки, плотности с их последующим аналитическим описанием. В-третьих, можно попытаться применить итерационно-адаптивные обучающиеся процедуры, основант ные, в частности, на идеях байесовского оценивания [58, 72]. В чет¬ вертых, можнб попытаться применить модификации байесовского оце¬ нивания, основанные на использовании частичной ^априорной информа¬ ции: диапазона изменения параметра 0, числовых характеристик 0 и т. д. [72]. В-пятых, можно в целях предосторожности выбрать заве¬ домо худшее по априорному распределению решение, взяв в качестве /S _ ‘ i оценки 0 минимаксную оценку. В-шестых, при мадом разбросе пара- метра 0 можно принять его за неслучайный 0=0. Тогда, как видно из (2.27), придем к" методу МР-оценивания. Наконец, байесовскую-про¬ цедуру оценивания можно заменять на эмпирическую байесовскую про¬ цедуру Роббинса и ее модификации, требующие знания лишь вида се¬ мейства априорного распределения [58, 81]. Методы регрессионного оценивания (Р.-оценивание). Данные методы в определённом смысле являются обоб¬ щением предыдущих и применимы для оценивания- неслу¬ чайных и случайных параметров 0. Пусть, как и ранее, % — выборка с функцией правдоподобия L (х | 0о), где 0э фиксировано, но не известно; Пусть далее ф(дс|0о)_—^не¬ которая функция элементов выборки *={*,-, t'=l, N} и фиксированного- векторного параметра 0. Образуем'функ¬ цию регрессии <р (х, 0) на ©о и найдем ёе непараметрическую оценку р, например _Если известна функциональная форма р(0, 0О) (в об¬ щем видё нужна только она — см. принцип лйз), которая 71 Р (0, во)=М{Ф(Х, 0)| 0О} (2.31) (2.32)
удовлетворяет некоторым условиям регулярности в' окре: стности точки 0=0о, то оценку р можно использовать для оценивания 0О [97]. Общность данного подхода сводится к общности функции ф (х, 0). Так, если ф(дс, 0)= =ln W (х, 0), то P-оценки, полученные пр (2.32), пред¬ ставляют собой МП-оценки по независимой выборке, ког¬ да 0о неслучайно, либо соответствуют байесовскому оце¬ ниванию, если рассматривать все точки 0о парам»риче- ского пространства. Чаще всего конкретные алгоритмы P-оценивания реа¬ лизуются в виде рекуррентных процедур стохастической аппроксимации: Кифера — Вольфовица, соответствующей экстремуму р(0, ,0О) в точке 0=0О, Роббинса — Монро, соответствующей р (0, 0о) =0 при 0=0о, обобщающих их процедур Дворецкого и т. п. [75, 97, 103]. В заключение сделаем несколько замечаний. 1. Конкретные алгоритмы параметрических методов оценивания по¬ лучаются, когда соответствующим образом реализуются все признаки табл. 1.3. Примеры и систематизацию подобных алгоритмов, реализую¬ щих признаки, относящиеся к вычислительным операциям, в частности рекуррентные алгоритмы нахождения корней уравнений, точек экстре¬ мумов и т. д., пригодные для использования во многих методах оцени¬ вания, можно найти в [9, 18, 58, 75, 89, 103, 118]. 2. Большинство методов оценивания дают оценки, не обладающие свойствами инвариантности по параметрам (яи) и по наблюдениям (яю). В связи с этим отклонения от условий, при которых применимы Вти оценки, могут привести к значительному искажению результата, к потере оценками некоторых замечательных свойств (например; к рез¬ кому увеличению смещения или дисперсии'[89, 118, 120]. 3. К сожалению, мы не имеем возможности привести здесь достоин¬ ства. и недостатки всех рассмотренных методов параметрического оце¬ нивания. Частично достоинства и недостатки методов указаны при их описании. Некоторым оправданием является то, что абстрактный анализ данныхТлетбдов без привязки к конкретным моделям часто дает карти¬ ну, резко контрастирующую с той, которая получается для конкретных моделей. Некоторые преимущества и недостатки методов будут ясны из материалов следующих глав. 4. При описании параметрических методов оценивания были рас¬ смотрены v лишь оценки самих параметров, а не характеристик. Практи¬ чески же нас чаще интересуют значения не параметров 0, а характе¬ ристик Q(0; 0). Зная значения 0 и аналитическое выражение' Q\<h 0), можно на основе первого варианта параметрического оцени¬ вания вычислить Q(fl; 0) для любых значений аргумента Получен¬ 72
ные таким образом параметрические оценки *9 (fl; 0) = Q (А; ^) будут иметь смещение и дисперсии, которые можно найти^зр формулам При этом НАН-оценки имеют определенное преимущество,- связанное с упрощением вычислений по (2.33), (2.34). В тех случаях, когда по¬ лучить точное выражение по (2.33), (2.34) затруднительно, можно вос: пользоваться приближенными формулами, основанными на разложении Q(ft\ 0) в ряд Тейлора по 0 в точке М{0Н0={0ь ..., 0*}: ^ где dQ/ddi — частная производная 0) по 0< в' точке 0»; #гп — _ А элемента корреляционной матрицы оценки 0, т. е. #fn = c°r{0f, М- Приближенное равенство в (2.36) будет тем ближе к точному'ра¬ венству, чем меньше убудет второе слагаемое, в (2.35) по сравнению с первым. Если приближение в (2.36) неприемлемо, можно ввести до¬ полнительные члены, учитывающие более высокие производные Q (Ф, 0)’ и более высокие моменты оценки 0. Можно, .если это допустимо из со¬ ображения решения задачи* где используются оценки, также перейти к новой характеристике Q или f(Q), точностные показатели которой заведомо лучше и (или) проще вычисляются. Здесь f — некоторая' функ¬ ция. В [1.18] даны приближенные асимптотические формулы для мате¬ матического ‘ ожидания и дисперсий подобных мм-,"МП- и НК-оценок. Заметим, что если 0 есть МП-оценка, то МП-оценкой будет также Q(fl; 0). Для определения эффективности оценок следует использовать правую часть (1.41), (1.42). В тех случаях, когда существуют достаточные статистики парамет¬ ров 0, целесообразно вместо параметрического оценивания по первому варианту, т. е. по формуле Q('0)=Q(,0, 0), использовать несмещенное оценивание Q(ft) по второму варианту, т. е. в виде функции от доста¬ точной статистики без предварительного определения оценок 0 [81]. Это оценивание может осуществляться либо непосредственно решением уравнения (1.32), когда распределение достаточной статистики удобно' для практического применения (метод Колмогорова, требующий до¬ eQ(tf; 0) = М {Q (#; 0)} - Q (А; 0), (2.33) о2 (О; в) = М {Q2 (О; в)} - [М {Q (О; в)>р. (2.34) k и Rln> (2.35) (2.36) 73
вольно сложного математического аппарата)-, либо через произвольную несмещенную* оценку <3 на основе регрессионного МД-оценивания {метод Рао—Блэкуэлла — Колмогорова) по (2.11), либо по формуле Байеса, на основе матричного метода и. т. д. [58, 81, 107, 116, 120}. В силу свойств достаточных статистик такие оценки не будут зависеть от параметров Q. Замечательным свойством оценивания по первому варианту, т. е. в виде Q(ft;'0), является универсальность формул расчета значений Q по значениям 04 для случайных величин, -векторов, процессов и после* довательностей (принцип я1в). _ 2.3. НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ Вводные замечания. Непараметрические алгоритмы статистических измерений реализуют .непараметричёские методы оценивания значений характеристик случайных элементов непосредственно по выборке %. Такие метбды не требуют знания функционального вида оцениваемой характеристики, а зачастую и вида вероятностной модели. Имеется в виду, что модель представляет собой некоторый класс или семейство случайных элементов с уровнем описания более высоким,* чем измеряе¬ мая характеристика. Знание вида модели^дозволяет в этом случае вы¬ брать специальный* лучший в нужном смысле для~ данной модели не¬ параметрический алгоритм. —ч В" данном параграфе рассмотрим некоторые универсальные методы непараметрического оценивания различных характеристик. Специальные методы непараметрического оценивания конкретных характеристик (за¬ конов распределения, корреляционных, спектральных и т. п.) будут рас¬ смотрены в последующих главах. Метод эмпирических характеристик (ЭХ-оценивание). Это самый широко распространенный метод непараметри- ческог^о оценивания, нашедший наибольшее отражение в работах по статистическим измерениям. В основе метода лежит идея определения значений эмпирической характе¬ ристики — линейного преобразования значений функций £$(•) или £<?(•) от элементов выборки, где gQt gQ опре¬ деляются видом измеряемой характеристики (см. гл. 1). Например, аналогом (теоретической) ансамблевой харак¬ теристики Q (Ф, tt т) являются ансамблевые (выборочные) эмпирические характеристики, см. (1.1) t, т)= ♦], (2.37) i=I Qn (tf, t, t) = [Xi (tj, t; «]. (2.38) i=l 74
Для случайных величин и векторов необходимо опустить аргументы t, х. Для' траекторией характеристики' ©{О, т) эмпирические траекторные характеристики' совпадают с <Щг(б, т), @т(Ь, т) для процессов или с @.n (<►, т), т) для последовательностей [см. (1.27), (1.28)] либо в обобщен¬ ном виде определяются как йт(д. т) = Лт{Ta(t)gQ [v (О, т; Щ, (2.39.) Шт (О, т) = Лт {Та (t)gQ [х (t), т; Щ, (2.40) х)=Льг [* (/), т; #]}, (2.41) '@.N{^,J(T=^N{Na~g<l{x{i), т; #]}. (2.42) Эти же эмпирические траекторные характеристики могут в условиях справедливости гипотезы эргодичности быть аналогами соответствующих ансамблевых характеристик. Здесь' а,- и a(t) — весовые множители, выбираемые из условия нормировки Ci+ -j-aw=l Лт{Та{1)}=\\ gQ отличается от §q тем, что в выражение для .gQ в качестве аргумента или параметра входит теоретическая характе¬ ристика, а в £q — эмпирическая; Xi {t) — значение X(t) в i-м опыте, .т.;е. значение i-й. наблюдаемой траектории в момент времени t. Чаще всего в-эмпирических характеристиках полагают а, = 1 /N, a(t)=I {i е [t0, К + T}}iT, т. е. б^рут элементы выборки с одинаковым весом, допу¬ ская тем самым, что каждый элемент выборки появляется с одинаковой вероятностью. При использовании .эмпири¬ ческих характеристик в'качестве оценок соответствующих теоретических характеристик, в том числе траекториях эмпирических характеристик как оценок ансамблевых тео¬ ретических характеристик эргодических функций, а* и а(/)- выбираются из усяювия получения требуемого каче¬ ства оценок, например, из-условия несмещенности и мини¬ мума дисперсии оценок. Как видно из (2.37), Х2-39)» (2.41), если а»- и a(t) вы¬ бираются из условия нормировки, то Qn будет несмещен¬ ной оценкой Q всегда, а ©т и — при дополнительном условии стационарности X(t). Для оценок же типа QN, (&t>®n получить общие условия, которые должны накла¬ дываться на аи я (0, чтобы оценки были несмещенными, 75
не представляется возможным. Можно лишь отметить, что если §q содержат эмпирические характеристики, являю¬ щиеся несмещенными или асимптотически несмещенными оценками своих аналогов — теоретических характеристик, то, как правило, ®т, ®я будут асимптотически не¬ смещенными оценками Q (для Шт и ©я при дополнитель¬ ном условии стационарности X(t)). Подробнее вопросы выбора а* и а(4) убудут рассмотрены в дальнейшем в при¬ ложении к конкретным характеристикам и к классам ха¬ рактеристик: ’ Если с учетом (1.1) подставить в (2.37), (2.42) в каче¬ стве g'Q (•) соответствующее преобразование над случай¬ ным элементом, стоящее в фигурных скобках выражения М{-} в табл. 1.1, то получится очевидная, но зачастую не самая лучшая ЭХ-оценка соответствующей, ансамблевой характеристики. Затем, исследуя смещенность, дисперсию и другие показатели качества такой оценки, можно ее мо¬ дернизировать (например, выбором а,-, а(i)) таким обра¬ зом, чтобы она в необходимой мере отвечала заданным требованиям. Метод ортогональных ^разложений (ОР-оценивание). Согласно замечаниям, изложенным в § 2.1, данный метод относится к 1Репараметрическим'лишь в той мере, в какой для оценивания коэффициентов разложения используются формулы, не зависящие от конкретной формы (вида) ха¬ рактеристики и вероятностной модели. Суть метода сво¬ дится к представлению оцениваемой характеристики Q(O) в виде конечного ряда, например Q(*)= S <№(*). (2-43) <=i по системе базисных функций ф« (<)’). ортогональных на отрезках фиксированной или переменной [102] длины с весом рДф); «непараметрическому», не зависящему от донкретной формы характеристики Q(G) оцениванию ко¬ эффициентов ряда (аг) и к вычислению значений оценки Q (Ф) по ряду (2.43) с подстановкой в него в качестве ко¬ эффициентов разложения (ai) их оценок. При непараметрическом ОР-оценивании число (п) чле¬ нов ряда, (2.43) и явные формулы для оценивания коэф¬ фициентов (а*) разложения фиксированы. Заметим, что ОР-ряд типа (2.43) может быть использован для аппро¬ ксимации известной теоретической (Q) или полученной эмпирической Q характеристик. В этом случае оцениваиие 76
п и а,-^следует осуществлять методами параметрического оценивания и ММБ-оценивания. Подробнее метод будет рассмотрен в приложении к конкретным характеристикам. Метод .неортогональных разложений (НР-оценивание). Метод аналогичен предыдущему с той разницей, что раз¬ ложение оцениваемых характеристик Q(d) производится по системе неортогональных функций ф,( например, в ряд Тейлора, в виде смесей и т. д. [52, 100, 126]. Методы ОР и HP относятся к классу аппроксимативных методов и об¬ разуют единый метод проекций. Метод дельта-образных функций (ДОФ-оценивание). Допустим, что оцениваемая характеристика Q (О) непре¬ рывна в точке Фо. Тогда ее значение Q(6o) можно представить в виде 00 Q (<*.)=* { Q(O) 8 (♦-*,)<«>» (2.44) —00 или приближенно Q(*o)^ J Q (4) 8г(4 —♦,)</♦, (2.45) —00 где 8(*f — дельта-функция; 6г (*) — дельта-образная функция, имеющая единичный объем и стремящаяся к б(дс) при Г-^-оо. Предлагается вместо оценивания Q(do) находить оценки правых частей в (2.44), (2.45), что в ряде случаев оказывается проще и дает более точные результаты [28, ,60, 75, 126]. Данный метод нашел применение в основном при оценивании плотностей распределения вероятностей (как ‘метод ядерРозенбл'ата — Пэрзена —• Надарая) и спектральных плотностей мощности, а также производных от них характеристик. Поэ?ому он будет подробнее рас¬ смотрен в приложении к данным характеристикам. Метод сглаженных дельта-функций (СДФ-оценивание). Соотношение (2.44) является следствием идеальной изби¬ рательности дельта-функции и отражает ее фильтрующее свойство. Однако в оценивании по ограниченному объему экспериментальных данных идеальная избирательность дельта-функций является зачастую нежелательной. Напри¬ мер, полученная с использованием б-функций по выборке pCi, 1=1, N, ЭХ-оценка №(х) плотности распределения ;И7(х) будет йм'еть вид гребенки «взвешенных» дельта¬ функций с точками «прописки» х*, k=l, п, равными зна¬ 77
чениям, которые примут элементы выборки-с, весом в каж¬ дой точке рь, равным Nh/N, где Nh — число равенств х{= ==Xh, i=1, N. Для устранения этого нежелательного-явле¬ ния в- предыдущем методе используются дельта-образные функции. Другой, подход основан на. СДФ-оценивании. Здесь чвместо дельта-функции б ('б—до) в (2.44) предла¬ гается использовать сглаженную дельта-функцию 6С (д, до), имеющую «размазанную» избирательность (с конечной .апертурой), но то же фильтрующее свойство: 00 QW= s Q(0)«c(O. <>,)<». ^2.46) —00 В качестве таких функций можно взять, например, по¬ тенциальные функции [75, 126]. Подобный метод оцени¬ вания плотностей распределения рассмотрен в [75, т. 3[. Метод базовых характеристик (БХ-оценивание). Пусть оцениваемая характеристика Q определяется как извест¬ ная функция /(•) от некоторых других «базовых» харак¬ теристик Qi Qs, т. е. Q=f(Q\; Q2, Q,). (2.47) Заметим, что Q может быть представлена также в виде (1.1). Тогда в качестве формулы Для непараметрического оце¬ нивания Q можно использовать выражение <5=f(ai<3i, Q2Q2, • •&sQs), (2.48) где весовые коэффициенты аи . ..4 ап и модификации f функции f выбираются из условия получения наилучших значений требуемых показателей качества оценки Q, а •••, & — параметрические или' непарамётрические оценки для Qi, ...., Qs. Подробнее метод буде?1 рассмотрен в приложении к конкретным характеристикам. Здесь лишь отметим, что в качестве базовых могут выступать характеристики как универсальные, Типовые, так и некоторые специальные, более удобные для оценивания (лучшая точность, проще вычисления и т. д.). Метод iZ-статистиК (//-оценивание)' [58, 120]. Пусть 'Р — некоторое множество распределений F; g(F) — функционал на \F, принимающий скалярные Дли вектор¬ ные значения; Х\ xN — независимая одинаково рас¬ пределенная выборка случайной величины X. Функционал g(F) распределения F называется допускающим ,несме- 78.
-щенную оценку, или регулярным, если существует'такая статистика ф(дг1, ..., xN), что М{ф)=#(Е) для всех FeT. Наименьший объем выборки'т, для которого g (F). имеет несмещенную оценку, называется степенью m функциона- ла g(F). Любую несмещенную оценку ф функционала g(F), основанную на выборке наименьшего возможного объема - пг, называют ядром. Рассмотрим симметричные ядра <psXtxcm), инвариантные при переста¬ новках Xit x-im. Симметричные ядра ф« можно полу¬ чить, например', как 2ф//те!, где суммирование любой (не¬ симметричной) функции <р(х,Xim) проводится по всем т! перестановкам iu 12, ..., im чисел 1, 2, m, т. е. ком¬ понентов-вектора X ={*£,, Х<а,..., >с,от}. Соответствующая заданному симметричному ядру ф* для допускающего несмещенную оценку функционала g{F) степени m [/-статистика есть среднее всех возмож¬ ных значений ф8, а именно: [/(*■„..., *„) = _!_ XV xtj, (2.49) U где суммирование ведется по всем сочетаниям m чи¬ сел (tb ..., im) из (1, 2, .. .Jv). -Пусть Ч' — семейство всех абсолютно непрерывных или всех дискретных распределений, фа — несмещенная оценка допускающего такую оценку функционала g('F), а V — соответствующая ей [/-статистика. Тогда U — несмещен¬ ная МР-оценка для g(\F) при любой строго выпуклой функции потерь, которая в случае конечного второго мо¬ мента ф5(*ь xN) является несмещенной МД-оценкой; НАН-оценкой. Заметим, что- указанные практически важ¬ ные свойства [/-статистики справедливы вдоль всех неиз¬ вестных абсолютно непрерывных или дискретных распре¬ делений. Если же распределение известно, то можно полу¬ чить оценки тех же функционалов параметрическим мето¬ дом Рао — Блэкуэлла — Колмогорова или методом СЭ- оценивания с дисперсией меньшей, чем дисперсия [/-ста¬ тистик. ' В [120] рассмотрены вопросы применения [/-статистик в случае зависимых выборок, а также квази-'[/-статистик, отличающихся от [/-статистик заменой неизвестной плот¬ ности распределения ее непараметрической оценкой. 79
‘2.4. СМЕШАННЫЕ АЛГОРИТМЫ Рассмотренные выше наиболее часто используемые ме¬ тоды Оценки параметров и различных характеристик слу¬ чайных элементов сведены в табл. 2.1—2.3. В таблицах звездочка >(< означает какую-нибудь 'непараметрическую оценку. Скобки означаю^ частичное,/а знак —- асимптоти¬ ческое выполнение или невыполнение соответствующего признака. Сами же признаки в правых графах таблицы приведены на примере оценивания одномерных характе¬ ристик, -когда выполняются. необходимые и достаточные условия применимости данного метода оценивания. Ча¬ стичное выполнение или невыполнение признака означает, что он выполняется лишь для некоторых разновидностей метода, не для всех моделей, при выполнении определен¬ ных условий и т. п. * Анализ данных методов как в. общем виде, так и в .привязке к конкретным характеристикам 1 позволяет сде¬ лать следующие выводы. 1. В “параметрическом оценивании используются два принципиально- отличных подхода, различающихся харак¬ тером априорных предпосылок и сведений. Первый осно¬ ван На том, что при оценивании неизвестных параметров исследователь не располагает никакой информацией об истинном значении параметра, кроме той, которая содер¬ жится в выборке, и сознательно считает, что значение не¬ известного параметра фиксировано, не случайно. Второй подход основан на использовании априорной информации о неизвестном параметре, которая может быть получена теоретически, на основе анализа' результатов предыдущих измерений данного или аналогичного ему параметра и т. m Конкретные разновидности методов оценивания парамет¬ ров (и, следовательно, параметрического оценивания ха¬ рактеристик) внутри ,данного подхода зависят от /того, ка¬ ким образом вводятся, формулируются эти априорные све¬ дения об измеряемом параметре. Многие статистики, применяющие и пропагандирующие этот подход, предлагают рассматривать неизвестное ис¬ тинное значение 0о—{0ю, 620, ...., Эьо} векторного парамет¬ ра 0 как реализацию некоторого случайного вектора 6= = {0ь ©2, - ©ft} с известным (полученным в результате предыдущих опытов, на основе теоретических выводов или 1 Рассмотрению методов параметрического и непараметрического оценивания конкретных характеристик посвящены последующие главы книги, начиная с четвертой. 80
tt о к Ж 4> .ч m a 95 В4' >» О». о* 4) н 5 S. о 3 а Is §§ и и *1 О <1) -11 п§. а в ~ _i к «* 3 .е в К1 ад г * S, •$, * .* СУ СУ о. ей н 4) § & Б _ Я § .*« Ц Ь 2 * •• ц S.S . 11 г * •® I I . •« Ч*—S «О фф ssr- X в* I! ф 5Г <£> п X со X ЕГ § §0 а 4> г* о S ВС О Н 4) tS а <=5 XD С- 6—*192 5 §, ё «я •& X »а а а О) сг <я а со ф -о а а н х Я а о р? о .1? ii 1* 5 а VO се о а а а а а а. О) с ё' вс 2. а 8f
Продолжение табл. 2.1 ;82
as * аз а §1 Ц &I *а *° Я й) Ж О « 53 * 2 в W о*-5 С2 ^ со *£ (0 Я- * в г? >к к в if « - 3 К *• В & н 4> 2 о* & ж • s 5 ю 4> Sf О о н а> 2 4> S « <8 <N . СЧ Ж Ж *ч \о «з 6* ас * о к 5 1- 2 О. $ о ж н о О Ж CU со Ф Е "ф 0*. ПС 2 .4 ф S 8 а < to § 2 2 U С Ф V. ч-> ф £ А ft? а В 2 К JC 5 $ * ч со О) SS- SB- §1, 2 s •'§§ 1° р1§. J »ж СО (ft о 8. 5 О с СО со 2 я ж S СО н 2 к ж _а ж о ж со ж ж 2 о а А 'Н? СО 2 ж ж ж 2 О и О О я « £з а •Я- з Ж' ж о «я о V а 83;
постулированием) априорным распределением. Это -т- группа байесовских методов, некоторые из которых пред¬ ставлены в табл. 2.2 и рассмотрены в § 2.2. Все эти мето¬ ды объединяет необходимость знания априорного распре¬ деления вектора 0. Однако зачастую это распределение, особенно если оно постулируется априори, вводится субъ¬ ективно, отражает лишь приближенно степень нашего ап¬ риорного знания об истинном значении неизвестного пара¬ метра и не всегда с достаточной степенью (например, по критериям согласия) соответствует физически реализуе¬ мым испытаниям, экспериментальным данным. ' Большая часть статистиков считают, что априорное распределение 0 должно обязательно допускать объектив¬ ную интерпретацию, например, в терминах эмпирических распределений, т. е. в терминах частот (частостей). Эти статистики при выборе априорного распределения в байе- teoBCKOM подходе используют методы, описанные в § 2.2, либо в качестве априорного распределения используют Эмпирическое (частотное) или фидуциальное (аналогичное (частотному; но отличное"оТ него [65]) распределение. В дальнейшем будут. рассматриваться только методы первого подхода, т. е. небайесовские. I 2. При выборе методов оценивания параметров преж- !де всего необходимо обратить внимание на методы ЗХ, ЧХ и ММБ, в частности НК- и МХК-оценивания. Эти ме¬ тоды легче реализуются, допускают универсальные, не зависящие от аналитического вида Х(арактеристик про¬ цедуры преобразования элементов выборки, что-особенно важно при больших объемах выборки. Оценки, получен¬ ные данными методами, зачастую являются асимптотиче¬ ски эффективными. Их меньшая эффективность при малых и умеренных объемах выборок может быть улучшена, если находить по той же выборке несколько оценок одного и того же параметра и затем усреднить их. Этот прием осо¬ бенно легко реализуется в методах ЗХ- и К-оценивания, когда разные оценки одного и того же параметра по той же выборке находятся либо при разных наборах значений аргументов характеристик в методе ЗХ-оцениваНйя,. либо при разных наборах значений характеристик (квантилей) 'в методе К-оценивания. Данные методы удобны также 'тем, что позволяют использовать средства, пригодные не только для решешм задач измерений, но и для решения задач- идентификации, проверки гипотез и моделирования. | 3. Из двух вариантов параметрического оценивания характеристик наибольший практический интерес пред- 84
85
Продолжение табл, 2.3 86
ставляет первый вариант, когда параметрическая оценка -'■'Ч . — <2 (б) характеристики Q(6) находится по формуле 3(*)=Q (*;■?). (2.50) ь Применение данною варианта позволяет сравнительно просто реализовать многофункциональное измерение — измерение^нескольких разнотипных характеристик Q (б). Использование МП-оценок параметров в этЬм случае по¬ зволяет получить. МП-оценки характеристик- Q (<►). Второй вариант параметрического оценивания харак¬ теристик (через достаточные статистики) существенно за¬ висит как от оцениваемой характеристики, так и от вида вероятностной модели. Поэтому- его, как правило, можно рекомендовать лишь для определения предельно дости¬ жимых значений точностных" характеристик параметриче,- -•ских оценок. „ 4. Как видно из табл. 2.3, из непараметрических мето¬ дов оценивания характеристик Q (б) прежде всего следует обратить внимание на ЭХ-, ДОФ- 'и БХ-оценки. Послед¬ ние удобны при многофункциональных измерениях. '• 5. Сравнив параметрические и непараметрические ал¬ горитмы оценивания характеристик по показателям вида '(1.48)—‘(1.52), приходим к выводу, что для параметриче¬ ских оценок, определяемых по выборке объёма Г, показа¬ тели вида дисперсий и локальных и, глобальных средних квадратов отклонений (СКО) имеют порядок- Г-1,' в то время , как для непараметричёских оценок они существен¬ но зависят от вида оцениваемой характеристики. Для ЭХ- оценок корреляционных функций дисперсии локальные и глобальные СКО также имеют порядок Г-1, в то время кай СКО ЭХ- й~ДОФ-оценок плотностей распределения веро¬ ятностей и спектральных плотностей мощности имеют по¬ рядок Г~“', где 0<а<1, чаще всего в одномерном случае и*%Ю,8 (см. гл. 6 и 8). 6. Зачастую параметрические алгоритмы оценивания характеристик Q (б) могут оказаться предпочтительнее не¬ параметрических по объему вычислений: Это обусловлено !тем, что для большинства дискретных решетчатых пара¬ метрических оценок Q (■б) вида (2.50) измерение значений характеристики Q(6i), Q(6n) по выборке объема N требует Oi='aiiAr+a2rt эквивалентных суммированию ариф¬ метических операций Q, где a — константы, зависящие от вйда характеристики 'Q(6) и алгоритма оценивания [в данном случае 0 и Q(6) по (2.50)]. Аналогичное выраже¬ ние 02=a3iV-l-a4« для числа операций имеет место для не-. 87
параметрических OP и HP-оценок, в то время кдк для ЭХ-оценок 03=а5/гЛ^. ^ 7. Дополнительные сведения о .свойствах параметри¬ ческих алгоритмов приведены в табл. 2.4, 2.5. Можно в случае необходимости получить' аналогичные таблицы для непараметрических алгоритмов. Из изложенного следует, что в общем виде, без привязки к кон¬ кретным условиям, трудно отдать предпочтение параметрическим или непараметрическим методам. В ряде случаев целесообразно использо¬ вать смешанные алгоритмы оценивания, .позволя!01цие найти разумный компромисс между достоинствами и недостатками параметрических методов. Такие алгоритмы могут использоваться, например, в много¬ функциональных средствах статистических измерений и анализа для уменьшения объема вычислений и оборудования, для повышения точ¬ ности, получения аналитических выражений характеристик, удобных для дальнейшего применения, и т. д. Смешанные алгоритмы основаны на комбинации непараметрических и параметрических приемов оценивания. Возможны различные вариан¬ ты. таких комбинаций, т. е. варианты смешанного оценивания. Прежде всего обратим внимание на два различных подхода к организации сме,- шанного оценивания. Первый основан на апостериорной аппроксимации модели случайного элемента, второй — на аппроксимации оцениваемой характеристики. Первый подход в. настоящее время бурно развивается в приложении к оцениванию спектральных плотностей мощности и реализуется в виде линейных (скользящего ’среднего, дискретного преобразования Фурье по какому-либо базису) и нелинейных (авто¬ регрессии, максимальной энтропии, авторегрессии и скользящего сред¬ него, гармонических разложений Писаренко и пр. [63]) методов. Второй подход в настоящее время чаще всего реализуется в два этапа: на первом этапе находится непараметрическая оценка исследуемой* харак¬ теристики, а на втором осуществляется ее аппроксимация путем подбо¬ ра подходящей математической модели и оценивания ее параметров. Как в первом, так и во втором подходе смешанного оценивания широкое применение может найти метод, основанный на априорном упорядоче¬ нии и апостериорном выборе модели непараметрическими методами из априори заданного множества моделей с последующим параметриче: ским оцениванием всех требуемых характеристик. Особый интерес в этом случае' представляет метод бйблиотеки вероятностных моделей, предложенный автором данной книги для совместного решения задач идентификации, многофункциональных статистических измерений и мо¬ делирования. Под библиотекой моделей понимается упорядоченное мно¬ жество моделей,’ удовлетворяющих требрваниям полноты, минимальной' избыточности, уровня описания и исследования в приложении к кон¬ кретной предметной области. Данный метод основан на априорном 88
Табл.ица 2.4. Некоторые достоинства и недостатки параметрических алгоритмов статистических измерений I 3 ш CD Я CQ ф н Ф W. М_ » о0, я >* § ■° 5 ё-1- g-s Си о Я & 0 я 1 - ® я 4 £ .'О * а \d я я I s !■§•■§ «18 8 2 *g«3H Ю £, О -Р-. 2 « * 2 Й S ю s 3 5 о S 5' я а я 8 А Й ПИ 9 ^ os«sgg ю й ° я -f § Я <N g Я Я Си Я Си .оя я я ф ^ о ® з г *1 S1 ха Я S Я о со ® н I я са н S ф я 03 * « CD So, <d a £ * О <u -.1 2 ® я C S' w О * a Я»Я gw S Sjj-g o 3 2 и Я w о 5 я R 2 О R О ф С |is ! * g I.?.» * § £ CD Я О ф § н о Э « Й. S- 8 S В О хо »я S а о я а) о о я я • »я ia* со ■ Я 1 о СО « х 1* § I - ча Л% 1*2 5. Я м «si 2 * § Ssg- л) Г? я ^ 2 Ч Ф S са. о >» Я 2 й н Я н 9Я CJ я О Я CD CQ ХО Я 5Г О 4) со о я a • я I § Я 2 « я о §1 е <U Й 5 Я О Я си0 <-> lil Is* 2-S х Sgg я 6 ф cuS йГ CD S я хо Си о С -• я 35 я я Е’Я §3 ° Си О 2 * § SL О О Ь О) О Л ° 2 S"'S * CU Оо СО о «°gs .» И ° о к я s " я «* Н ^ Й _ о К ” я О я S я -Я »Я я 3 я g я Я £ Я 2 Я о. 2 CD Я 4). (D s g в си * с CD 9Я ш я н в О О) а) ч Я 2 v s й ш и >» Я в СО я ID <-> £ я о а. Я 2 Я си» ю g-S - м н ° я CD S 2 w и >* Й а н ^ СО О Я *-• са м 5 8 £ « к «=; еа Я М У f- Я о _ ф rt Ss4 г* Л Я са &-1 ft 2 ll §i§ a s я ИМЯ 8&d * s H Си я d> ^ H я я Я M Л‘Мо Си « х я _ я s= са О ® я 40 2 К н си ф 2 >» Я 'о £2 . Hi я ,_ч ф си н я о О* и — о я я я а я ф ь •Ь я «* в Н = 1ё i § 4 S 2 « So® S я я ^ ^ я з 3.S § 2 в 5 О g a ха 2 § 2^ |Ш s-sl^ a g.Is 1о Л Си а- 2 с о я о н о я R Л о н н <-> 5 CD >»Й со* 2 Л §s Ss- Я Я я й) m °- 5 <D < g.s о 2 VO s з ф я я- са н к ® в я I* Ф X я з S я м я a си ЗЭ ф S -> СО Г 53 са - 2 а? Я « §® 'О W Си сь 2 о Я С3‘' g" S Й я я н.зд J3 са си .Я ;«- о 89
90
упорядочении моделей, допускающем их формальный * автоматизиро¬ ванный (формально даж$ автоматический) выбор при идентификации; полноте и минимальной избыточности моделей внутри одной форми¬ руемой/ априори библиотеки и поливариантности за счет применения нескольких бйблиотек; наличии аналитического описания и априорной исследованности свойств всех характеристик из области интересов исследователя для каждой из моделей библиотек; явном выделении базовых характеристик, базовых моделей, а также алгоритмов оцени¬ вания их параметров; многофункциональных параметрических измере¬ ниях всех характеристик по (2.50); имитации модели методом элемен¬ тарных функциональных преобразований базовых моделей. Желатель¬ но, чтобы используемые при этом характеристики и алгоритмы стати¬ стических измерений были однородными ^(лучше одинаковыми) при решении задач идентификации, измерений и моделирования. Смешанное оценивание в этом случае осуществляется путем- апо¬ стериорного автоматизированного (или автоматического) выбора па экспериментальным данным простыми .непараметрическими приемами модели случайного Элемента или/ и^^еряемой характеристики из априори сформированной библиотеки, оценивании параметров выбран¬ ной модели по той же выборке и выполнении преобразований по (2.50) для всех искомых характеристик. В силу полноты библиотеки найдется хотя бы одна модель, соответствующая выборке, а в силу минимальной избыточности таких моделей может быть одна или в худшем случае дье-три соседние. При. этом возможны- небольшие погрешности, вы¬ званные ошибками классификации. Целесообразность использования смешанных методов • оценивания решается в каждом конкретном случае с учетом достижения принци¬ пов, изложенных в § 1.2. Так, если необходимо обеспечить минимально возможные значения дисперсий D{Q}, то следует сопоставить дисперсии возможных непараметрических и параметрических оценок для задан¬ ного множества моделей. Затем сопоставлением дисперсий оценок с учетом других показателей качества оценок и приемов уменьшения дисперсий выявляется целесообразность параметрического, непара¬ метрического или смешанного оценивания. Глава третья Алгоритмы, связанные ^дискретизацией аргументов 3.1. СПЛОШНЫЕ И РЕШЕТЧАТЫЕ АЛГОРИТМЫ Рассмотрим данные алгоритмы на примере характери¬ стики rQ (О) .скалярного а^умента О. Обобщение на случай векторного аргумента не представляет трудностей. 92
Согласно признаку 7.2 табл. 1.3'сплошные алгоритмы характеризуются непрерывным изменением аргумента б в- процессе измерения Q (б), а решетчатые — дискретным. Технически непрерывность изменения б -может обеспечи¬ ваться по-разному. Например, в измерителях с геометри¬ ческой оптикой кривая Q“(О)' получается синхронно для заданного непрерывного диапазона •б, т. е. все значения б- присутствуют синхронно в процессе усреднения (контину¬ альная параллельность при измерении Q(б)). В измери¬ телях, реализующих ОР-оценивание .с последовательным аналоговым выводом, последовательно или параллельно во> времени аналоговыми или .цифровыми средствами измеря¬ ются коэффициенты разложения щ, затем аналоговыми средствами вычисляются Q по (2.43) с последовательным, непрерывным изменением б. Наконец, Q(6) может изме¬ ряться- аналоговыми или цифровыми средствами при по¬ следовательном непрерывном в процессе усреднения (ди¬ намический алгоритм) изменении в требуемом диапазоне ■аргумента б. . В связи с широким внедрением цифровой техники в. последнее время большое распространение'получили ре¬ шетчатые алгоритмы. Им свойственно измерение по экс¬ периментальным данным конечного числа п значений •Q (б). Эти значения-получаются в эквидистантных (т. е. равноотстоящих с шагом Аб,=бг+1—6i для всех ■(= 1, п) или в неравноотстоящих (Дб« зависит от i) точках бь б2, ..., б„ — значениях аргумента б. Если необходимо знать значения <Q(6) при других значениях б, отличных от бг,.£=1, п, поступают следующим обра1зом. ^Вариант 1. Повторяют измерения Q(6), получая йх при требуемых значениях б. Реализация данного вариан¬ та в конкретных условиях не всегда возможна, или целе¬ сообразна из физических, экономических, технических и тому подобных соображений. Вариант 2. Получают значения Q (б) в требуемых точках путем локальной интерполяции, экстраполяции или аппроксимации <Q (б) по ее отсчетам Q(6j), t=l, n. Вариант 3. Используя оценки <3(6t), t= 1, п, аппро¬ ксимируют «истинную» функцию Q(6) некоторым удоб¬ ным аналитическим выражением, для которого вычисление (Q (б) в требуемых точках с нужнрй точностью не вызы¬ вает затруднений, т. е. осуществляют глобальную аппро¬ ксимацию. Подобная аппроксимация мбжет выполняться на основе методов параметрического или смешанного оце¬ " 93
нивания, когда в качестве исходных-данных используются значения Ф(04), в частности на оенове методов ЗХ-, ЧХ:, НК*, НМ-оценивания [52, 73]. Возникает вопрос: «как и в каком диапазоне при 'из¬ мерении Q (0) изменять значения аргумента ■О?». Ответ на. данный вопрос в общем биде не может быть однозначным. Он зависит от нескольких факторов:_от требований, кото¬ рые предъявляются к оценке Q (•O') конкретными приложе¬ ниями, потерями в приложениях от замены Q (O') на <5 (О), которые тем меныПе, чем ближе Q (О) к Q(0) в соответ- ’ствующей области значений O'; от затрат на измерение <3(0), которые, как правило, тем больше, чем ближе <3(0) jc Q(0), и зависят от того, насколько рациональна орга¬ низация измерений, в частности от того, насколько пра¬ вильно выбраны параметрический, непараметрический или Смешанный метод оценивания, комбинированный метод •[28, 101], планирование эксперимента и т. д. Вот некоторые примеры, поясняющие вопрос. Первый пример. Согласно требованиям приложения точность измерения ф(Ф) может быть одинаковой или разной в смысле принято¬ го критерия во всем требуемом диапазоне значений Фе[Фи, Фв]. Второй пример. Пусть Q(Ф) представляет собой колебатель¬ но-затухающую функцию вида ехр {—а|Ф|} cos ОРО), <х, Р>0. Тогда вместо измерения по непараметрическому алгоритму п равноотстоящих вдоль Ф отсчетов <3(Ф) значительно дешевле при обеспечении_той же точности может быть параметрическое измерение, т. е. измерение а и с последующим вычислением <2(Ф) при подстановке вместо а и Р* результатов их измерения хх, р, либо можно использовать непарамет¬ рическое измерение, но отдельно огибающей ехр {—а|Ф|} и несущей cos (РФ) в разных диапазонах изменения Фис разным шагом измере¬ ния АФ с. последующим наложением полученных результатов. Ответы на поставленный вопрос при этом будут совершенно различными. Третий пример. В приложении требуется не <3(Ф), а значе¬ ние Фо, соответствующее максимуму ф(Ф)*по Ф. Например, в случае линейчатых спектральных плотностей мощности интерес представляют только значения частот гармоник сигнала. В этом случае нас должны интересовать в основном частные значения <3(Ф) в окрестности точки Ф0. При этом смещение и дисперсия 0^(0) будут представ- Q Q лять интерес лишь с точки зрения сохранения формы кривой <5(Ф), а не 'ее абсолютных значений. Более того, может оказаться целесообраз¬ ным искусственно «ввести смещение», перейдя от <2(Ф) к новой харак¬ теристике, по оценке которой % определяется более точно при пример¬ но тех же или меньших затратах. В этих случаях опять-таки ответы на поставленный вопрос будут совершенно различны. 94
В дальнейшем будем полагать, что измерению подле¬ жат именно значения .Q (О) в диапазоне de[dH, flB], опре¬ деляемом приложениями. Обычно Фн и Ов определяются из условий вида (1.46), (1.47). В этом случае закон измене¬ ния Ф следует выбирать из условия выполнения заданных требований к качеству воспроизведения Q {&) по ее отсче- там. Эти требования могут задаваться в терминах мате¬ матических* ожиданий, дисперсий, корреляционных функ¬ ций и прочих характеристик оценок, например требования типа непревышения соответствующими мерами близости функций наперед заданных значений. Наиболее часто же¬ стким является требование, „основанное на локальном рав¬ номерном критерии приближения в терминах математи¬ ческих ожиданий, т. е. чтобы максимум модуля ошибки воспроизведения математическим ожиданием оценки оце¬ ниваемой характеристики не превышал заданного г гранич¬ ного значения. Математически это требование можно за¬ писать в виде V, = I (ft)/max Q(ft) | <Ц4 (*), у» [ft„. ftj, (3-1) Q & v2=|<U(ft)/Q(ft)|-<МН ¥»&[»„. »«]. (3.2) где |4, Ъ — заданные значения для каждого ft, определяе¬ мые требованиями приложений. Чаще всего полагают, что ?4, Is не зависят от ft. Вторым часто используемым требованием является требование малости дисперсий или среднего квадрата ук¬ лонений оценок: интерполяция или аппроксимация не должна вносить заметных увеличений дисперсий или сред¬ них квадратов уклонений оценок по сравнению с анало¬ гичными погрешностями в узлах решетчатой оценки. Именно подобные требования мы будем учитывать при исследовании различных алгоритмов оценивания. Пусть оценка $(ft) при ft^ft,-, i=l, п находится по &-И -ординате <5 (ft») решетчатой оценки <3з (ft) путем пре¬ образования §(»)=шо>*.)..... Q(4); н 1 (3.3) ft €• ft*’fc]> *s:=^> s — 0. k. Тогда к погрешности решетчатой оценки <3(ft), значе¬ ние которой можно- было бы найти для точки ft, добавится дополнительная составляющая, 'обусловленная видом пре¬ образования Эта добавка может уменьшить, увеличить 95
или оставить без изменения погрешность (смещение е(б), срёДнекв’адратйчёскоё отклонение о^ (б) и т. п.) оценки Q-" Ф(б) характеристики Q (-O') веточке 'д. Этот факт необхо-, Дймо учитывать при определении’-закона изменения б1 йри‘ заданных требованиях к оценке (например, к е!(б), <з~(&))_ или при определении погрешностей (в, о) при заданном законе изменения б. Допустим, что / есть линейное относительно <3 преоб¬ разование Ьь. Оно'имеет место- при использовании интер¬ поляционных полиномов Лагранжа, Ньютона, конечного ряда Котельников'а и'т. д. [73, 90, 121, 152, 153]. В этом случае смещение е~(б) оценки Q (б) будет-определяться выражением = + (3.4) Ч(Ъ)=ЬАЩЩК)} M{Q(в**); ^}]-M{Q^)}. (3.5) Следовательно, при линейном преобразовании ординат ф(б,) смещение оценки (3.3) в точке б будет Определять¬ ся смещением решетчатой оценки <2 (б) в той же точке и добавкой 8ь (б), определяемой выражением (3.5). Исполь¬ зуя (3.4), можно при заданных ограничениях или 1>2*=£Е5 либо определить б; (т. е. б и число ординат л или шаг измерений Дбг=б,+1—б< решётчатой оценки Q(6) для всех i=l, л, б/е[бн, бв]), либо найти б’ь бг при заданных (ИЛИ б|, Л, lA6i) . Если при этрм. выбирается постоянный шаг измерения 1Дб<—Аб, не зависящий от i, то число, л измеряемых орди¬ нат решетчатой оценки можно выбрать из: выражения л—1=(бв—бн)/Дб, а Дб — из требования Oi^U-h.jjh рг^ '^gs. Использование .же неравномерной дискретизаций, когда Д6i определяется для каждого Гпз условия или -02^15, может позволить существенно уменьшить л [90, 121]. * В тех же случаях, когда точные4 значения вь и bq рас¬ считать невозможно или затруднительно,, но можно рас¬ считать, или оценить сверху |ei,| и |«^|, вместо (3.4) сле¬ дует воспользоваться неравенством / I •g.W I < I et(6) I + I Sq-W I ^ (3.6) 96
Для несмещенных оценок Q (Ф) второе слагаемое в (3.4), (3.6) отсутствует, а первое определяется по (3.5) при M{^(-e’)}='Q('6). Если ф(Ф) — смещенная оценка, то обычно стремятся к тому, чтобы значение не превышало нескольких' сотых долей. Если это выпол¬ няется, то sl('Q') может быть подсчитано по (3.5) с заме¬ ной М{<5 (fO*) на Q (■&), что и лежит в основе большинства рекомендаций к выбору числа ординат решетчатых оценок [32,77,85,111]. В большинстве случаев линейная по отношению к <3 (’fl'i) аппроксимация решетчатых оценок осуществляется по небольшому числу (£+1) ординат Q ), ts=l, n^~s— =0, k, когда преобразование Lh имеет вид обобщенного полинома к Ш= 2Q(4> *.(*)• (3.7) 5=0 где фа('в') ^- некоторые заданные функции. В этом случае в терминах смещений задача наилучшей аппроксимации <5(#) по отсчетам Q($i) сводится к чебышевской задаче нахождения полинома наилучшего приближения по точ¬ кам функции М{<3(Ф)} функцией М{<2((0)}, определяемой (3.7) с заменой Q и Q их математическими ожиданиями. Как известно (см., например, [121]), значение p=min L, где minL — это минимум L — sup | е,(&) | для & [0-1-0, &,• * будет обеспечиваться, если eL (&) образует Чебышевский альтернанс на множестве из К-{-2 точек &(*+,)€= €=[&<.>• в которых поочередно достигается равенство е(Ф)=р или е('в')=—р. Чисдо % точек, в которых ei/(6‘) может принимать максимальные значения при соблюдении условия чередования знаков ez, (■&), называется показате¬ лем качества приближения [121]. При наилучшем прибли¬ жении X^k-j-2, в других случаях X<k-j~2. При аппрокси¬ мации, особенно при адаптивном изменении шага Дд^, не¬ обходимо добиваться наибольшего возможного значения \ Это позволяет получать меньшие значения вь(Ф) при 'заданных Он, #в и п либо меньшие значения п или боль¬ шие значения шага измерения |Д1бг при заданных г&н, б’в, 7—192 97
При расчетах на худший случай следует брать' Х= При постоянном шаге измерения IM, т. е. при равно¬ мерной дискретизации Q (Ф) по 'б, максимально допусти¬ мое значение шага АФ при заданном ограничении |еь (■O') |^ео определяется выражением ^m<k+Vv(k. X)*JMk+l, где v(k, А,) — коэффициент, зависящий от k, X; Mk+l = max (3.8) (3.?) Если Qm — максимальное значение |М{^ (■&)} | на рас¬ сматриваемом отрезке, а <рт — граничное значение (сре¬ за) аргумента модуля преобразования Фурье от М{<306)}, то согласно неравенству Бернштейна Mh+1^Qm (2яфт)ft+1. Значения v(k, Я), определяющие ДО- при заданном ео или lex,Ж! при заданном ДК1, приведены в табл. 3.1 [121]. Как показано в [90, 121], а также в табл. 3.1, исполь¬ зование алгебраических полиномов высоких степеней мо¬ жет дать значительный выигрыш в увеличении шага изме¬ рения Д№, особенно при малых относительных погрешно¬ стях i'b—еь (<&) /Qm (-O') или £"x,=ex,(!d)/Q(0). Однако, во- первых, этот выигрыш связан с увеличением объема вы¬ числений. Во-вторых, наиболее ощутимый выигрыш полу¬ чается при переходе от k=Q к k= 1 и k=2, т. е. при пере¬ ходе от ступенчатой к линейной и квадратичной интерпо¬ ляции. В-третьих, необходимо учитывать, что использова¬ ние алгебраических полиномов высоких порядков, давая выигрыш в увеличении шага измерений при заданных тре¬ бованиях к погрешности, приводит к снижению коррект¬ ности результатов, тогда как уменьшение степени поли¬ нома играет роль регуляризатора. В связи с этим целе¬ сообразность выбора k^2 требует проработки в каждом конкретном случае. В силу изложенных причин чаще всего Таблица 3.1. Значения коэффициента v (к, X) v {k, X) 1 2 8 12 16 15,6 24 33 98
в статистических измерениях используются значения k= =1, реже k=2. В частности, k—2 часто используется в спектральном анализе при линейчатом спектре [13]. Согласно расчетам [32, 73, 85, 103, 121] при k=\ для многих гладких унимодальных функций при ^"i^O.Ol и %4, 1б^0,01 [(см. (3.1), (3.2)] достаточно при равномер¬ ном шаге IAiO иметь несколько десятков ординат п. Для •йолимодальных кривых число п увеличивается приблизи¬ тельно пропорционально количеству мод. В [90, 152, 153] можно найти рекомендации по выбору п при других-си¬ стемах функций ф(Ф). Вторым часто используемым показателем, который не¬ обходимо- учитывать при выборе |ДЮ и k, является диспер- ция оценки. Для оценки (3.7) дисперсия равна k k 4W= S (4)Psr?sW?r(H (3.10) i=0r=0 где psr — значение коэффициента корреляции между Q(bis) и Q(&«r). В частности, при линейной интерполяции, когда (*») = «*. Ры+1 = Р. (&-&,)/А&г = а, (3.11) имеем $(&) = aQ(9'i+i) + (1—a)Q0h). (3.12) — а)го? + 2а(1 — а)рогог+1. (3.13) 2 2 При малых Д&,- ог яа о;+1, ря« 1, имеем (&) ^ ог. В тех же случаях, когда при малых Д9-г o( ?«oi+1, но р <=а« 0, имеем о1(&)>«(1 — 2а-|-2аг)о/, т. е., учитывая, что 0 < a < 1, получаем О.бо^ < о^(&) < о? — использование ин¬ терполяции позволяет получить дисперсии оценок ФОв) не хуже, чем если бы находилась решетчатая оценка ^(й’). В заключение отметим следующее. 1. Ранее всюду подразумевалось, что Q(O) имеет смысл, когда Ф пробегает непрерывное множество зна¬ чений в диапазоне [^н*\ ^в]. Однако для некоторых характеристик (распределения дискретных величин, корреляционные функции последо¬ вательностей и т. д.) Ф принимает дискретное множество значений. Для 7* 99
них все изложенное в данной параграфе остается справедливым, если полагать, что значения и совпадают с разрешенными значениями, и от производных перейти к конечным разностям. Решетчатость оценок понимается здесь в том смысле, что они находятся не для всех т раз¬ решенных значений О, а только для я<т значений. Оставшиеся т—п значений могут быть восстановлены по п ординатам решетчатой оценки. 2. При измерении характеристик Q (O') векторного аргумента Ф= «={0i, д2, •&„} желательно К дискретных значений аргумента О выбирать так, чтобы проекция их на каждую ось также давала К дис¬ кретных значений каждого аргумента ■О;, i= 1, п. Для этого можно значения д выбирать на основе Л Непоследовательности Соболя [114]. Наконец, заметим, что восстановление сплошной оценки по решет¬ чатой может осуществляться также методами фильтрации [67, 77]. 3.2. НЕПРЕРЫВНЫЕ И ДИСКРЕТНЫЕ АЛГОРИТМЫ Рассмотрим данные алгоритмы на примере траектор- ного ЭХ-оценивания ансамблевой характеристики Q (О) стационарного по отношению ко всем используемым в данном параграфе характеристикам ^-мерного случайного процесса X(t) при фиксированном значении fl. Замечания по обобщению приводимых результатов будут даны в. кон¬ це параграфа. Будем полагать, что векторный аргумент О включает в себя все скалярные аргументы функции Q(-), в том числе и временные сдвиги t={ti, Тг, . -., ts_i}. 1 Если физический траекторный усреднитель представ¬ ляет собой стационарную линейную систему, то непре¬ рывная траекторная ЭХ-оценка Q (О) характеристики Q(d) может быть представ'лена в виде t t О/ (ф) = \ а (е — и) 8 (и)du = f а (и) g {t — и) du, (3.14) о о а дискретная — в виде /1—1 4(О) = м 2 а[(п- ОЩ£(Ш), (3.15) 1=0 где a(t) — импульсная переходная (весовая) функция ус¬ реднителя, £(«)=£<г [*(«): ♦] ^ £(«) = £<*[•*_(“): •]; (316) §(•) отличается от g(-) заменой в g(-) ансамблевых ха¬ рактеристик их оценками, a \М — шаг (интервал) дис¬ кретизации по времени всех составляющих Xi(/), 100
* ..Xh{t) процесса X(t). Понятно, что g(t) есть траекто- рия процесса G(<) = gQ [Л-(f); <►]. В дальнейшем поло¬ жим для общности, что М {G (^)| = q (д), где q(b) не обя-. зательно равно Q(d). Выражения (3.14), (3.15) являются обобщением (2.39) — (2.42) на случай, когда длина t ин¬ тервала '[0, tf] наблюдения X(t) является переменной и изменяется синхронно с экспериментом. Если интервал, на котором производится измерение Q(d), постоянный для каждого значения Ф и имеет длину Т, то (3.14) и (3.15) переходят в (2.33), (2.40) —(2.42). При измерениях с предварительной регистрацией x(t) на интервале [0, Г] без периодизации x[t), когда ft содержит временные сдви¬ ги Ть ..., Ts_i, фактически используемая длина t будет меньше Т и равна Т—тм, где Tm=|ti|V ••• VIT«^i| — максимальное из чисел |п|, ..., Полагая T=*N№, отметим, что в последнем случае дискретному алгоритму будет соответствовать фактически используемое число п отсчетов, равное N—vM, где vM=|vi|V ••• Vlv«-i|» v»= =Ё[тг/А<]—целая часть частного Tr/Af; тг — временной сдвиг между последовательностями отсчетов х (iNt) и х [(t'4-vr)Atf], t=0, ..., N—vr, г=1, s—1. В дальнейшем для конкретности будем полагать g=g, Ata[(n—i)A/]=af. Тогда из (3.14), (3.15) имеем ^ t MjQ^O)} —<7(0) ^a{u)du, (3.17) О п— 1 м (0)} = ?(<►) 2 (3-18) <=о Отсюда получаем достаточные условия несмещенности оценок (3.14), (3.15) в виде ?(ф) = <2(*), 1 (3.19) | a(u)du= 1, ^ = О г = 0 Используя известные приемы ([6,21]), нетрудно полу¬ чить корреляционные функции рассматриваемых оценок: t %(*!• **)= $(*-1- I u\)R0(u: «■„ Ъг)3йа(u)dus^ * —t t < I I Rg (u; dlt 02)®в(и) I dut (3.20) —t 101
л—1 ♦,)■= У. (я- | i\)Ra (Ш-, *„ da)^o (Ш), (3.21) л /=-(п-1) Цде /?с(ы; di, #2) =i#g (—ы; й2, tfi) — взаимная корреляци¬ онная функция процессов Gi(jt)==gQ [X(/);■, tfi] и Gn{t) = —<7q [.Х(0> #2]’> $Ц(и) и t@an(i№)—(траекторные) кова¬ риационные функции непрерывного и дискретного усредни¬ теля, заданного на интервале [0, t), т. е. 1 f'F‘ $Ц(Х)— ^ | х | ‘ J а (и) а (и -f- I z\ )du, (3.22) о л- 1 к | + 1 33aJkAt) = J] (3.23) 1=0 В ряде случаев выражения для корреляционных функ¬ ций оценок удобнее иметь через частотное представление. Пусть j4t(iG>), Лп(со), Ап (у) — частотные характеристики непрерывного и дискретного усреднителей, рассматривае¬ мых на интервале времени [0, /), а именно: t ЛДю) a{u)e~i<mdu, | <о | <о°; (3-24) о Ап (») = аке~1аШ= ^ (3-25) k—0 k=.—00 л—1 4.(v)= 2 lv|<«; (3.26) k=0 00 So (rn; fl2) = j‘ Ro («; г%) е~Ыdu; (3.2*7) —00 oo 5од(ш; *lf Ъ2) = Ы 2 Ro.{kUi dj, tf2)X &=■—00 х«ч"= £ *.); (3-28) k——CO 102
SaA(v; 0„ fl2) = 2 R0(kU;*v v /=/-1. (3.29) k=—co Тогда (3.20), (3.21) можно преобразовать к виду 00 £t~(^i. 0*)='^- f I A HI*Sofa; 02, ti2)d«>, (3.30) Qt 2n J —00 00 RQ (#** ^)==_£T 1* 1 4* И 1*4 fa: #*» ^dco* (3-31) —oo 1C R$(K •.) = -£- j 1 A.WSo^v;-*,, OJdv. (3.32) —ic Полагая 0i=#2=0, из (3.20), (3.21), (3.30)—(3.32)' получаем дисперсии оценок <5t(#) и Qn (д) в точке •О. Согласно принципу Па мы должны стремиться так'выбрать a(t)> at и Дt, чтобы при заданных t ,и п для всех интересующих нас значе¬ ний Оь #2 значение | #^(0ъ Oi) | было минимальным. Эту задачу можно решить в общем виде, используя известные приемы [21, 22]. Так, например, при фиксированном Дt минимальной по a(t), at дис¬ персии 02 (О) соответствуют оптимальные функции a(t), Л*(<а), опт Лп(со) и коэффициенты а», получаемые решением уравнений t 00 j а (и) Ra (т— и; d, d) du — —gp [ eivoAt (<о) SQ (to, d, 0) = 0 —oo = ®опт(^i> (з.зз) N—1 oo J] aiRo К* - О Д<; *. *1 = j е1*шАп (<o) SQ («, <►, 0) dco = 1=0 -oo = °опт* ft==0, n—1, (3.34) при ограничении (3.19), т. e. при Л*(0) = 1, Лп(0)=1. С другой сторо¬ ны, фиксируя вид функций a (iAt), можно для заданного интервала [О, tf] найти значение At, обеспечивающее минимум значения дисперсии оценки, который может быть меньше дисперсии непрерывной оценки, однако не меньше дисперсии оптимальной непрерывной оценки [21, 22]. Можно, конечно, решать задачу одновременной оптимизации вида функ¬ ции a (iAt) и значений At. Однако, во-первых, как показывает анализ (3.33), (3.34) и известных результатов [21, 22], оптимальные решения 103
требуют знания априорной информации о- характеристиках более слож¬ ных, чем измеряемые. Во-вторых, решение, оптимальное при одних пред¬ посылках, может быть далеко не оптимальным при нарушении этих предпосылок. В-третьих, преимущества, полученные при оптимальном усреднении, проявляются по сравнению с более простым и универсаль¬ ным асимптотически (при Г-^-оо) оптимальным усреднением в основном при небольших объемах данных, когда дисперсия оценок D{<2($)} составляет десять и более процентов от дисперсии D{G, (/)} процесса, G(0, причем разность между дисперсиями оптимальной и асимптотиче¬ ски оптимальной оценок зачастую невелика. Наконец, необходимо учи¬ тывать некорректность оптимальных оценок, проявляющуюся в том, что различные критерии оптимальности приводят к различным оптималь¬ ным оценкам [106]. Небольшое нарушение условий, при которых су¬ ществует оптимальная оценка, может привести к существенному отли¬ чию результата оценивания от оптимального. Поэтому (см. также [21]) оптимальные усреднители имеет смысл вводить лишь при дорогостоя¬ щих экспериментах совместно с другими приемами понижения диспер¬ сии оценок, а также при определении потенциальной точности для сравнения рассматриваемых оценок с оптимальными. В большинстве случаев следует использовать асимпто¬ тически оптимальные усреднители, а вместо (3.20), (3.21), '(3.30)—(3.32) использовать более простые, приближенные формулы, требующие меньшей априорной информации. Рассмотрим некоторые подобные результаты. - а) Обозначим через [#]опт минимальное значение соответствующее оптимальным a(f), а*. Тогда, пред¬ ставляя правую часть (3.20), (3.21) в виде двойных ин¬ тегралов и сумм и применяя к ним неравенства Коши — Буняковского — Шварца, получим для любых a{t), щ |Jfe(*,. »2)U< *.)1< < \ J а2 (и) | Rg (и — х; $2) I dud% X Lo о t t '*11/2 X \ f а2 (и) | Rg {и — х; &2, I dudi (3.35) 1/1-1 /1—1 *11 S 2<*г2 Ra[(i-k)At; #lt О, X i=0 k=0 J I n—1 n-1 *11 /2 X s 2 «I* I Ra [(i - k) д/; к dj | (3.36) /=0 /5=0 104
б) Положим, что при достаточно больших t плотность SG (со; дь 'в'г) можно считать практически постоянной в полосе пропускания усреднителя. Тогда из (3.20), (3.30) приближенно будем иметь t ^(^1. ^*)^5о(0; *1. ®г) J О* («)<*“ = 00 = -L. So (0; d2) j I At (ю) Is dm. (3.37) —00 в) В противовес предыдущему условию положим, что Rg(u; di, ^2) есть периодическая функция с периодом F0, зависящим или не зависящим от *Оь #2, т. е. 00 Ra{u; d2) = <7*ехр (j ~рт~ UJ, (3-38) k=—co где <7ft='<7ft(fli, Ф2). В этом случае из (3.30), (3.31) получаем 00 \ (*, *,) = 5] Ян \ Af (-^) |*. (3.39) /г=^—оо V*- ®*)= S ЧЧ^)Г = Ё ^И“(!й)Глз-40) £=—00 k=—CO где Jfo=Fo/At. г) Наконец, допустим, что Gi(0 и <32(Н~Ы) нёкорре- лированны при u=kAt, k=±\, ±2, ,.либо при |и|^Д^. Тогда из (3.21) имеем R* (♦.. *.) = Яо (0; ♦„ «2) 2 а,*. (3:41) Чвк <=0 Если для оценок Qt (Ф) и Qn (O') справедливы формулы (3.37), (3.41), то прй выполнении условий (3.19) и усло¬ вий t П—\ lim f d2 (и) du — 0, lim 2 ai — 0» (3-42) ^°°J п^со " такие оценки будут несмещенными, состоятельными 1 Заметим, что в общем виде для состоятельности оценок (3.14), (3.15) условия (3.19), (3.42) являются необходимыми, но не достаточ¬ ными. Достаточным условием при выполнении (3.19) является сходи¬ мость к нулю D{<2(0)}. или правых частей в (3.35), (3.36) пра t, /1-^оо. 105
Рассмотрим4 усреднители a{t) и а* вида а(«) = | 1/Г при Ь<и<Т. I 0 при ы<О, ы>Т; I 1 /N при О i N — 1, °1 { О при i < О, / > N, т. е. а(«) = 1 /Т[!(«) - 1 (и - Т)] = 1 /71 {и <= [0. Т]}, \ аг = 1 /N [1, (i) -1 (i - N)] = 1 /М {/ e [0. N - 1]}, j Где 1(*) = {0; лг<0; 1; x^O}; 1(Л) — индикатор собы¬ тия A. Для них выполняются условия (3.19), (3.42). В случае а) эти усреднители обеспечивают равенство в правой ча¬ сти (3.35), (3.36) при Rg(')^0 и 01—02=0; в случае б) они соответствуют минимуму по a(t) правой части (3.37) ,' т. е. асимптотической оптимальности оценок по о; в слу¬ чае г) — минимуму по сц (3.41). Если же спектральная плотность мощности процесса G(t) непрерывна в нуле, то весовые функции (3.43) обеспечивают всегда асимптоти¬ чески минимальную дисперсию в классе всех оценок вида '(3.14), (3.15) [116]. Поскольку усреднители (3.43) при t^T и ti^N соот¬ ветствуют ^rW=i-rW = -,l"ff21 exp { —if}. (3.44) Ап (со) = Ln (со) = Д^п (со^/2) W N sin (юД1/2) A x exp | — ia'N— At| = yljv (v), V = 0)Дt, (3.45) в случае в) при t и пМ, кратных Fx>, а также при N, крат¬ ных Л’с, и At, не кратных Fo, R^ (0i, 62) будут принимать нулевые значения при любых 61, 02, в том числе для дис¬ персий оценок о^. (б), т. е. при 01=02=0. Именно эти обстоятельства приводят к широкому при¬ менению усреднителей вида (3.43). Заметим, что в тех¬ ническом отношении более простые решения могут'быть получены при других видах усреднителей. Значения /?^(0„ 0j) и о^(0) для «их могут быть оценены по при¬ веденным формулам (см. также [22, 85, 111]). 106
Для усреднителей (3.43) в (3.20), (3.21) необходимо подставить Ша{и)=Т~^, $„д(м) =N~2, а в (3.30)—(3.33) подставить выражения ЛДч») и Ап (со) из (3.44), (3.45)' и заменить t, п на Т, N. При выполнении условия б) или При интегрируемости |/?с(и, бь б2) | имеем асимптотиче¬ ски см. (3.37) IU (б,, 6,)«*JLy7to(0; б„ б,)До(0; б„ б,) *00(6,, б,) = 4j> А = ~Sa (0; б„ б2), (3.46) а при суммируемости |/?<?(Ш; бь б2) | имеем асимптоти¬ чески 00 R(б„ б2)~^- £ Ro(iAt; б„ б2) = ^ /=— GO =fS *•)• (3“7) k=—00 где T=NAt,_ a Toc=tog (бь 62)/pG(0; бь б2) находится по приведенной (нормированной при $i=62==6) корреляци¬ онной функции рс(т; бь б2) =RG (т; бь б2)//?с(0; 6i; б2), Rg(x\ бь б2) =gg(6i)ctg(62)pg(t; 61, б2). В общем.случае всегда имеем из (3.20) V*’ ^<tRg(0; (3-48) Формулы (3.46), (3.47), особенно их правые части, удобны для экспериментального определения оценок Rq с помощью аппаратных и программных средств (см., например, [15]). Отметим, что правые части (3.46), (3.47) неприемлемы, если нарушается условие б), в частности если Sg (0)=0. В этом случае, используя разложение SG (<о) в ряд Тейлора, из (3.30), (3.31) можно получить более точные приближения, обобщающие известные [87] результаты. Любопытно отметить, что, как следует из сопоставле¬ ния (3.46) и (3.47), для процессов с финитным спектром Sg (со; бь б2) с граничной частотой б>о=2л/о условием эк¬ вивалентности в смысле равенства дисперсий непрерыв- 107
ной Qt и дискретной QN оценок Q является выполнение неравенства Af>2jt/<s>o=l/|fo. Это условие эквивалентности в измерении среднего отличается от условия A^l/2/о представления по Котельникову процесса G(t) его рав¬ ноотстоящими отсчетами. В практике статистических измерений представляют интерес три возможные случая ограничений: 1 — только на Т; 2 — только на N; 3 — на Т и N вместе. В первом случае целесообразно при заданном ограничении на Т вы¬ бирать N=TjAt, так чтобы оно было как можно меньше при условии, что коэффициент увеличения корреляции (дисперсии) дискретной оценки по сравнению с непрерыв¬ ной ar(At)=R^ (At)/R^ превышает единицу не более чем на заданное значение. Во втором случае желательно иметь Т как можно меньше, т. е. при заданном N. выби¬ рать такое At, чтобы коэффициент увеличения корреляции (Дисперсии) дискретной оценки за счет коррелированно- сти усредняемых отсчетов ajv(A<)=^^ (А<)/^$'к не пРе* вышал единицу более чем на заданное значение или был меньше единицы. Здесь ^очк== значение корреляционной функции оценки Q, получаемой- по некоррелированным отсчетам, т. е. зна¬ чение функции, определяемой выражением (3.41), когда вместо суммы а2, берется 1 /N. Третий случай является промежуточным между первым и вторым и предполагает соответствующее компромиссное решение. В случае, если справедливы формулы (3.46), (3.47), асимптотически имеем (см. [40, '45]) ОО -1 аг(Дf)«s>-T= Ро(г^’ ^г) I = 2тоо I. ^ J =*+ (3,49) /=—00 ajv(A0^fi+ р0(ш’ #*)] = —(З-50) ^ /=—оо am(tt) = %вк(0„ «.)~М12\0> (3.51) где Sq (да; О,, 02) = So (да; VI,, 02)/5о (0; ч%) 108
ToG=ToG(tfb ^2) — радиус приведенной (нормированной для #1=^2) корреляционной функции 7>g (т; #2) = #g(t; <h, 0‘2)/i/?g(0; <h, дг) процессов Gt(t) и G2(t), а штрих означает исключение слагаемого при (=0. Коэффициент анк {At) показывает, во сколько раз кор¬ реляционная функция оценки, найденной усреднением по некоррелированным отсчетам, больше корреляционной функции непрерывной оценки. Для приближенной оценки значений ат(А/) можно воспользоваться неравенствами 1^а,т (А/) ^ 1 -hA^/2toG. (3.52) Если Pg (•) ^0, то левое неравенство в (3.52) можно заменить более точным: ат (At) ^A//2tog. (3.53) Существуют процессы G (i), для которых в правой части (3.52) достигается равенство в точках At = 4kz0Q k=\, 2, 3, Это процессы с равномерным в ограниченной по¬ лосе (—«во, <оо) спектром. Данные результаты иллюстри¬ руются рис. 3.1, 3.2 [40], где to,osg — интервал корреляции •на уровне 0,05 функции рвЫ Ф2). а номера кривых Ч 1,6 V 1,4 7,3 Ч 7,7' \ Т = const, N = vav s V 2х06\/ fik, ./ Г 2УУ J 1 1 » 1 0 12 3 Ч Л i/fog Рис. 3.1. Зависимость коэффи¬ циента увеличения корреляции оценки \Г~ат -от отношения Л//Тов 0 0,25 0,5 0,75 7,0(П/*о?<,ге Рис. 3.2. Зависимость коэффи¬ циента увеличения корреляции оценки |ЛГг от отношения А*/Т0,05 о 109
соответствуют корреляционным функциям р0(т; <h, Ф2) вида Р. (т) = W. Р2 (•') = р3 С1) = cos (Ях), Р* (•') = е~ cos (Ях), р5 (х) = sin (рх)/рх. При этом Т одинаково для непрерывных и дискретных оценок. Неравенства для «г (А/) можно получить и через ча¬ стотные характеристики. Так, если спектр §в(в>) процесса G(t) мажорируется гиперболой порядка р, т. е. sg(o>)^ (2яЛ/ю) *, где р> 1, а Я— некоторая константа, то из (3.49)’ имеем ат(Л0<аг(Д0=1+2£(р) (ЯД/)*, (3.55) где £(р) — дзета-функция Римана [31]. Графики аг (ДО изображены на рис. 3.3. Поскольку при At^xoe имеем ат(Д()^1, из (3.50) вид¬ но, что при этом ан (At) ^=2то<з/Д/, т. е. art{At) обратно пропорционально At. Это иллюстрируется рис. 3.4, 3.5 при одинаковых N для оценок, найденных при произвольных At, и для некоррелированных отсчетов. /V _ Во многих случаях рв(т; д2) мажорируется функ¬ цией |рс(т; di, ^2) |<|'Р/т|^|cos (Ят) |. (3.56) Для таких процессов из (3.56) имеем [45] 1+(2р—1)2‘-*С(р) (р/Д#)»^.(Д0<1+2С(р) (р/ДОр- .(3.57) Области допустимых значений au{At) из (3.57) изобра¬ жены на рис. 3.6 штриховкой. Приведенные результаты позволяют сделать следую¬ щие выводы (см. также [32, 40, 41, 85]). 1. Интервал выборки At можно определять относитель¬ но радиуса корреляции tog или интервала корреляции t8g, например, то,osg, процессов G(t). Однако надо учитывать, что, как правило, Tog можно измерить точнее, чем t8g [15, 86, 111]. 2. При определении At по хов необходимо ориентиро¬ ваться на соотношение Д/«=*Tog. При ограничении на N это приведет к результату, близкому к оценкам, получае¬ мым по некоррелированным отсчетам, но к меньшим зна¬ чениям Т. При ограничении на Т это будет приводить к 110
2,2 2,0 1,8 1,6 1,4 1,2 1,0 T = const- 1 2 3 рис. 3.3. Зависимость мажоранты от значения (Х/ДО-1 N=const 7 = va г* 5 88^ §§§. сГ осГсэ' ЛЬЛо,05б СГсГ Рис. 3.5. Зависимость коэффициен¬ та увеличения корреляции оценки If от отношения Atfx0,-osa N = const, Т = var Г-* O'* - _ О С) са оосЗ'сЗ‘с5'сэ qJ* cTcacStS* Рис. 3.4. Зависимость коэффи¬ циента увеличения корреляции оценки |/ая от отношения А2/то о VccU 2,0 1,8 1,6 1,4 1,2 1,0 0 12 3 4 At/ft Рис. 3.6. Зависимость области значений коэффициента \f о.ц, определяемых минорантой и мажорантой согласно (3.57), от отношения Д//Р значениям N, близким к минимально допустимым, обеспе¬ чивающим ar (A£)«sl. При этом для колебательно-затуха¬ ющих корреляционных функций процесса G(t) можно At брать в «есколько раз больше Tog- 3. При определении At по To,osg необходимо руковод¬ ствоваться следующим. Если ограничение накладывается на длину реализации Т, то At целесообразно выбирать из условия (0,15-1-0,3) to,osg. Это позволяет иметь а.т {At) и избавляет от избыточных отсчетов, причем, чтобы сохранить агя»1 при минимальных Г и N, необхо¬ димо At выбирать тем меньше по отношению к To.osg, чем больше -to,osg/tog, т. е. чем больше периодов колебательно¬ 111
затухающих функций .ра (пг) укладывается на интервале [О, t0>o5g]. Наоборот, допустимо брать At больше 0,3 т0,05о» если То,о5<?/т<ю мало (порядка 2—3), т. е. для апериодиче¬ ских ро(т). При ограничении, накладываемом на N, для сохранения aw(Af)^l целесообразно At выбирать из усло¬ вия , A^(0,8-^1)to,o5g, а для колебательно-затухающих функций ра(т) из условия Afes(0,1-г-О,2)t0|05g. Это будет способствовать получению меньшей длины реализации Т при. тех же статистических погрешностях. Если же огра¬ ничения накладываются на Т и ДО одновременно, то At следует выбирать из условия Af^ (0,3^0,5)гто,osg или по одному из предыдущих соотношений в зависимости от того, какое ограничение — на Т или ДО—;более жесткое. В заключение параграфа сделаем некоторые замечания. 1. Если вместо'характеристик процесса X(t) измеряются характе¬ ристики величии X или векторов X, то мы имеем дело только с дис¬ кретными алгоритмами. При этом отсчеты корреляционной функции Pg(6At\ 02) имеют смысл элементов корреляционной матрицы для преобразования £(•) над t-м и (i*-|t&)-m элементами выборок хи *2, ..xN величины X или хи *2| ..xN вектора X. 2. Если X(t)—случайная последовательность X(iAx) или X(i)f то траекторное оценивание характеристик мЪжет осуществляться только по дискретному алгоритму с интервалом At=kAx при £=1, 2, 3..., для X(i‘At) или при &=1, 2, 3 для X(i). '3. Если Я(£)—нестационарный по отношению к Q(0) случайный процесс, то (3.17)—(3.21) должны быть изменены. Это связано с необ¬ ходимостью интегрирования по переменной t, входящей в нестационар¬ ную характеристику Q(0, t). Наличие нестацйонарностей приводит к необходимости поиска компромиссных или оптимальных решений, минимизирующих средний квадрат уклонения [25, 73, 86]. 4. Если процесс X(t) стационарен и эргодичен в среднем квадра¬ тическом по отношению к Q(0), то дисперсия оценки <3т будет стре¬ миться к нулю при неограниченном увеличении Г, т. е. такие оценки будут состоятельными оценками своего математического ожидания. 5. Как видно из (3.41), (3.45), если Д(/)— периодический процесс с периодом Fo, то при At, равных или кратных F0, дисперсия оценки Qn будет равна дисперсии процесса 6(0 независимо от N. Этот не¬ приятный факт, имеющий место также, для дискретных алгоритмов с другими весовыми функциями, вызывающий погрешности синхронно¬ сти [26], необходимо учитывать при использовании оценок Qn. Чтобы избежать этого, нужно либо выбирать должным образом At (например, по Котельникову) для процесса 6(f); когда есть априорные сведения о периоде *F0 процесса 6(f), либо сделать шаг выборки At меняющим- 112
ся в процессе усреднения по детерминированному или случайному за¬ кону. Последний случай будет рассмотрен в § 3.4.^ Наоборот, если вы¬ брать NAt кратным Го, но так, чтобы At не было кратным Го, то дис¬ персия дискретных оценок Qs будет равна нулю для всех N>>2. Обра¬ тим внимание на то, что при периодической корреляционной функции ро(т) дисперсия оценок От и Qn может убывать с увеличением Г, N, как 1/Г2, 1 /N2, для непериодических pg(t) она убывает как 1/Г, 1/ЛГ. 6. Помимо рассмотренных оптимальных оценок в литературе встре¬ чаются другие эффективные линейные (оптимальные) оценки (см., на¬ пример, [116]): на основе прогноза, решения уравнения Винера — Хопфа [см. (3.33), (3.34)] и по методу Яглома. 3.3. СТАТИЧЕСКИЕ И ДИНАМИЧЕСКИЕ АЛГОРИТМЫ В предыдущих параграфах рассматривались статиче¬ ские алгоритмы. Их характеризует постоянство аргумента в процессе усреднения при оценивании характеристик. Со¬ гласно табл. 1.3 динамические алгоритмы отличаются из¬ менением аргумента в процессе усреднения по заданному детерминированному или случайному закону [36, 39, 84]. При этом аргумент может изменяться дискретно или не¬ прерывно сразу во всем требуемом диапазоне либо"с раз¬ бивкой всего диапазона на поддиапазоны. Рассмотрим данные алгоритмы при условиях, оговоренных в § 3.2. Обобщим оценки (3.14), (3.15), полагая в них, что ска¬ лярный аргумент •б1 является фуцкией времени 6(0» и вводя избирательный множитель V (0 усредняющего устройства, равный единице при кепрерывном усреднении и v(u) = At 2 5 (« —Ш) (3.58) Ч=-00 при дискретном. Тогда обобщенную (статическую или ди¬ намическую, непрерывную или дискретную) оценку <2 [6(0] можно представить в виде [см. (3.14)] < § [& (0) = и); a (t —"0] V («) Я (и) Ли. (3.59) о Для статических алгоритмов аргумент 6(0 не зависит от времени, т. е. 6(0=6.'' Положим, как и ранее,- что jgQ=gQ, и введем следую¬ щие обозначения; t — текущий момент времени; tp — мо¬ мент регистрации оценки <5; 6р=6(/Р+0)—номинальное значение 6(0, которое приписывается ординате <3(6Р) в 8-192 ИЗ
момент регистрации <3(d); U — интервал времени, харак¬ теризующий запаздывание или опережение в принимаемом значении по отношению к значению ф(/р) в момент ре¬ гистрации #р; М{Чг(0)}=0 — детерминированная или слу¬ чайная независимая с X(t) функция, описывающая харак¬ тер изменения аргумента 4 во времени: -& (*) =фр-|-чг (t—tv—t3). (3:59а) Предположим, что М[X(^);'-в-]} (-в-) и Rg(t> бь ба) допускают разложения в ряд Тейлора в точках Ф=ФР (■&1=^р, #2=б'р) и существуют все начальные моменты mm{t) и mk,nv{tlt t2) функции ’P(f). Тогда, как показа¬ но в [36, 39], имеем М {Q (&р)} = jPM {g [»р -f- W (-13 - «)]} у («) а (и) йи = гр \г\Я(кЧ%) гр = Я (V V (и) ФФ+V —— V (и) Ф) Мш (— h — и) du> о k=l ov (3.60) /р /р D{$(&p)} = j j ЩЯа[и-г-, 8.р + ^(-^3-й), &р + + V (~ h ~ z)]} V («) V (2) а(«) а(2) dudz = Dc(»р) + DA (&р); (3.61) гР ,‘р По (6>р) = J f (н — 2; &р, &р) v (и) v (2) а (и) а (2) <foete; (3.62) /г=0 n=0 0 0 х(—м. — — г) у (и) v (г) а (и) а (2) dtwte, (3.63) ♦ где ($р), Ro+n)(v; &р, &р) — производные по 9>„ &2 при #=фр, #1 = '0,2 = Фр. Первые слагаемые в правой части (3.60), (3.61) совпа¬ дают с аналогичными характеристиками статических оце¬ нок (3.17) — (3.21), а вторые характеризуют добавку к ним, обусловленную изменением #(?) во время усреднения. Используя (3.60)—(3.63), можно исследовать отличие динамических оценок от статических, получить рабочие 114
формулы для расчета погрешностей динамических оценок для различных характеристик Q,.и алгоритмов их нахож¬ дения, т. е. при различных функциональных преобразова¬ ниях gc)(-) и весах V (и) а (и). Некоторые изподобных результатов приведены в [36, 39]. Здесь мы отразим ча¬ стные случаи,, наиболее интересные для практики. Первый п р.ичм е р. Пусть W (t) =at, где а — постоян¬ ная во времени скорость изменения аргумента б, а усред¬ нитель непрерывный с функцией а (и) вида (3.43). Тогда при tp^T имеем Сопоставим смещение подобных сплошных динамиче¬ ских оценок с решетчатыми статическими, рассмотренны¬ ми в § 3.1. Прежде всего обратим внимание на4 то, что, как следует из сопоставления (2.44), (2.46) с (3.61), (3.64), по смещению сплошные динамические оценки ана¬ логичны статическим решетчатым ядерного типа (см. так¬ же гл. 6, 8). В частности, (3.64) аналогично подобному соотношению при прямоугольном равномерном в полосе шириной аТ ядре. Однако в динамических оценках подоб¬ ная «ядерность» обеспечивается, естественно, в ряде слу¬ чаев и более простыми средствами. Положим, что статичёская решетчатая оценка нахо¬ дится последовательно по точкам, на. каждую из которых затрачивается время, анализа Т. Подобная оценка пред¬ ставляет собой частный случай «решетчатой динамиче¬ ской» оценки, аргумент которой изменяется скачками Дб0 через одинаковые интервалы времени, равные Т. Обозна¬ м {Q ФР)} = ~ЯГ f (&р) - 1 J аГ-*0 $р—а 7V Р - ^(l + 2p)q<')(bp) + ^[(l+V.y-V.3]q^(bpy, (3.64) -аГ(1-И*) 115
чим через Лбс шаг измерения статической решетчатой оценкир постоянный или переменный вдоль бе [бн, бв]. Через Дбд обозначим приращение аргумента сплошной динамической оценки. В частности, при W(t)=at имеем Дбд=а7' вдоль всех значений де^в, бв]. Тогда при при¬ нятых условиях на каждое приращение аргумента Дб0 для статической решетчатой оценки и Дбд для динамиче¬ ской сплошной оценки будет затрачиваться одинаковое время анализа Т. Теперь, задаваясь ограничением на веч личину смещения оценки и видом аппроксимации решет¬ чатой оценки по ее отсчетам, а также законом изменения аргумента и видом усреднителя динамической оценки, можно подсчитать количество пс и пд отрезков Абс и Дбд одинаковой или разной длины, укладывающихся на всем требуемом диапазоне [бн, бв] изменения аргумента б. Отношение пс/пд будет характеризовать,выигрыш или про¬ игрыш одной оценки по отношению к другой по общему времени анализа. Либо, наоборот, задаваясь общим вре¬ менем анализа, можно оценить выигрыш (проигрыш) в погрешности (в' смешении) оценок. Наконец, можно по¬ ставить и решить .задачу синтеза алгоритма оценивания с требуемыми свойствами, в частности найти оптимальное а согласно принятому критерию оптимальности. Например, сопоставляя (3.64) vc (3.8) и табл. 3.1, убеждаемся, что сплошной динамический алгоритм с по¬ стоянной скоростью развертки аргумента оценки и усред¬ нителем типа (3.43) при Дбд-И) аналогичен статическому решетчатому- алгоритму (при Абс->0) с полиномиальной аппроксимацией е точностью до коэффициентов пропор¬ циональности в значениях смещения оценок. А именно, в худшем случае, при р=0 или р=—1, сплошной динами¬ ческий алгоритм подобен решетчатому статическому с луч¬ шей (Я=2) стпенчатой аппроксимацией, а в лучшем слу¬ чае (при р=—1/2) — решетчатому алгоритму с линейной аппроксимацией, но [см. (3.8) ] превосходит его по коэф¬ фициенту пропорциональности v(k, Я) (24 вместо 8—16). Второй пример. При усреднителях типа фильтров Баттерворта (26+1) -го порядка динамические алгоритмы с Т (t)=at подобны решетчатым с аппроксимацией поли¬ номом 2-го порядка [39]. В частности, дЛя усреднителя в виде ^С-щепочки с постоянной времени RC=% при t^> ^(3-*-4) т имеем при ат-»-0 М{<3>„)} ^<7(бр) + ат(1 + ц)<7<1>(&р)+(24-2tHV)<7<*>(&p) (3.66) 116
Следовательно, такой динамический алгоритм при р=0 подобен решетчатому со ступенчатой аппроксимацией при А=1, а при р=1 — решетчатому с линейной аппроксима¬ цией, но с коэффициентом в (3.8) v(&, А);=2 (вместо 8—16). Сказанное иллюстрируется табл. 3.2, в которой ис¬ пользованы следующие обозначения для решетчатого ста¬ тического алгоритма: I -- ступенчатая аппроксимация, II — линейная, III — квадратичная; для.сплошного дина¬ мического усреднителем является: I —^С-цепь, II — иде¬ альный интегратор (3.43), III — фильтр Баттерворта 3-го порядка; арабские цифры 1 и 2 означают худший и луч¬ ший случаи в смысле значений А и р. Заметим, что для экспоненциальной кривой такое же количество интервалов пе получится, если сделать ДФ пе¬ ременным вдоль ■&. В то же время для гауссовой кривой использование переменногопозволяет получить следу¬ ющие значения яс: при •бв='6о,1: для 1.1 —,48 при £=0,05 и 240 при £=0,01; для 1.2—23 и 117; при 1&в='6о,о5: Для 1.1 — 61 и'30$ для 1,2 — 30 и 151; при •fl,B=0’o,oi: для 1.1 —93 и 468, для 1.2 — 46 и 222, т.,е. примерно в 2 раза меньшие значения пс. В связи с тем что при неслучайном динамическом из¬ менении аргумента происходит как бы его взвешенное группирование, можно ожидать, что дисперсии динамиче¬ ских оценок при Ддд-И) будут незначительно отличаться от дисперсий статических оценок при тех же •&, причем порою даже при значительном смещении динамических оценок.^ Это подтверждается анализом выражений диспер¬ сий в частных случаях [36]. Т р е т и й п р и м е р. Допустим' теперь, что Чг (0 — ста¬ ционарный обобщенный случайный процесс, т. е. процесс, отсчеты которого 4ri==4f(Л) и 'ЧГ2=ЧГ(£г) при t&ti неза¬ висимы. Тогда из (3.60), (3.61) имеем где R,n определяется выражениями (3.20), (3.21), о D{Q(V) = M{% (&p+Vlt (3.68) Р 117
к ' я /о>^ я =5 л « s 5 н 5 я “ о. §2 >* ев Sg g 5 5 ? о н з з « 3 §г х 2 з ^ *8 S SP * 5 8 g 'gs :s «§ i« 5 z 2 5 °* Vj £o x * g isi S 5 §. 2 2 H н e S®« “Sg «о 1 e I о ^ S о о У Э1 c 5 я isi 5 * § s ^ ETaj* о .Vg eo.'So ct> 2 #ri ^ С s ^ ч ^cg** \D ' a ев н I £ Число интервалов Д&. укладывающихся на отрезке [0, $в] о о V ”и С6> Л ф с£ 1 111 Ю - 05 22 о 24 42 89 j 458 178 915 д о» ю 05 о 00 со 00 - 00 44 228 00 оо со 457 Ч <м § ю 230 со со 05 28 1 460 см со - 92 460 456 184 175 920 913 ё ©' V в с6> А ф о* - е* 05 со со о СО см - 58 298 & ю <М со со СО со ю ю о см ~ ю 29 - 149 05 00 ю 20 298 - ся 30 о 150 см 09 оо 300 39 - о со 57 о о со 297 120 ю 009 со 05 LO о V ш % ф с? III CSI со оо ю ю <м оо 20 3 229 89 458 - см со см * ю ю Tf - 00 05 - .22 05 Г-. 3 ю 229 ~ о» 23 ю СО со 230 29 46 XJ* т*» 230 228 СМ 05 05 00 ' 460 457 Алгоритм стат. динам. стат. динам. стат. динам. стат. динам. VS 0,05 0,01 0,05 1 10*0 5 о* <—*”4 ф в СО. с> ё У и V/- 0) If * X 'И ° 4) 118
(3.30) — (3.32), а правая часть (3.67) имеет место, если ряд существует, сходится. Подобная оценка, как видно из (3.67) „ по смещению ведет себя так же, как статическая решетчатая оценка ядерного типа, и при маленьком диапазоне изменения Чг(0 имеет дисперсию, близкую к дисперсии обычной ре¬ шетчатой статической оценки вида (3.14), (3.15). Все изложенное позволяет обратить внимание читате¬ ля на динамические алгоритмы, на необходимость их ши¬ рокого исследования и применения. В частности, при по¬ следовательных расчетах на ЦВМ динамические алгорит¬ мы по сравнению со статическими решетчатыми позволя¬ ют практически бесплатно без затрат на аппроксимацию решетчатой оценки получить дополнительно к точкам ре¬ шетчатой оценки любое (но, разумеется, много меньшее объема выборки N) число точек оцениваемой характери¬ стики. 3.4. РЕКУРРЕНТНЫЕ И ИТЕРАЦИОННЫЕ АЛГОРИТМЫ Рассмотренные в предыдущих параграфах" дискретные алгоритмы, например (3.15), отличает то, что вычисление значения оценки Qn для каждого п производится за один * шаг с учетом всех используемых отсчетов g(iAt), начиная с t=0 до i—ti—l. Это приводит к тому, что- при необхо¬ димости получения значения :Qn+i надо заново пересчи¬ тать оценку, используя опять все требуемые отсчеты g, начиная с t=0 до г=п. В ряде случаев, в частности при расчетах на ЭВМ, это может оказаться неэкономным. Бо¬ лее предпочтительными могут быть рекуррентные фор¬ мулы, учитывающие несколько последних (текущих) ре¬ зультатов вычислений значений оценок. Подобные форму¬ лы нашли широкое применение в цифровой фильтрации, в адаптивной обработке, а в последнее время — в стати¬ стических измерениях и теории оценивания. Положим в (3.15) Atal(n—t)Af]=af и введем обозна¬ чение an-i=[ao+Oi+ т-Оп-г]-1,я13*1. Тогда, разделив и умножив правую часть (3.15) на an-i, получим для >2 п—\ &(<>) = 2 Я, 1(Ш) = (д) + 1 [(л - 1) Щ = 1=0 = *«-, [g l(n - l)U) - (*)], (3.69) 119
^ n-2 * Qn-1 (?) = 2 a‘g (гД0- (3.69a) /=о Тем самым получили рекуррентный алгоритм первого порядка для расчета Qn (Ф) • Если условие нормировки (3.19) выполняется при каждом п, то а,=а{(л), Оп=1. Зто можно обеспечить, например, если для каждого п= =2, 3, ... вместо a.i ввестиY/fc> = ^<a*. t=0, k— I, k=l, 2;..., n — l;Yi<n)==at-. В этом случае в обозначениях Y^i = Pn-i (3.69) перейдет в широко известную фор¬ мулу Qn W = 3»-. (*) + h-г Сё [(« “I) ~ Qn-г (*)}. (3-70) Qn (Q) = 2 Тг(П) £ т, Qn-г (*) = 2 g т. (3.70а) 1=0 1=0 §,(*) = 0. Обратим внимание на разную структуру коэффициен¬ тов уг<*> = а,а*, i = 0, k— 1, k= 1, 2 л—1; p, = a,aj+1> 1=л—1 и (3.69а)’, (3.70aJj Формула (3.70) может быть преобразована к виду (3.15), (3.69), если положить п—Г2 = П(1—Pft+i)> i — 0,n — 2, a„_, = p„_,. (3.71) k=i В частности, постоянным весам Ог=1/л, t=0, п—1, со¬ ответствуют переменные веса P;=l/(i-f-l), i=0, п-—1. На¬ оборот, постоянным весам pn-i= 1JN для всех п соответ¬ ствуют переменные веса ai=sN~l[{N—1)/Al]”~lw». Наконец, если ai={l/N : i=n—N, п—1; 0: i=0, п—N—1}, .то из (3.15) легко получается рекуррентная формула скользя¬ щего усреднения с равномерным весом i=n—N (3,72) где 2(W)=(*(i")"P“0,Si<JV-1’ (3.73) (g (iAt) — g [(/ — N) д/] при IV < i < n — 1 120
« Необходимость запоминания отсчетов g (Ш) при реа¬ лизации (3.73) делает эту формулу менее удобной в реа¬ лизации, чем- (3.69) и (3.70). С другой стороны, удачный выбор йг в (3.69) и рг в (3.70) может приблизить эти фор¬ мулы по свойствам оценок к (3.72). Поскольку все рассмотренные рекуррентные формулы при идеальном выполнении вычислительных, операций сво¬ дятся к дискретному алгоритму (3.15), анализ смещения и дисперсий оценок для них можно выполнить по резуль¬ татам § 3.2. Особый интерес для практики вызывает алгоритм (3.70) при постоянном весе ip,=p=const>0. В этом слу¬ чае при jP<l из (3.18) с учетом (3.71), т. е. равенства * a,-=ip(l—ip)”-*-1, для g—g имеем М{$„(0)}'=ц(<>)[1-(1-т ~ </(#). (3.74) П-> ОО Для некоррелированных отсчетов б(Ш) при этом из (3.41) получаем %вк(^, ^) = ^о(0; <У[1-(1-|ЗПХ X (2 - РГ1 ~ 0,5рЯо (0; К 02), (3.75) «->00 т. е. подобные оценки не являются состоятельными. Не¬ смещенность и состоятельность оценок (3.69), найденных по некоррелированной выборке, имеет место при выпол¬ нении (3.19), (3.42). Для состоятельности же оценок (3.70) необходимо выполнение условия (ipVHP2^ ••• +P2n-i)->- -^■0 при о—>-оо. Скорость сходимости к правой части (3.74), (3.75) определяется приближенным равенством (1 k=l, 2, 3,..., (3.76) применимым уже при 0<ip^0,l и тем более точным, чем меньше р. Как видим, при рассматриваемых условиях и q(p)=Q(ft) оценка &(Ф) является асимптотически не¬ смещенной, несостоятельной' оценкой Q (O'). Практически оценка несмещенная при «р^З, Р=£^0,1. Чтобы ори ,дан¬ ных условиях сделать ее несмещенной для всех п, необ-, ходимо правую часть (3.70) поделить на [1—(1—р)л]. Эта операция приведет к увеличению дисперсии оценки в [1—(1—Р)"]-2 раз. Из (3.74), (3.75). следует, что при р<=р^0,1 оценка (3.70) ведет себя подобно оценке (3.15) с экспоненциаль¬ ным весом' с постоянной времени Д#/'Р. Это и понятно, по¬ скольку при р^0,1 имеем а*л*рехр {—(п—i—1)Р). 121
N--y Рис. 3.7. Частотные ха¬ рактеристики усредните¬ лей типа 1 и 2 при ЛГ=5 N = 10 Рис. 3.8. Частотные ха¬ рактеристики усредните¬ лей типа 1 и 2 при N==10 Мм1 0,8 0,6 0,4 0,2 N=5, p=v,z \ \ —ч / \ \ / \ / л — 1 0,2 0,4 0,6 0,8 -)/2я Рис. 3.9. Частотные ха¬ рактеристики усредните¬ лей типа 3 и 4 при N=5 и {5=0,2 Некоторые свойства непрерывных и дискретных оценок нагляднее прослеживаются по частотным характеристикам усреднителя, приведенным на рис. 3.7—3.9. На рисун¬ ках представлены нерекуррентные усреднители вида (3.43) при v=coAf, частотные характеристики которых определяются выражениями: усреднитель 1 — (3.44) усреднитель 2 — (3.45); а также непрерывный, экспонен -циальный усреднитель S с постоянной времени т, т. е с a(t) =т-1 exp {—tlx), t>0, при Зт й дискретный рекуррентный усреднитель 4, соответствую щий (3.70) при постоянных коэффициентах 0;=#, 0<р<1 Усреднитель 4 представляет собой цифровой фильтр пер вого порядка [34] с частотной характеристикой Ая (®) = р[(1 - РГ - e-'wAt] [1 - р - (3.77) 122
Его будем рассматривать для установившегося, режима работы, т. е. при пр^З, что равносильно условию (nAt)J (At/§) =t/i^3 для непрерывного фильтра, а для Мо¬ дуля | Ап («о) | соответствует приближенно значению р в числителе (3.77). Заметим, что уже при «5*10 на каждом отрезке icoe[(2ft—1) я/Л/, (2k-\-\)nlAt\, k=0, ±1, ±2 .... модуль |.Дп((о)| из (3.45) практически совпадает с зна¬ чениями \Af (<о) | при.t=nAt. Из приведенных графиков наглядно видна нежелатель¬ ность наличия в анализируемом процессе X(t) спектраль¬ ных компонентов, для которых спектр процесса G (t) будет иметь значимые (мощные) спектральные составляющие, особенно периодические, в областях частот,_равных и близ¬ ких к значениям nJAt, где n= 1, 2, 3, Обычно от этого пытаются избавиться, выбирая |Дt с учетом спектра про¬ цесса G(t). Заметцм, что именно процесса >G(t), а не X(t). Спектр процесса G(t) может быть значительно шире спек¬ тров компонент процесса X (t). Как указывалось в § 3.2, другим способом избавления от погрешности синхронности является использование вме¬ сто периодической выборки с периодом Ai апериодической выборки,'т. е. выбор отсчетов G(t{), i=0, n—1. не в экви¬ дистантных точках to, t\, ..., tn-1, выбираемых детермини- рованно [83] или случайно. Рассмотрим некоторые вари¬ анты организации подобных выборок. Вариант 1. Образуются две периодические выборки * с периодами Aii и Д7г. Анализируемая выборка git i= =0, n—1, получается случайным отбором с. вероятностью р элементов первой периодической выборки и с вероятно¬ стью <7=1—р элементов второй выборки. Затем по одной из нерекуррентных или рекуррентных формул типа (3.15), (3.69), (3.70), в которых at и •g(£A-t)—gi определяются но¬ мером i по своей выборке, находится оценка Qn (Ф). Тако¬ му варианту выбора-усреднения соответствуют математи¬ ческое ожидание частотной характеристики усреднителя, математическое ожидание и (в случае усреднения некор¬ релированных отсчетов) дисперсия оценок равные соответственно сумме взвешенных частотных характери¬ стик, математических ожиданий и дисперсий- оценок пер¬ вой выборки с весом р и- второй выбррки с весом д. Вариант 2. Расстояние Ait=ii+i—U, 7=0, п—1, 7о=0 между соседними усредняемыми отсчетами назначается как i-й элемент случайной и, следовательно, независимой выборки из генеральной совокупности некоторой неотри- 123
дательной непрерывной или дискретной величины S, не¬ зависимой от X(t). Например, S имеет экспоненциальное йли равномерное абсолютно непрерывное распределение либо В имеем дискретное распределение, когда Ah=SiAt', где si — t-й элемент, случайной выборки из генеральной совокупности величины с дискретным равномерным, пу- ассоновским и тому подобным , распределением, At' — не¬ которая константа. Понятно, что если в такой случайной выборке п будет таким же, как в периодической выборке с периодом At,- то периодической выборке будет соответ¬ ствовать эквивалентная длина реализации G(t), равная Та=пМ, а случайной выборке — случайная величина Тc=afn=A^o+A^i+ 4-с математическим ожида¬ нием М{Гс}=яМ{В}=лД7. При M{E}=At==At имеем ТП=М{7'С}. Частотная характе¬ ристика дискретного усреднителя при таком случайном отборе имеет вид [ср. с (3.25) ] А(п) И = 2 Mi а(М0 +... + ехр (— /со S*rl (3.78) 1=0 1 k=0 I Обозначим через А (©) (предельную) частотную харак¬ теристику непрерывного усреднителя, определяемую вы¬ ражением (3.24) при t= оо, а через 0(ы) — характери¬ стическую функцию величины В. Тогда математическое ожидание М {А(П)(со)} может быть представлено в виде Я—1 ОО f л (и) е‘(«-»)<&= k=0 -нэо ор = ^-M{S} А (и + <о) [1 — 0" («)] [1 — 0 (о>)] *du. (3.79) —00 Математическое ожидание оценки <3(п)(Ф) при g=g будет равно М{<3(п) W}=<7 (*)М{Л(П) (0)}, (3.80) а дисперсия ОО D {$(.><♦)} = -£- f М{ I i4(e)(®)|*}So(®; Р, *)<*«>+ —ОО + ^(*)О{Лы(0)}. (3.81) 124
, Полученные соотношения обобщают результаты § 3.2, а также результаты работы [33], в которой AU во избе¬ жание недопустимо малых значений полагается равным lAtf'+g (| — значение равномерно распределенной в ин¬ тервале [О, Д?|] случайной величины) и используется рав¬ номерный вес Mia(ti)=lJ'N. 1 Любопытно отметить, что первое слагаемое в (3.81)' представляет собой среднее значение условных дисперсий, т. е. Ма {D {$„ (б) | А(п) (со)}}, найденное вдоль ансамбля частных частотных характеристик Л(П>(ю), полученных при фиксированных значениях Aft. Анализ приведенных результатов показывает, что соот¬ ветствующим подбором распределения величины S можно добиться свойств дискретных нерекуррентных и рекуррент¬ ных оценок $(п) (б), близких' К свойствам непрерывных оценок. Так, например, если для нерекуррентных оценок Ф(п)(б) положить №ia{U) == l/tiV[l(t)—l(t—^'IV)], то будем иметь А(п)(0)=1 (условие несмещенности оценки), т. е. D{A„ (0)}==0, и EN-1 1+ S (* “- [в^Чг в*(— Ш>] • й=1 -* (3.82) В этом случае длд величин S, у которых 16 (<о) | < 1 при <о#0, для больших N правая часть (3.82) будет иметь по¬ рядок 1/N. Следовательно, подставляя (3.82) в (3.40) вме¬ сто, | Ап (со) |2, убеждаемся, что^для периодических Rg (и; бь бг) использование случайной выборки позволяет изба¬ виться от погрешности синхронности. Вариант 3. Моменты U выборки назначаются как где 11 — значение <-го элемента случайной вы¬ борки из генеральной совокупности величины S, а Д£>0 определяет средний интервал между выборками [26]. Если оценку Q<n)(6) находить по (3.15) с заменой Ш на U, то для такой оценки будут справедливы (3.80), (3.81), t—nAt М {Л,„> («,)} = jL J А (и) 0 (и - о») [1 - ] X —ОО X[l-el(u-°)Ai]du= ^ (3.83) k=—ОО 125
Из ,(3.83) следует, что если величина S равномерно распределена на интервале [О, Д£], то при больших п ус¬ реднение с рассматриваемой случайной выборкой в сред¬ нем аналогично непрерывному усреднению, так как М{Л(п)0ю)}*~4(<о) (см. [26]). Если выбрать равномерный вес, т. е. положить Ata(ti) = = (1 /N) [1 (£)—1 (t-W)], то Л(п)(0)=1, 0{Л(„,(со)}= 1/Л£[1 — I 0(ш)|г], т. е. D{iw(0)} = 0,| м{Иы(<е)Г} = 17^[1 - I вИ|2]+|М{лы(ш)}|2. ) (бт> Из (3.84) и (3.81) следует, что в рассматриваемом случае дисперсия оценок <5<п>(й) при больших N не пре¬ вышает суммы дисперсий непрерывной оценки при Т— =NAt [см. (3.20) и (3.30) с учетом (3.44)] и некоррели¬ рованной дискретной оценки [см. (3.41)] при а*= 10. Варианты сложной детерминированной дискретизации можно найти в [83]. Из рассмотренных вариантов дискретизации предпочти¬ тельнее второй и третий, примерно равноценные (при со¬ ответствующем выборе распределения) с точки зрения смещения оценок Q(n)(ft) как между собой, так и по от¬ ношению к непрерывным оценкам. На вопрос, какой из них выбрать с точки зрения практической реализации, можно ответить, лишь исходя из конкретных требований и наличных средств при аппаратной или программной ре¬ ализации их. Достоинством третьего варианта в этом пла¬ не является то, что моменты выборки U и 4 при i=£k можно назначать независимо, в то время как для второго варианта при i>k величина h может быть найдена, лишь когда будут найдены все при —1. Замечания. 1. Были рассмотрены рекуррентные формулы первого порядка. Практический интерес представляют также рекуррентные фор¬ мулы второго и более высокого порядков, соответствующие цифровым фильтрам подобных порядков [34, 68, 123]. 2. В ряде случаев целесообразно линейные операции умножения слагаемого в квадратных скобках в формулах типа (3.69), (3.70) на коэффициент ап-1, 'Pn-ь заменить соответствующим нелинейным пре¬ образованием данного слагаемого [60, 112]. 3. В последнее время рекуррентные алгоритмы нашли широкое применение при реализации .методов Р-оценивания (процедуры стоха¬ стической аппроксимации Роббинса — Монро, Кифера — Вольфовица, Блюма, Дворецкого и т. п.), при реализации различных непараметри- ческих методов оценивания плотностей, распределения, математических ожиданий и других характеристик, в вычислительных процедурах, реа- 126
лизующих различные методы (МП, НК, НМ и т. п.) параметрического оценивания [60, 75, 97, 103, 117]. В цитируемых источниках оассматри- ваются вопросы сходимости и устойчивости рекуррентных процедур. В несколько отличной форме рекуррентные (многошаговые) алгоритмы используются при реализации быстрого преобразования Фурье. 4. Рекуррентные процедуры оценивания и вычисления находят все более широкое применение в адаптивных обучающихся системах (алго¬ ритмах обработки) [112, 126, 132], при реализации итерационных и последовательных процедур вычисления и оценивания, например в итерационных и итерационно-усредняющихся .алгоритмах оценивания. Качество алгоритма зависит от правила останова [58, 64, 72, 112]. 5. В теории и практике статистических измерений помимо дискрет¬ ных могут широко использоваться непрерывные рекуррентные процеду¬ ры [132], которые в задачах оценивания характеристик случайных про¬ цессов еще не нашли должного исследования и применения. 3.5. О ДРУГИХ АЛГОРИТМАХ ТАБЛИЦЫ 1.3 Некоторые не затронутые в предыдущих параграфах данной главы алгоритмы, представленные в табл. 1.3, будут частично освещены в по¬ следующих главах. Здесь мы сделаем лишь,, несколько замечаний об адаптивных алгоритмах измерения, начинающих находить все более широкое практическое воплощение. Адаптивные, особенно «самообучающиеся», алгоритмы могут ока¬ заться весьма эффективными с точки зрения качества решаемой задачи, особенно в условиях априорной неопределенности. Однако они зача¬ стую требуют значительных дополнительных затрат. Поэтому вопрос об их применении должен решаться конкретно, с учетом приложений. На уровне математического описания случайных элементов адаптация может осуществляться по отношению к характеристикам более полным (универсальным), совпадающим или менее полным, чем измеряемая. Пусть, например, измерению подлежит корреляционная функция слу¬ чайного процесса, заданного семейством конечномерных распределений. Тогда в первом случае учитывается in-мерный (п^2) закон распреде¬ ления (гауссовость, марковость, экспоненциальность процесса), т. е. выбир'ается алгоритм, лучший с учетом n-мерного распределения. Во втором случае учитывается только форма (функциональное описание) корреляционной функции, а в третьем — ее параметры. По учету априор¬ ных данных адаптация может быть с учетом всех априорных данных, с частичным учетом или без учета, например в случае их отсутствия (см. принцип Я13). Если адаптация является следстием желания сохранить на требуе¬ мом уровне заданные показатели качества результатов измерения (оце¬ нивания), то она может осуществлять по одному какому-то показателю (смещение, дисперсия оценки, затраты машинного времени и т. п.) или 127
по некоторой совокупности показателей. Наконец, при практической реализации адаптация может осуществляться на уровне формулы вы¬ числения (оценивания) или ее параметров. В первой случае выбирается формула, по которой вычисляются значения измеряемых характеристик, т. е. осуществляются выбор алгоритма, имеющего соответствующие реализации согласно табл. 1.3, и его детализация (например, вариант параметрического оценивания). Во втором случае адаптация осуществ¬ ляется путем выбора значений параметров формулы: закона изменения аргумента, шага измерения, вида и значений весовой функции, шага дискретизации, объема выборки и т. д. В настоящее время в теории и практике статистических измерений нашла отражение в основном лишь адаптация по форме измеряемых характеристик и по параметрам фор¬ мулы оценивания. Разработка теоретических основ, алгоритмических, аппаратных и программных средств адаптации на всех уровнях являет¬ ся актуальной задачей. В настоящее время уже созданы необходимые предпосылки для ее успешного решения. Большое будущее принадлежит «самообучающимся» алгоритмам (принцип jt 17 [112, 132]). Такие алгоритмы могут использоваться, на¬ пример, в двухступенчатых процедурах параметрического оценивания, когда на первой ступени находятся начальные приближения значений оценок (например, методом моментов) для дальнейшего их уточнения (методом МП, МХК и т. д.). Второй вариант — автоматическое опре¬ деление на первой ступени значений параметров алгоритма оценивания (шаг измерения, диапазон изменения аргумента, требуемый объем вы¬ борки, разрешение и т. д.), запоминание их и использование во всех последующих расчетах постоянно или с периодической корректировкой. Глава четвертая Параметрическое оценивание одномерных характеристик 4.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Как указывалось в гл. 2, суть первого варианта пара¬ метрических алгоритмов статистических измерений сво¬ дится к двухшаговой процедуре: вначале с помощью за¬ висимых («параметрических») или свободных от функци¬ онального вида измеряемой характеристики («непарамет¬ рических») приемов измеряются параметры одной или не¬ скольких «базовых» характеристик, а затем по ним опре¬ деляются значения всех искомых характеристик при всех требуемых значениях их аргументов. Поскольку все ха¬ рактеристики случайных величин и векторов и ансамбле¬ 128
вые характеристики случайных, процессов и последова¬ тельностей определяются через их законы распределения, в . качестве базовых характеристик следует прежде всего использовать именно законы распределения. Посде измерения4параметров 0, т. е. получения 0, зна¬ чения- характеристики <2(й; 0) могут быть либо рассчи¬ таны по формуле, описывающей'Q(-0; 0),,в которой вме¬ сто 0 подставляются, значения 0, либо найдены по второму варианту методом регрессионного оценивания по формуле (2.11), обеспечивающей несмещенное МД-оцениваниё Q(0;- 0), если'0^2 есть несмещенная оценка Q(0; 0); а 0*i — достаточная статистика для параметра 0 распреде¬ ления, либо найдены другим^ [7, 22, 81, 107] приемами несмещенного и смещенного оценивания. В свете изложенного в. настоящей главе вначале для наиболее часто исПольЗуемых характеристик приводятся некоторые, кащ Правило, типовые оценки параметров, за¬ тем рассматриваютЬя вопросы оценивания значений ха¬ рактеристики й, наконец, приводятся Замечанйя'по вопро¬ сам,' которые нельзя йе рассмотреть в работе/ с принятым название^, но которые не оказалось возможным рассмот¬ реть, в небольшой монографии. Многие результаты данной главы будут рассмотрены на примере независимой выборки хи х2, ..., из гене¬ ральной совокупности значений случайных величин, век¬ торов й функций (процессов и последовательностей). Для Процессов и последовательностей х\, x2i ..., могут пред¬ ставлять собой: значения (скалярные или векторные), по¬ лученные вдоль ансамбля траекторий или йДоль одной траектории. Для простоты будем рассматривать стацио¬ нарные функции и поэтому не - будем делать различия между распределениями и другими совпадающими ан¬ самблевыми характеристиками величин, векторов и функ¬ ций, считая их дЛя определенности и простоты характери¬ стиками ^величин и векторов. Наложение жесткого условия Независимости На эле¬ менты выборки, выполнение которого, естественно, необ¬ ходимо проверять при каждом практическом статистиче¬ ском измерении, является приемом избавления от трудно¬ стей математическогр плаца и получения компактного, удобного для анаЛйза и применения Конечного формуль¬ ного результата. С прикладной точки зренйя это условйе часто не является обременительным, так как, вО-первых, может быть заменено более слабым-уёловйем попарной 9—192 129
некоррелированности при сохранении результатов; во-вто¬ рых, в зависимости от. ограничений, накладываемых на объем выборки (на Т или \N), позволяет оценить сверху или снизу смещение и дисперсии оценок согласно резуль¬ татам § 3.2, 6-третьих, может быть желательным, и при¬ ближенно встречаться на практике, как, например, при использовании методов статистического моделирования, Монте-Карло. 4.2. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПОЛОЖЕНИЯ а И МАСШТАБА X РАСПРЕДЕЛЕНИЙ МД-оценивание Блэкуэлла — Рао через достаточные статистики. Положим, что все имеющиеся параметры рас¬ пределения iF(x; в), кроме оцениваемого а, X или (а, X), 'фиксированы, известны, и будем считать заданной форму распределения — ее аналитический вид. Пользуясь опре¬ делениями Тейта [58], будем понимать под параметром положения типа усечения I рода параметр a=ai, для ко¬ торого плотность1 Н?(х; a)=k\(a)h\{x), Ci<ai<<xs^c2, '—oos^ci<c2^<»; И рода (а=ац), если 'И?(х; а) = =£2(a)h2(x), Ci<.x^an<C2, —oo^Ci<c2^oo; типа сдвига i(a=ani), если W(x\ a)=W(x—а), |а|<оо. Параметр мас¬ штаба X определяется равенством ТР(х, X)=(llX)W(x/X; I). Пусть далтге Хи *2, •••, xN — независимая выборка из рас¬ пределения W(х; а, Я); X(i), %>, ••*, х^щ — соответствую¬ щий выборке вариационный ряд. Тогда хщ и X(N) являют¬ ся полными достаточными. статистиками для W (х; ах) и ¥(х; ап)/ соответственно. Пусть далее (сь с2)“— конеч¬ ный интервал, a g(a)—абсолютно непрерывная функция на (ci, с2). Тогда существенно единственной несмещенной оценкой с минимальным риском (при выпуклых потерях) функции g(ai) или g(aи) является [58] Р-оценка g (®i) = g (*<■>)- g' (*(.)) [Nki (*(,)) *.(«t i))]-1. (4Л) g (ац) = g (x(yv)) -f g' (*<„)) [Nk, (x(N)) К {хш)~1. (4.2) Если оценивается сам параметр а, то g(a)—a, g'(a)=l. Оценка (4.1) легко обобщается на случай с2=оо предель¬ ным переходом cz-*-oo, а оценка (4.2) — на случай с\== '=—оо [58]. 1 Структура функций k,(a), k2(a) дана в [58]. 130
Подобное оценки существуют также для g (am); [58], Достаточные МД-оценки для параметров масштаба стро¬ ятся с привлечением дополнительных понятий и ограни¬ чений [58]. МП-оценивание. Пусть оцениванию подлежат параметр сдвига а=Ощ и параметр масштаба Я распределения Щх; а, Я), когда все другие Параметры, если они есть, известны и извёстен аналитический вид распределения. Тогда можно попытаться применить МП-оценивание [65], если выполняются необходимые для этого условия регу¬ лярности. Совместные МП-оценки й, Я будут иметь дис¬ персии и ковариации, полученные обращением матрицы Г W" yW" ) Nl-2 Ml >. \yW" yW"-lj где y={x—а)/Я; W — вторая производная W(у, 0, 1) по у. Для симметричных относительно а распределений МП-оценки й и Я будут асимптотически некоррелированы (независимы, так как это НАН-оценки). Для несиммет¬ ричных распределений некоррелированность будет иметь место, еслй параметр сдвига а определяется не относи¬ тельно начала отсчета, а относительно центра расположе¬ ния распределения M{yW"}JM{W"}. Причиной выбора центра расположения в качестве начала отсчета служит то, что в случае применения итерационной процедуры МП-оценивания оценки, могут вычисляться отдельно [65]. Эквивариантные оценки параметров сдвига- Не вдаваясь подробно в теорию эквивариантных (имеющих равный риск) оценок параметров сдвига (см., например, [58, 65]), отметим, что среди всех эквивариантных относительно сдвигов оценок, оценка Питмена а{х xN) = Xi — М{А', | x2-хи — xtj (4.3) минимизирует равномерно по а функцию риска при поте¬ рях типа квадратичной ошибки, является минимаксной оценкой и недопустима, если размерность случайного век¬ тора X не менее трех ([58, 65]), т. е. если оцениваются три. и более параметров сдвига многомерного распределе¬ ния. Как уже указывалось, для n-мерногб нормального распределения оценкой Питмена а параметра сдвига а является выборочное среднее х (эмпирическое математи¬ ческое ожидание), 'являющееся недопустимой оценкой при «5s3. Недопустимость выборочного среднего х как оценки 9* 131
я-мерного параметра сдвига а нормального распределения для я^З при известной корреляционной матрице V обу¬ словлена. тем, что х строго доминируется равномерно по а оценкой Стейна [58] а* = [1 — (я — 2)/ат V"1 а] а. (4.4) Оценивание линейными комбинациями порядковых ста¬ тистик. Пусть опять считаются известными аналитический вид распределения и значения его параметров формы (если они есть). Пусть У(г)=(Х(г)—а) Я-1, Х((), 1=1, N, — элементы вариа¬ ционного ряда, у={уа), 1=1, N}, M{F(i)}=a;1 aT = (a1(..., aN), V = {cor(F((), Yis)); t, s=TjV} — корреляционная матрица,жт= (яр), ..., *(w>), 1т=(1, ... ..., 1), причем V положительно определена. Тогда в каче¬ стве оценок а, Я можно использовать [58, 64] НК-оценки а= — aгсх, Я= 1тсх, (4.5) где с = — V-1 (laT — alT) V-1, К Y = (lTV~‘l) (aTV-‘a) - (1TV—а)2 (4.6) По теореме Гаусса — Маркова а и Я являются наилучши¬ ми линейными комбинациями порядковых статистик [58], т. е. МД-оценками в классе линейных оценок. Их диспер¬ сии и корреляция равны [58, 65] D {о} = у (о’Г'а), D {Я} = ^-(lTV-‘l), cor {а, Я} = —— (1TV-Ia), (4.7) Если а=М{Х}, то D {a} {*}, где х — эмпирическое среднее, причем равенство достигается только при й=х. В. случае симметричных распределений (4.5) — (4.7) упро¬ щаются, а сог {&, Я}=0, как для МП-оценок. Заметим, что в ряде случаев данные оценки- совпадают с МД-оцен¬ ками Блекуэлла — Рао. Однако последние выводятся, как правило, проще [58]. Прочие методы. Помимо рассмотренных для оценива¬ ния а и Я могут быть использованы любые другие методы, 132
описанные в § 2.2. Среди них наиболее часто встречаются методы моментов и квантилей. В частности, для оценива¬ ния параметров сдвига а симметричных распределений ис¬ пользуется свободная от распределения оценка медианы, а Я находится для распределений заданной формы через оценку ^интерквантильной широты, например. (х3/4—Хх/4)'. Широкое распространение получили устойчивые, робаст¬ ные оценки (принцип Я12), мало критичные к естественным и сознательно организованным, мешающим воздействиям ’(помехам). Обзор этих оценок дан в [119], где в числе других рассматриваются оценки, адаптивные к форме рас¬ пределения и полученные при отбрасывании r=N—п край¬ них членов вариационного ряда Яц), к(п), xin_rt+l), ... ..., ri-f-r2=r, когда N я г неизвестны (усечение слева при г2=0, справа при Гг=0, двустороннее при п>0, г2> >0); когда N, г\; г2 известны (цензурирование) и при замене значений отброшенных членов ряда (iN, ги г2 из¬ вестны) значениями соседних измерений (винзорирова- ние). * Заметим, что в большом числе случаев после нахож¬ дения оценок й, Я параметров сдвига а и масштаба Я це- лесообразно измерение всех других характеристик прово¬ дить по стандартизованной выборке у1 = {хг — л)/А или У (0 == (х (0$) А- В случае необходимости можно пере¬ считать распределение X в распределение У. Оценивание параметров а, Я, являющихся функциями. Теперь рассмотрим случай, когда параметры распределе¬ ния сами являются параметрическими функциями. Поло¬ жим, например, что Л"(£) — нестационарная случайная, функция, распределение которой имеет постоянные по вре¬ мени параметры формы и нестационарные параметры сдвига a(t; Pi) и масштаба Я(rf; р2), т. е. X(t)=a(t; Рх) + ~ЬЯ(/; 02)У(О, где У (/) — стационарная стандартная ’(ау=0, Яу= 1) случайная функция. Необходимо по вы¬ борке оценить параметры Pi и р2, если известна функци¬ ональная форма a(t} PiJ и Я(^ р2). Заметим, что если М*> Р)=Я—const, то задача переходит в задачу оценива¬ ния параметров тренда (чаще всего при этом полагают, что У(4) — б-коррелированная функция) и в задачу ли¬ нейной фильтрации, параметрического линейного и нели¬ нейного регрессионного анализа, решение которых дано во многих работах. 133
Если известно многомерное распределение или неста¬ ционарное одномерное распределение при независимой -выборке, то коэффициенты рЬ' fh можно найти методами МП-оценивания. При отсутствии подобной информации чаще всего оценки Pi и 02 находят методами НК и- НМ, •их модификациями, связанными с видом функций a (t), X(t), взвешивающих множителей W [см. (2.14)], стационаризэ- цией функции X (t) ее дифференцированием или взятием разностей, сглаживанием реализаций и т. д. 4.3. ОЦЕНКИ ПАРАМЕТРОВ ТИПОВЫХ РАСПРЕДЕЛЕНИЙ Не имея возможности привести различные оценки па¬ раметров типовых распределений и тем более положитель¬ но-отрицательные матрицы для них, дадим краткое резю¬ ме по имеющимся публикациям и полученным результа¬ там *. 1. В первом приближении библиография по ^оценкам параметров дана в [79] и в цитируемых ниже публикаци¬ ях. Различные оценки параметров распределений нормаль¬ ного, экспоненциального, равномерного, гамма, Лапласа, Коши, бета-1 рассмотрены в [56, 58, 60, 66, 75, 89, 102, 107, 113, 116, 160], логистического — в [65], 3~-распределения и распределения Вейбулла —в [58, 160], м- и МП-оценки параметров распределений Джонсона и Пирсона — в [18, 58, 102, 115, 117, 124, 144], распределений типа смесей — в [2, 58, 62, 65, 109, 147], ЗХ-оценивание при аппроксима¬ ции непараметрических оценок распределений смесями — в [2, 62], ортогональными рядами — в [18] и т. п. В [142] рассмотрены ММБ-оценки параметров 0, основанные на минимизации какого-либо расстояния между эмпирическим и- теоретическим распределениями, в [150] —оценивание по минимуму меры Кульбака — Лейблера. 2. В большинстве случаев м-оценки параметров проще в вычислительном отношении, чем более эффективные оценки (принцип Ян), однако эффективность их может быть весьма малой. Так, например, как показано Р. А. Фи¬ шером, для всех распределений семейства Пирсона эффек¬ тивность м-оценок параметров превышает значение 0,8 лишь для распределений, мало отличающихся от нормаль¬ ного (|yi|^0,1 и —0,35^|V21^0,42) [18]. В частности, эффективность м-оценки параметра формы а гамма-рас- 1 Автором систематизированы известные и полученные впервые различные оценки параметров 30 абсолютно непрерывных распределе¬ ний, реализованные в виде программных модулей. 134
пределения (при совместном оценивании а, X, а) по срав¬ нению с МП-оценкой составляет всего 0,22 при а=5, при а—20 она раявна 0,65 и только при ia>39,l она превышает 0,8. В связи с этим м-оценки в большинстве случаев следу¬ ет использовать лишь в качестве первого приближения при численной реализаций алгоритмов МП, МХК, Р и других, более эффективных методов оценивания. Отметим также, что м-оценки без применения функциональных. преобразо¬ ваний выборки не применимы для распределений, не име¬ ющих нужных моментов (см., например, [43]), их приме¬ нение проблематично также для лолимодальных распреде¬ лений. Достоинством м-оценок является универсальность формул для ЭХ-оценок моментов по выборке. 3. Качество (в частности, сложность и трудоемкость вычислительных' преобразований, -эффективность) оценок параметров распределений существенно, зависит от числа неизвестных оцениваемых параметров. Как правило,, за¬ траты на вычисление возрастают значительно быстрее при-' роста числа оцениваемых параметров, а эффективность па¬ дает. С другой стороны, добавление новых параметров не всегда оправдывается в приложениях [122]. Снижение эффективности объясняется, в частности, тем, что доста¬ точные статистики, отличные от тривиальных, могут су¬ ществовать Лишь при условии, что некоторые параметры распределения известны, фиксированы. Например, при не¬ известном параметре формы р для ST-распределения (см. [43]), а следовательно, и для распределения Вейбулла не существует нетривиальных достаточных статистик. Для гамма-распределения (см. [43]) есть достаточная, статис¬ тика для а при известных а, X, для X при известных а и a есть совместно достаточная статистика для (X, а) при из¬ вестном а, но нет совместно достаточной статистики для (a, X, а) [65]. 4. Многообразие различных методов оценивания при¬ водит к многообразию оценок одних и тех же параметров данного распределения. Лишь в редких случаях различные методы, основанные на различных критериях оптимально¬ сти, приводят к одним и тем же оценкам. Это лишний раз подтверждает некорректность оптимальных оценок 1112J., проявляющуюся в том, что различные критерии приводят к различным оценкам. С другой стороны, очень часто раз¬ личные оценки оказываются асимптотически (при неогра¬ ниченном увеличении объема выборки) эквивалентными по метрологическим показателям качества. В таких случа¬ ях выбор оценок должен осуществляться по другим пока¬ 135
зателям качества, первыми из которых должны быть по¬ казатели, связанные с выполнением принципов устойчиво¬ сти лаг, простоты вычислений ян и универсальности Я]8. Многообразие оценок иллюстрируется табл. 4.1 и 4.2 на примере оценок параметров нормального и экспоненци¬ ального распределений. Заметим, что при определенных условиях. [107] нор¬ мальное распределение N(a, Д)—-это единственное, для которого (х, 3)) есть МП-оценка (a, X2), причем х и 3) не¬ зависимы при любом N [66], а экспоненциальное распре¬ деление Э (0, Я) — единственное, для которого х есть МП-оценка X. 5. Свойства оценок параметров, их качество и удобство использования зависят от того, как вводится параметр. Например, для нормального распределения в качестве па¬ раметра можно рассматривать X или X2. Отличия в фор¬ мулах оценивания и в качестве оценок X и X2 наглядно видны из табл. 4.1. Если параметр положения (сдвига) а вводится для распределений заданной формы, то его введение не отно¬ сительно нуля, а относительна центра распределения обес¬ печивает некоррелированность МП-оценок параметров сдвига а и масштаба Х'[65]. Как правило, наличие кор¬ реляции затрудняет использование, а порою и получение оценок [65]. Даже .в тех случаях, когда различным обра¬ зом введенные параметры и их оценки связаны линейной зависимостью, правило введения параметра может повли¬ ять на их свойства и удобство использования. Иллюстра¬ цией этого является табл. 4.3,- в которой даны несмещен¬ ные оценки с равномерно минимальной дисперсией для параметров, введенных различным образом. 6. Большинство оптимальных оценок резко теряют свой замечательные качества, в' частности свойства несмещен¬ ности и эффективности, при отклонении от стандартных условий, при. которых они приемлемы (истинный закон распределения выборки отличается от того, который мы ей приписываем, зависимость элементов выборки, наличие не¬ известных мешающих параметров, помех и т. д.). В тех случаях, когда мы располагаем информацией об этих от¬ клонениях, мы можем оценить их влияние на качество оценок либо выбрать робастные алгоритмы оценивания. Под робастностью понимается слабая чувствительность к отклонениям от стандартных условий. Если истинное рас пределение отличается от распределения, положенного в основу алгоритмов оценивания параметров, смещение и 136
Таблица 4.1. Типовые оценки параметров нормального распределения N(a, о я <U g В 5' X о 2S 3 в cf О, я в н « v Я <и О •& ,-е* 'со <« г о ео I *1* D cS zf Z г г со со 3 о в <м| в г Z г со со я -« о 5 в У W а 5- Л. Я 5 2: Математиче- ' ское ожида¬ ние оценки в С5 2с S: Формула для оценки параметров II *Н X ^ * 1 -1* 1* В Л 'SJ. ю <>? II (а «1 'З' II 1 я * J.*W3 <Q -I* II X с ^ * - 1 1 5. + > ^ (Q Метод оцени¬ вания м, МП, МГД, Питмена Квантилей м, МП, МГД, НК Моментов приращений Оцени¬ ваемый пара¬ метр в са II 137
Продолжение табл. 4.1
Продолжение 139
Продолжение табл. 4.1 В Я * * а о. о. о ** К « * % о о 2 СО S н|| я 5 S S ° о X X S X в Ч Ч а» *55 55 В О. О е 2 аз s я Я 2 « о со я К и « I я 5 * со 1 >, X * в 5 С?£Г % (N a % у СО _ 8 " | 3 я g ё * S I * s. I 1.С 5 £* о < я S. 8 со СО о" г + I В I <М + оГ I. I :h +- § СО + г< г< <3 I* Я Я »я 0 1 СО <*< J3 н 8 )-< V !3 13 >2* . N >-< *з 13 р о . «3 Я 3 СО Л £ 55 а£ « «и СО 2 О я °3 ±!s i I s § СО § JsS Е о я я н и & r<i Q 140
Таблица 4.2. Типовые оценки параметров экспоненциального распределения Э(а, X) / ' 141
Продолжение табл. 4.2 з § S *ef • о £ со 6* S ч \о со Ий н 0) S f'r и 4 <S* <м + I еч й: 5. "а X X I I s. £ 1- 1 * й - II <« 03 *а 142
Продолжение табл. 4.3 143
дисперсия оценок могут быть найдены усреднением не по приписываемому, а по цстинному распределению и затем в случае необходимости сопоставлены со смещением и дис¬ персией оценок, полученных в стандартных (номинальных) условиях. Подобные приближенные асимптотические фор¬ мулы для м-, МП-Ч1 НК-оценок даны в [89, 118]. Такая ситуация может иметь место, например, при автоматиче¬ ском выборе распределений, упорядоченных одним из ме¬ тодов, описанных в [43]. В этом случае в качестве альтер¬ нативных следует брать распределения, соседние с тем, для которого оцениваются параметры. Иллюстрацией ска¬ занного является табл. 4.4, в которой рассмотрены две оценки ~(&=х и й=х0>5) параметра сдвига а пяти симмет¬ ричных распределений. В таблице для оценок й=х0,5 даны Таблица 4.4. Эффективность оценок параметров Распределе¬ ние Оценка а Дисперсия, 0{а} Эффективность оценки eff ((г) ► Отношение дисперсий Нормаль¬ ное N (а, X) X Х2/ЛГ 1 1 *0. б ’ *Х2/2N 0,64 0,32 Лапласа L (а, X) X 2Х2/ЛГ 0,5 1 /Ч *0,6 Х2/ЛГ 1 4 Логисти¬ ческое Л(а, X) X *2Х2/ЗЛГ 0,91 1 /Ч Х0, 5 4 Х2/ЛГ 0,75 0*41 , Коши К (а, X) 'х X2’ 2/N — Х0, 5 ri2X2/4V 0,81 — Пирсона VII Яуц(я» X; а) 3 при «> — X X2 (2а — 3) (а+1)(2а—З)2 а (4а2— .1) 1 /Ч Х0, б яХ2Г2 (а—0,5) 4NT2 (а) 4(«+1)(2а-3) 2Г2 (а) ап (4а2 — 1) Х Г2 (а) Х Г2 (а —0,5) *(2а — 3) Г2Х X (а—-0,5) 144
асимптотические результаты, а в правой колонке приведе¬ ны значения отношения дисперсии Dl(£) для распределе¬ ния Лапласа к D(4) для других распределений в предпо¬ ложении равенства дисперсий D(X) случайной, величины X для всех распределений. Влияние зависимости элементов. выборки на метроло¬ гические показатели оценок может быть оценено по ре¬ зультатам § 3.2. При оценивании параметров распределе¬ ний случайных процессов вместо • дискретных алгоритмов оценивания могут -использоваться непрерывные. Переход к ним можно осуществлять либо заменой суммирования интегрированием, переходя от формулы типа (3.15) к (3.14), либо с помощью специальных процедур, свойствен¬ ных непрерывному траекторному усреднению. Различные робастные методы оценивания параметров распределений рассмотрены в [3, 56, 58, 60, 113, 119," 120]. Предыдущее, пятое замечание особенно необходимо иметь в виду именно с учетом устойчивости, робастности оценок параметров. Так, например, параметры масштаба, рекомендуемые в [43], являются плохо введенными с точ¬ ки зрения робастности (прежде всего смещенности) их оценок, получаемых через оценки среднеквадратического отклонения, в силу того, что коэффициент пропорциональ¬ ности k=o/X сильно различается для разных распределе¬ ний. По смещенности подобных оценок правильнее было бы ввести параметры X для всех используемых распреде¬ лений, так чтобы коэффициент k был одинаковым для всех распределений, например, равнялся единице. Понятно, чтр при таком подходе к введению парамет¬ ров распределений они будут зависеть от принципов и ме¬ тодов оценивания параметров. В частности, если за основу взять принципы несмещенности и устойчивости (робастно¬ сти) jii2 к виду распределения, то при оценивании пара¬ метра а через выборочную медиану хо,5 в качестве пара¬ метра а следует взять медиану распределения (либо сред¬ нее значение интервала медиан). При оценивании масштабного параметра X через выборочную интерквар- тильную широту его необходимо выбирать так, чтобы он имел одинаковое значение для разных распределений, ес¬ ли для них совпадают интерквартильные широты х3/4 — xi/4, допустим Х=1/г (х3/4 — х!/4), и т. д. В этом случае соответствующим образом пёрёпишутсй распределения в [43]. Тогда, сопоставляя значения ро¬ бастных и неробастных оценок подобных параметров, мож- 10—192 145
но при их резком отличии поставить под сомнение соответ¬ ствие истинного распределения выборки приписывае¬ мому ей. 7. Многие методы оценки параметров без изменений или с небольшими модификациями применимы к данным, подверженным группированию, квантованию' по уровню значений элементов выборки. Модификации сводятся либо к введению поправок на группирование типа поправок Шеппарда (например, методы моментов, МП), либо к кор¬ ректировке условий существования, единственности, со¬ стоятельности и эффективности асимптотической корреля¬ ционной матрицы (например, для МП-оценок) [66, 76]. При этом оказываетя, что уже при 15—30 равномерных интервалах группирования, приходящихся на интерквар- тильную широту, влиянием группирования можно прене¬ бречь. При меньшем числе интервалов желательно учиты-. вать оптимальное расположение границ интервалов груп¬ пирования [76] либо использовать стохастическое кванто¬ вание — добавление к исходным данным вспомогательного [интерполирующего) случайного воздействия, равномерно распределенного в пределах интервал а-группирования или интервала значений исходных данных. 8. В тех случаях, когда тот или иной метод оценива¬ ния параметров неприменим цля выборки х, можно выбор¬ ку подвергнуть преобразованию. y=f{x), позволяющему для выборки у эффективно применять этот метод. 4.4. ПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ ФУНКЦИЙ И ПЛОТНОСТЕЙ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ Первый вариант параметрического оценивания функций Р(х; 0), плотностей W(x;' 0) и вероятностной функции Р(х; 0) сводится к нахождению оценок видаР(х) =Р(х, 0), l^(x)=W7(x, 0) иР(х)—Р(х; 0), где F, W, Р—задан¬ ные функции, а ©■— какая-либо оценка параметра 0. Если при таком оценивании выбирать в качестве оценок в МП- оценки,, то согласно результатам § 2.2 оценки F(x, 0), W (xf0) и Р(х; 0) будут МП-оценками F (х), W(x) и. Р(х), т. е. в случае принадлежности Р(х), W (х), Р(х) к классу распределений Дармуа — Купмена. они будут функциями совместно достаточных статистик, не зависящих от 0 (вы¬ полняется принцип Я7). Математические ожидания и дис¬ персии таких оценок могут быть найдены методами, ука- 146
занными в § 2.2. Например, МП-оценкаяли ~Р(х) и %(х)' цля нормального распределения будут N (х; х, 1&) и N'(x; к, Ъ). Качество оценок -Q(d, 0) будет определяться не только методом оценивания параметров 0, но и тем, как вводятся эти параметры. Так-, например, для равномерного на интер¬ вале с, d непрерывного распределения оценки Р(х) =Р(х; 0) и I?' (х) = W (х, 0), найденные через, оценки с, й, опреде¬ ляемые первой строкой табл. 4.3, и через c=*(i), S=x(N), будут асимптотически несмещенными, с одинаковыми асимптотическими дисперсцями: D;{#(x)}=D{r(x, ?.:3)}=-~iP(x). (Щ D{F(x)} = D{F(x; с, -2F(x)[l -JF(x)j}G ^Ыг- ‘i5r]; (4,9) Во втором случае точное значение математического ожидания M{l^(x)}=M{^(x; x<i), X(n>} равно нулю Для х<с, х>е? и l(d~ с)"~' -(d~х)"~'- -.{Х-С)"-'] (4.10) для c^x^.d, N^3. С другой стороны, при задании и. оценивании парамет¬ ров согласно второй строке табл. 4.3 оценки ^(х) и /?(х)' будут также асимптотически несмещенными, D{l^(x)} бу¬ дет асимптотически определяться (4.8), а дисперсия оцен¬ ки Р{х)—Р{х; й, Я) будет асимптотически равна D(F(x. г. 2» = ^L,(l+2f(x)ll-f (х)])€ [^; (4.11) т. е. может быть в 3 раза больше, чем для оценки F(x; 6,Н). Если один из параметров 0,- оценивается с дисперсией D{9,} порядка 1 /N2, в. то время как дисперсии оценок других параметров 0S, s =?*=/, имеют дисперсии порядка 1 /N, то асимптотически погрешность оценки 0; практически не будет проявляться^ погрешности оценки F, W или Р. На- 10* 147
пример, если для экспоненциального распределения с) (а, /N Ч Я) .оценка (й, Я) параметра (а,' Я) находится как НРМД- оценка (см. табл. 4.2), то. асимптотически дисперсии оце¬ нок Р(х) =Э(х; а, Я) и Т^(х)=Э'(х; а, Я) будут опреде- литься только дисперсией Р{Я} и будут равны b{F(x)} = D{9(x, a. X)}^-L([l-F(x)]ln[l-F(x)})\ (4.12) D{f (x)} = D{9'(x; а, +ln[l-F(x)]}2^(x). (4.13) Разумеется, (4.8) —(4.13) и им подобные соотношения в дальнейшем справедливы, если истинное распределение совпадает с приписываемым выборке. Если же это не име¬ ет места, в (2.35), (2.36) необходимо брать значения 0 и Rm, найденные усреднением по истинному распределению. Другие примеры подобных оценок и их законов распреде¬ лений даны в [109]. Вторым вариантом параметрического оценивания /*'(х), W (х), Р (х) является несмещенное ' оценивание в виде функций от достаточных статистик а (разумеется, если они существуют) ,бёз предварительного оценивания парамет¬ ров 0. Как указывалось в конце § 2.2, такое оценивание может осуществляться решением уравнения (1.32), по (2.11) или по формуле Байеса. Например, при оценивании №(х) оценка ТР'(х) находится как условная плотность Г(х|а): #(х)=Г(х [ д)=^(х; а|8о) , " (4.14) w v ' W(a | 0O) ' ’ где W{x; aj6o) и W (a|0o) — совместное и маргинальное распределения любого (-го элемента выборки x,v i—\,N, и достаточной статистики т» при некотором (любом) фикси¬ рованном значении параметра 0. Как правило, находить оценки по (4.14) и (1.32) проще, чем решением(2.11). Подобные оценки, как указывалось в § 2.2, будут несме¬ щенными с равномерно минимальной дисперсией (НР.МД- оценки). Они рассматриваются в [58, 81, 120]. В частности, если неизвестными параметрами являют¬ ся только параметры положения типа усечения I или II ро¬ 148
да, то НРМД-оценки Р[х) и ТР;(х) могут быть найдены по (4.1), (4.2). Формулы для НРМД-оценок при неизвестных параметрах сдвига и масштаба могут быть получены по результатам [58]. Примеры НРМД-оценок Р(х) функций распределения F(x) приведены в табл. 4.5, НРМД-оценка плотности рас¬ пределения N'(x; а, 1) равна N'(х; x,V(N—l)/N). Если неизвестны а и Я, то НРМД-оценкой нормальной Таблица 4.5. Примеры НРМД-оценох функций распределения Наименование и обозначение распределения А (х; а, X, а) НРМД-оценка функции распределения F (х) = А (х; а, X, а) Дисперсия оценки Примечание Нормальное N (а, 1) N ^х, х; а, а; 1, -№<«; ' а, X) = F ^х, х; а, 1)]* НРМД-оценка асимптотически совпадает с МП-оценкрй N (х; x,Y(N—l)/N) Равномерное4 Л(0Л) 0 при (N — 1)х N при 0 < NX(N) * *(#)•' 1 при х>*(Л0 F«(x) — Fn(x) N (N — 2) ’ ЛГ>3 НРМД-оценка асимптотически совпадает с МП-оценкой Экспоненци¬ альное Э (а, X) 0 при х < X(\)t X(i) ^ х ^ у, 1, Х>У=Х(!) + + ЛГ (х —Х(х)); z= 1 ^(Х —Х(х))Х Х[^(7-х(1))]-1 (X —а)« у X (x) — 149
плотности N'(x; о, Я) будет оценка А. Н. Колмогорова W (х) =— N' (х; а, X) — N—4 о г - *2 12 (4.15) [О, I г I >JV—1,, где *=(x-*)//i, 6 = Г(^)[к*(^-а)Г (^)]_1 Г (а) — гамма-функция. Сопоставляя подобные оценки с параметринескими, по¬ лученными по первому варианту, можно оценить эффек¬ тивность одних оценок по отношению к другим. ..В ряде случаев, как, например, для нормального распределения, можно найти оценки iF(x, 0), И7(х; 0), асимптотически эк-, вивалентные по. дисперсии НРМД-оценкам, но более прос¬ тые в вычислительном отношении. Аналогично оцениваются вероятностные функции при заданных а, Ь и законе распределения величины X, функции надежности F(x)= 1—F(x), функ¬ ции опасности, структурные характеристики ’ и т. д. (см. табл. 1.2). ^ ^ При определении эффективности оценок различных ха¬ рактеристик следует пользоваться (1-42). 4.5. ПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ ОДНОМЕРНЫХ ПРОИЗВОДЯЩИХ, ХАРАКТЕРИСТИЧЕСКИХ, СЕМИИНВАРИАНТНЫХ ФУНКЦИЙ И ЧИСЛОВЫХ ХАРАКТЕРИСТИК Первый вариант параметрического оценивания (см. § 2.1) названных функций сводится к использованию ана¬ литических выражений производящих G(z;, 0), характери¬ стических 0(ы, 0) и темиинвариантных Н (и, 0) функций аргумента z и параметра 0 для используемого распреде¬ ления (см., например, [43]). Вначале находятся оценки 0 Параметров 0 распределения, затем вычисляются значения G(z, ”0), в (и, 0), Н(ы, ^0). Смещение и дисперсии таких оценок могут быть рассчитаны точно или приближенно, по- (2.33)—(2.36). В-силу Обстоятельств, указанных ранее, желательно при этом использовать МП-оценци. Например, для нормального распределения МП-х>ценками будут §(M) = N(«, х, V%), H(«) = lnN(«, х, V%, 150
N(u).— нормальная характеристическая функция. Второй вариант основан на использовании достаточных статистик. В частности, подобные несмещенные оценки ха¬ рактеристической функции ®(и) могут быть найдены (см. [81]) по формуле Ь(и) = Ще1и*}, (4.16) где Я имеет распределение Р(х) (или Р(х), -№(х)), пред¬ ставляющее хобой доста^чную НРМД-оценку F (х) (или. Р(х), Щх». Например, для нормального распределения N(a, 1) имеем 0(u) = N(u; х, Y{N — l)/N). В первом варианте параметрического оценивания изме¬ ряемые числовые характеристики, такие как начальные и центральные моменты, кумулянты, квантили, моды, коэф¬ фициенты асимметрии," эксцесса, рассеяния и т. п. (см. табл. 1.2), предварительно выражаются'через параметры 0 распределения, как это сделано, например, в [43], т. е. за¬ писываются в виде функций f(B) параметра 0. Затем на¬ ходятся оценки 0 и рассчитываются знамения /(0). Опять- таки прежде всего обращают на себя внимание МП-оцен- ки. -Так, например, МП-оценкой р.2ь момента ргь нормаль¬ ного распределения N (а, Л.) является оценка £* = (2*-1)1! ф)\ (4.17) которая будет асимптотически несмещенной с дисперсией 0{£2*} = ^2*Ч(26-1)!!]г. (4.18) Второй вариант несмещенного параметрического оценива¬ ния через достаточные статистики может быть реализован различными способами: по формулам типа (4.1), (4.2); решением'уравнения (1.32); по (2.11); по аналитическому выражению, лежащему в основе определения характерис¬ тики, когда вместо функции, ряда, плотности распределе¬ ния; характеристической или семиинвариантной функции подставляется ее Д-оценка (НРМД-оценка). Последний способ несмещенного оценивания моментов через оценки характеристической функции и законов распределения от¬ мечается, например, в [81]. 151
Глава пятая -iV Параметрическое оценивание многомерных и условных характеристик 5.1. ОБЩИЕ ЗАМЕЧАНИЯ О ПАРАМЕТРИЧЕСКОМ ОЦЕНИВАНИИ МНОГОМЕРНЫХ И УСЛОВНЫХ. ХАРАКТЕРИСТИК Рассмотренные в гл. 4 методы оценивания параметров и параметрического оценивания характеристик с соответ¬ ствующим обобщением переносятся йа параметры много¬ мерных и условных распределений и на параметрическое оценивание многомерных и условных характеристик, ид- нако в этом случае исследователь встречается по крайней мере со следующими трудностями. Первая связана со зна¬ чительным усложнением математических выкладок, пре¬ образований и расчетов, вторая — с сужением класса мо¬ делей, для которых применимы, т. е. могут быть фактиче¬ ски перенесены, те или иные методы параметрического оценивания, используемые в одномерном случае. Как уже указывалось в § 4.3 (замечание 3), даже в одномерном случае применимость и эффективность методов оценивания существенно зависят от числа оцениваемых параметров? Например, МП-оценки могут существовать или не сущест¬ вовать в зависимости от того, известны ли некоторые па¬ раметры или все параметры не известны. Даже в тех слу¬ чаях, когда для параметров одномерного распределения существуют некоторые оценки, они могут не существовать для тех же параметров в многомерном случае. Третья трудность связана с-выбором правила введения параметров распределения. Как указывалось, от того, как будут введены параметры, зависят их метрологические по¬ казатели и метрологические показатели оценок характе¬ ристик, в которых затем'будут использованы эти пара¬ метры. Четвертая трудность связана со значительным увеличе¬ нием статистических погрешностей характеристик при их усложнении. . * _ Указанные трудности наряду с другими (сложность вы¬ вода, представления и интерпретаций результатов, обеспе¬ чения робастности и т. п.) приводят к тому, что в много¬ мерном случае чаще всего ограничиваются, во-первых, наи¬ более простыми характеристиками (матрицы средних, дисперсий, корреляционные матрицы, функции регрессии 152
и т. п.), во-вторых, наиболее простыми в вычислительном отношении и сравнительно универсальными методами оце¬ нивания (НК, НМ). Особенно широкое применение, как указывалось в § 2.2, НК- и НМ-методы нашли при оцени¬ вании параметров функций регрессии, для которых доволь¬ но часто используется также МП-оцевдвание, а также при оценивании параметров нестационарных математических ожиданий процессов со стационарными флуктуациями. 5.2. ОЦЕНИВАНИЕ ПАРАМЕТРОВ И ПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ КОРРЕЛЯЦИОННЫХ ФУНКЦИЙ Вводные замечания. Прежде всего отметим, что^ с од¬ ной стороны, корреляционную функцию или матричную корреляционную функцию R(t), р(т) для каждого значе¬ ния аргумента % можно рассматривать и оценивать как параметр двумерного (многомерного) распределения. С другой стороны, если известна функциональная форма корреляционной функции с точностью до параметров, то можно отдельно оценивать только параметры самой корре¬ ляционной функции. Рассмотрим второй случай. Наиболее часто для подобного параметрического оце¬ нивания используются методы значений характеристик и наименьших квадратов, когда корреляционная функция представляется в виде ряда по ортогональным функциям, степенным, экспоненциальным, экспоненциально-косинус¬ ным, треугольным и т. д., а значения оценки самой кор¬ реляционной функций получаются каким-либо непарамет¬ рическим методом, как правило, методом эмпирических характеристик. Подобные методы фактически являются смешанными и поэтому будут рассмотрены в гл. 7. Рассмотрим для конкретности скалярные стационарные случайные функции X(t), а именно процесс X(t), Ye (—оо, оо) и последовательность X(i), i=0, ±1, ±2,..., с кор¬ реляционной функцией R(x)=R(t‘, 0), те(—оо, оо) или т=0, ±1, ±2, .”.которая считается известной с точно¬ стью до параметра 0={0ь 02 6п}. Будем полагать, что оценивание осуществляется по траекторией выборке, т. е. по x(t), te[0, Т], в непрерывном случае или по л:(i).либо по x(iAt), ie [О, N—\], в дискретном случае. •Метод максимального правдоподобия. В качестве пер¬ вого метода оценивания параметра 0 рассмотрим ,'МП-оце- нивание. Идея этого метода описана ранее. В непрерыв¬ ном случае используются функционалы правдоподобия или производится аппроксимация непрерывного процесса по- 153
следовательностью. При довольно общи* условиях регу¬ лярности МП-оценки параметров 0 корреляционных функ¬ ций являются асимптотически эффективными, нормальны¬ ми [47, 50, 128, 129, 137], ' Рассмотрим для примера нормальную центрированную случайную последовательность X(i) с конечной дисперси¬ ей R(0), с абсолютно непрерывной спектральной плотно¬ стью S(v) —obs(v, 0), | v | ^ я и соответствующей ей кор¬ реляционной функцией R (т, 0). Пусть R={R{i—k; 0); t, fe=0, TV—-1} —корреляционная матрица последовательно¬ сти X (0),..X (N—1). Тогда логарифм правдоподобия выборки х={х (0),.. .,x(N—1)} будет lnZ.(jf/0) = - -i-[Win(2*)+In II R ||+JfTR_1 v], (5.1) T; e. ПМ-оценки 0 могут быть найдены максимизацией (5.1). При заданном виде R(k; 0) и при довольно общих условиях регулярности [46, 128, 129], они будут состоя¬ тельными, асимптотически нормальными, эффективными. Даже в этом простейшем случае решение подобной зада¬ чи связано с Нахождением ||R||, R-1, что является сложной задачей, с нахождением экстремумов сложных функциона¬ лов от. элементов выборки,, т. е. сводится к задаче нели¬ нейного функционального анализа, обычно не . допускаю¬ щей решения в явном виде. В тех редких случаях, когда такое, аналитическое решение удается отыскать, оно ока¬ зывается слишком сложным для практическрго использо¬ вания [46, 129]. Численное же решение может оказаться довольно трудоемким. Поэтому МП-оценки, как правило, рассматриваются лишь для сопоставления, для определе¬ ния потенциально дОстиЖимой точности. В практике'ис¬ пользуются чаще всего другие, более простые, но асимпто¬ тически эффективные оценки, некоторые из которых будут рассмотрены в дальнейшем. В качестве примера будем рассматривать нормальные случайные процессы и последовательности с дробно-раци- ональной спектральной плотностью типа (1.6), (1.10), (1.13), позволяющие аппроксимировать многие реальные сигналы, полагая в них, что параметры щ,...,аР, b\..,bq зависят от 0ь 02 On-- В этом случае при выполнении соответствующих условий регулярности [46, 47, 128, 129, 138, 143] для НАН-оценок (в частности, для МП-оценок) параметров 0, в том числе 0i=Oi, ..., вр=ар, Qp+i=bi, ... .. v %nj=zbq, Можно асимптотически получить сравнительно 154
простую формулу корреляционной матрицы Я£. = {М{(?г — — б*)}; i, k—ГТп) оценок в,,..., 0„. В обозначениях Г—Г, Л=(—оо, оо), %=& для непре¬ рывного случая и Г=N, Л=[—я, я], X=v, T=N&t, xt= =Atx(iAt): для дискретного случая, 1г (0) ={1<а. (0) ; i, k= = 1, «} имеем (см. табл. 2.5) В (5.2) член 0(1 /Г) пренебрежимо мал по сравнению с первым членом, когда Г во много раз больше интервала (времени.) корреляции X(t), производные берутся в точке 0=0о истинного значения параметра 0, a s(v; 0) = О Л.. Л\ О - Обратим внимание на следующие обстоятельства. 1. В параметры 0 для случайных процессов не входит параметр.^ — интенсивность белого шуМа (см. § 1.3). Теоретически согласно теореме Бэкстра его можно опре¬ делить совершенно точно по сколь угодно малому отрезку реализации. Однако для этого необходимо использовать информацию, содержащуюся во флуктуациях процесса сколЪ угодно большей частоты, что практически недости¬ жимо. Определить значение Sn совсем нелегко [47]. В свя¬ зи с этим либо Sn оценивается отдельно либо производит¬ ся соответствующая нормировка спектра, л ибо'случайный процесс вида (1.6) заменяется последовательностью вида (1.10), (1.13) с дисперсией S(i), равной 0в2 [63]. Во всех этих случаях, как правило, рассматриваются оценки пара¬ метров 0, не содержащих Sn, ста2- Для последовательностей вместо Sn рассматривается дисперсия ps2 величин S(i), для которой можно найти МП-оценки непосредственно по (5.1.), вынося аа2 за корреляционную матрицу R, т. е. пре¬ образуя R к виду R=<Ta2r, где г зависит только от 0. Если это удается сделать, то из (5.1) имеем МП-оценку <ха2 в виде (см. [129]) где МП-оценка / 0- находится минимизацией квадратичной формы хП~1 (0)ле. А =S(v; 0)/оа2. (5.4) 155
2. Асимптотическая нормальность МП-оценок 0 и ра¬ венство (5.2) имеют место для более' общих (т. е. отличных от нормальных) последовательностей X(i) с ко¬ нечным четвертым семиинвариантным Х4, если от 0 зависит лишь отношение S(v)/<Ji2, где <ji2 — средний квадрат ошиб¬ ки наилучшего линейного прогноза. X{i) на единицу вре¬ мени вперед [128, 129]. 3. В ряде случаев для последовательностей вместо (5.3) более удобной формулой может оказаться (1.36). Примеры аналитических выражений МП-оценок 0 для ча¬ стных случаев процессов и последовательностей можно найти в [46, 47, 128, 129, 138, 143].- Модификации метода максимального правдоподобия. Более простым методом, дающцм асимптотически эффек¬ тивные оценки параметра 0 корреляционной функции и спектра, является модифицированный метод максимально¬ го правдоподобия (ММП-оцейивание) максимизирующий лишь «главную часть» логарифма правдоподобия £(дс|0), удовлетворяющую условию типа N~i/2 (£ (х 10) —£ (ж 10)) -ИЭ при N->-oo (в смысле сходимости-по вероятности). [46, 129]. Для иормальных последовательностей со строго положи¬ тельными спектральными плотностями S(v) и для 'плот¬ ностей с фиксированными нулями можно выбрать главную часть £ так, чтобы она имела простой вид [46]. В первом случае при нежестких условиях — периодограмма последовательности Xi^Atx(iAt), — I m < S (v) .< AT, т, М > 0, — Sp2(0<°°. (5.5) (5.6) где , (5,7) t=0, N— 1, а S(v)=<Ts2=<Ta2s(v; 0). 156
Из (5.6) следует, что ММП-оценка 0 может-быть най¬ дена как корень системы уравнений. — периодограмма' траектории x(t), te [О, Г]. Чтобы избежать оценивания Sn в непрерывном случае, можно от непрерывного нормального процесса X(f) перей¬ ти к последовательности X (i). Для. последовательности типа (1.13) оценка оз2 может быть найдена по формуле Интересно отметить, что полученные таким образом ММП-оценки распространяются на более общие, т. е. от¬ личные от нормальных,/ линейные процессы и последова¬ тельности с конечным четвертым семиинвариантным, для которых такие оценки асимптотически эквивалентны НК- оценкам [10, 48, 128, 129], асимптотически ^состоятельны и асимптотически нормальны. Однако оценки 0 в этом случае будут иметь корреляционную матрицу, отличную от (5.2), а распределение VN (аз — оа ) будет асимптотически стре¬ миться не к N (0, 2as4), а к N.[0, <тв4 (2+угв) ], где уга — коэффициент эксцесса последовательности S (i). Третий метод основан на эквивалентном преобразова¬ нии соотношения (5.8) и замене в нем производных по не¬ известному параметру 0 на производные по некоторой со¬ стоятельной оценке 0 [49], в том числе путем включения оценки параметра as2 [48] и модификации метода накоп¬ ления Фишера (МФ-оценивание) [6, 128, 129] .'Подобные оценки также ..являются асимптотически нормальными, эффективными, с корреляционной матрицей (5.2). МФ- оценки используются, например, для оценивания царамет- где h~h или. Jn, (5.9)' [48, 59] (5.10) 157
ров 6t, 62,.. .,bq моделей (1.6), (1,10), для которых МП- оценки аналитически выразить затруднительно [6, 128, 159] . В [59] рассматриваются состоятельные оценки,' по¬ лученные как -значения 0, соответствующие максимуму только последнего слагаемого' в (5.6) для последователь- ОО ностей X(i) или максимуму j 1п~ j[).. jT dw для —ОО процессов X ((). В ряде случаев производить интегрирование в (5.8) за¬ труднительно или практически невыгодно. В этом случае можно вместо интегрирования как для процессов, так и для последовательностей использовать суммирование, за¬ меняя сплошные периодограммы У г $) решетчатыми (X,*), k<=K с равномерной или неравномерной сеткой (решеткой)" по Я. В связи с этим значительный интерес представляют периодограммы, найденные на основе алго¬ ритмов быстрого преобразования Фурье (БПФ). Для по¬ следовательной X(i) такая периодограмма -находится в точках %k=Vk=2kn/N\ k=0,N—1,' или при N четных (—N/2<k^N-/2). Для процессов X (t) осуществляется замена его последовательностью X (Ш), а БПФ-периодо- грамма находится в точках Юй==£Д(о, где Aa>=2n/NAt, что эквивалентно Vk=e>k&t=2kJt/N. Если /г (Я)- находится с помощью БПФ-процедур, то для оценивания 0 можно рекомендовать метод Робинсона [155], согласно которому оценка 0 находится минимиза¬ цией величины [ср.. с (5.8) ] ,(e>=TSIins(v'; в>+(5Л1> k где vk=2kn/N, —N/2<k^N/2, k¥=0 (нулевое значение k=0 исключается, чтобы избавиться от постоянной состав¬ ляющей) Г Данный метод пригоден для1 любых стационар¬ ных по отношению к четырехмерным характеристикам по¬ следовательностей и процессов с конечными кумулянтами «1,1,1,1 (tl, Т2, Тз) . В [155] предлагается находить решение (5.11) с по¬ мощью рекуррентных процедур Ньютона — Рафсона, когда р-итерация 0<р+о осуществляется по формуле ^p+.j^^W + lHiSpjrh^)), 1. (5.12) 158-
н<е>-{т% ; »}• <5is> -*<«> = e)-'»(vJl; (=TTS|. (5.14) где S/(v;0)=-^-S(v; 0). (5.15) Первое приближение 0д) можно найти более простым методом, Например методом моментов, значений характе¬ ристик и т. д. Если 0(i) — состоятельная оценка 0,. то при довольно общих условиях [155] даже при небольшом- числе итера- ^ л ций оценки 0(Р), р^2, почти равноценны оценкам 0, яв¬ ляющимся асимптотически несмещенными, нормальными с корреляционной матрицей [2Q-1+Q-,GQ-Ii> (5.16) 0 N Н%т7’ »<■ W '-v TC (5.17) (518) —■*1T где HS (A,, v, p);— кумспектральная плотность II рода 4-го 'порядка (см. табл. 1.1, а также [82, 129]). Сопоставляя (5.16),. (5.18) с . (5.2), (5.3) для гауссовых последовательностей с учетом того, что для них xi,i,i,i=U, видим, что, как и следовало, ожидать, рассматриваемые оценки асимптотически- эквивалентны .МП-оценкам. Другие спектральные методы. Рассмотренные методы оценивания параметров корреляционной функции относят¬ ся к спектральным, поскольку фактически сводятся к оце¬ ниванию параметров спектральных: плотностей мощности через функции, описывающие эти плотности. В связи с 159
этим к четвертой группе методов оценивания параметров корреляционных функций можно отнести все-другие мето¬ ды, связанные с, оценкой параметров спектральных плот¬ ностей (см. § 5.3). Одним из достоинств подобных методов оценивания параметров 0 функции R(т; 0) и параметри¬ ческого оценивания R (т; 0) в виде R (т) =R (т; 0) является обеспечение требования неотрицательной определенности оценки R (т). Методы ЧХ- и ЗХ-оценивания. Несмотря на стремле¬ ние упростить МП-оценки заменой их ММП-, МФ-оценка- ми и подобными. им не удается в общем случае получать значительного упрощения и универсальности вычислитель¬ ных процедур. В смысле простоты и универсальности вы¬ числений несомненный интерес представляют ЧХ- и ЗХ- оценки. ЧХ-оценки, т. е. оценки по методу числовых характери¬ стик, в данном случае реализуются чаще всего по типу К-оценок (оценок по методу квантилей). А именно, оценки 0 получаются решением уравнений ?Ы = ть 1 = й~п, (5.19) где р(т)—некоторая непараметрическая оценка нормиро¬ ванной корреляционной функции р(т), а г,- — заданные фиксированные числа. При этом |г,|!<1 и т,- должны при¬ надлежать (см. [47]) областям значений р(т) как функ¬ циям от 01,..., 0л, определяемым равенствами р(х<: 0) = гг, i = \7n- (5.20) Когда уравнения (5.19), (5.20) имеют несколько корней, 0 выбираются как наименьшие из корней этих уравнений. Предположим, что р(т) есть траекторная ЭХ-оценка, т. е. р(т)«=р.(т), s=l, 2, 3, ..., где р(т) —траекторная нормированная авто- [рхх (т) ] или взаимная [рхг(т)] кор¬ реляционная функция: ?хх (х) = Яхх (*)/Яхх (0), Рхг (х) = Лху (х)//Яхх(0)Яуу (0), (5.21) (х) = 1 /Г* ] х {t) у (t +1 х|),dt (5.22) о в непрерывном случае (Г=Г) или 160
Nk!—\ "S *(o£«+:hi) f (5.23) 1=0 в дискретном случае (Г=N); ri=IY=r; Г2=Г2/=Г—|т|; Гз=Г; Гз'=Г—|т|; -x(i) есть реализация X(i) или X(iAt), a x(t) =x(t)—Mx(t)} К Тогда при конечнсш моменте pi,1,1,1 (t\, k, h, ti) или кумулянте xi,i,i,r (ti, U, h, f4), как будет показано в гл. 7 р(т)„-для всех конечных т-СГ будет состоятельной оценкой р(т) для р(т) и, следовательно, состоятельными будут рас¬ сматриваемые ЧХ-оценки 0 (см. табл. 2.5)'. В частности, если р(т)=р(т), оценкй 0 будут состоя¬ тельными в гауссовом, случае, для которого корреляцион¬ ная матрица Rg оценок 0 фудет асимптотически равна (см. [47], табл. 2.5] R^= -i. R^1 (TR_) (RF’r, (5.24) Ur 9 где Re= j-JLp-h; 6, 0„); i, Ar=i7^j>, (5.25) Rr = {М{[РТхг)-p(xf)] [p («*)-p(,*)]}; /, k= Г7Й} (5.26) — асимптотическая корреляционная матрица оцецки р(т) (см. гл. 7). При ЗХ-оценивании 0i,..,0„ находятся решением си¬ стемы. уравнений ГК) = Р(*г; 0n). п. (5.27) В гауссовой случае такие оценки асимптотически эквива¬ лентны ЧХ-оценкам и имеют корреляционную) матрицу (5.24) [47] с той разницей, что для ЧХ-оценок т/, /=1,д, есть корни уравнения (5.20), а для ЗХ-оценок т< Назнача¬ ются пользователем. В связи с. данными оценками заметим следующее. Во-первых, вме¬ сто р([т) можно использовать'# (т), что приведет к замене р(т) в (5.25); (5.26) на #(т). Во-вторых, при конечном Г уравнения (5.19), (5.27) 1 В случае, если известно, что X (t) — центрированная функция, вме¬ сто x(t) можно брать x(t). 11—192 161
могут не иметь корней. Однако" при больших, Г для состоятельных оце- л . нок р(т) вероятность этого будет адала и будет стремиться к нулю при неограниченном увеличении Г. В-третьих, для ЗХ-оценок предпочтение следует ^отдавать значениям: т* i=l,n, являющимся специфичными для данного вида функции R(тг 0)* например точкам пересечения нуля, экстремальным и т. п. Это будет способствовать использованию допол¬ нительной информации, может привёсти к упрощению системы уравне¬ ний (5.20), и в итоге к повышению точности измерений с'учетом раз¬ ных составляющих методических и аппаратурных погрешностей. ММБ-оценивание.- Следующая группа методов оцени- ванияпараметров 0 функции R(x; 0) (или р(т; 0), R(t; 0), р(т; 0) связана с применением ММБ-оценивания (напри¬ мер, НК-, НМ-оценивания) на основе сплошных или ре¬ шетчатых непараметрических оценок £(т).*: Для несмещенных решётчатых оценок Й (т) НК-оценки ^ ' 0 находятся минимизацией выражений вида (2.15), (2.16), в которых в место у( и ту(х; 0) .надо подставить /? (т<) и /?(т(; 0), х = 1, К, а вместо N — число К значений т< аргу¬ мента т. При сплошном оценивании R(т) либо осуществля¬ ется переход от /? (т) к их отсчетам-/? (т*) перед примене¬ нием НК-оценивания 0, либо НК-оценки в находятся как значение (определяемое в сГбщем случае не единственным образом),-минимизирующее функционал (см. табл. 2.3, 2.5) где %тах — максимальное значение аргумента оценки /? (т); <р(т)—заданная' функция, определяемая значимостью в приложениях значений R (т) при разных т. Она может- за¬ даваться, например,, как функция от R(т). При НКгоцени- ваний "свойства оценок можно изучать как свойства НК- оценок параметров нелинейной регрессии, причем свойства эти будут зависеть от того, как находятся оценки /?(т). НК-оценивание по (5;28) для процесса Х(/), когда /?(т) = =91\ (т) вида (5.22) при ттах=Т^ ф(т)=1, рассмотрено в- [61]. Из. данной работы, в частности, следует, что при выполнении не очень обременительных условий в гауссо¬ вом случае корреляционная матрица таких НК-оценок бу¬ дет фавна (см. тдбл. 2.5) _ Хтах (5;28> 162
Отсюда следует, например, что подобная НК-оценка един¬ ственного параметра 0 функции R(т; 0)=ехр{—0|т|} по дисперсии, асимптотически в 13 раз менее эффективна, чем МП-оценка [10, 47], а также ЗХ- и ЧХ-оценки при- малых т, ‘дисперсии которых асимптотически, равны соглас¬ но (5.2), (5.24)- 20/7. По видимому, эффективность оценки (5.28) будет выше, .если вместо Хтах=Т положить Хтах==хе<^.Т, где е —срав¬ нительно мало (0,05; р,01 и т. д.). Можно также рассматривать операторные НК-оценки. Так, НК-оценки параметров Ьп, В„ корреляционных функ¬ ций R (т), R(t) и спектральных плотностей S(v), S(v)AP9- последовательностей как НК-оценки параметров уравнений регрессий рассматриваются в [63, 128, 129]. В частности, если в скалярном случае для АР^последовательности S(i) независимые, имеют конечный четвертый кумулянт и дис¬ персию D{S(i)}=as2, то НК-оценки 6п, п= 1, q, опреде¬ ляются приближенно (при исключении из уравнений чле¬ нов порядка N~l) как решение уравнений вида уравнений Юла — Уолкера (1.22), в которых вместо Ьп стоят искомые оценки Ьп, а вместо R (т) -функция 91 (т) вида (5.23) при Nk—N—q\ г'=<7+1—п, N—л; т=п—s длй всех s=l, q. При выполнении условий Уолкера такие оценки -являются асимптотически нормальными, т. е. вектор ]/"N — q(B — Ь) является асимптотически нормальным с нулевым средним я корреляционной матрицей о| 1“' Эффективным в вы¬ числительном плане алгоритмом решения системы уравне¬ ний Юла—Уолкера является алгоритм Левинсона — Дер¬ бина [63]. Операторные методы. Обособленную группу 'образуют «операторные» методы оценивания параметров .81функций <^(т; *), p(t; 0), R(r, 0), f(t; 0). Суть Методов сводится к тому, что вначале исследуемый процесс X(t) или после¬ довательность X(i) аппроксимируется (или точно описы¬ вается) другим процессом Y(t) или. последовательностью 11* " " 163
Y(i). Очень часто выгодно процесс Y(t\. аппроксимировать последовательностью Y(i) = Y( /Af) [63, 129]. При этом Y{t) представляется в типовой операторной форме, напри¬ мер в интегро-дифференциальной, конечно-разностными уравнениями, последовательностями авторегрессии и скользящего среднего (АРСС) вида (1.10), (1.13) и т. д. Подобные приемы эффективно используются, например, в методах типовой идентификации [29, 106]. Затем для Y(t) устанавливается связь между парамет¬ рами О корреляционной функции Ryy (т) (которая заменя¬ ется на Rxjt(t) и параметрами А, В (или а, b, с, d) опе¬ раторного представления Y (t), т. е. определяется анали¬ тический вид преобразования e=f(A, В). Посде этого на¬ ходятся оценки параметров А, В операторного задания Y{t), которые затем пересчитываются в оценки 0=/(Л, BJt либо 0 непосредственно сразу оценивается по выборке. При этом оценки А, В находятся чаще всего методами МП, НК, НМ, Дурбина, Уолкера, остаточной дисперсии, авто¬ регрессии Парзена, максимальной энтропии и т. д. Если модель X(t) априори неизвестна и аппроксимируется апо¬ стериори К(<),'то данные методы относятся к смешанным и поэтому подробнее рассматриваются отдельно [63J. J Для дискретных линейных'регрессионных последовательностей не* посредственно применимы методы НК-оценивания, рассмотренные в § 2.2. Еще раз отметим, что довольно часто при оценивании пара¬ метров 0 и параметрическом оценивании корреляционных и спектраль¬ ных характеристик R(i), p(f), S(co), С(ш) и т. д. выгодно предвари¬ тельно аппроксимировать процессы типовыми последовательностями вида авторегрессии, скользящего среднего, АРСС и т. п. Методы такой аппроксимации рассмотрены в [63, 129]. После такой аппроксимации оцениванию подлежат параметры £ а по ним по формуле 0(^)=Q(^; 0) — спектральные и корреляцион¬ ные характеристики последовательностей R(t), S(v), C(v), .аппрокси¬ мирующие с требуемой точностью R(tj, S(o), С (о) и т. д. Полученные таким образом оценки R(t), S(co), С (со) часто называются соответст¬ венно авторегрессионными (Парзена), скользящего среднего, АРСС и и рассматриваются отдельно [161]. -Необходимо отметить в связи с этим' дйа обстоятельства. Во-первых, весьма важной и трудно разре-, шимой является проблема выбора порядка (р, q) последовательности, например порядка авторегрессии при авторегрессионном “оценивании Парзена (см. обзоры [63, 143, 146, 152]). Во-вторых, асимптотические свойства подобных параметрических оценок корреляционных и спект- 164
ральных характеристик зачастую приближенно эквивалентны свойствам некоторых довольно _ простых параметрических оценок тех же характе¬ ристик [129] (см. гл. 7), особенно когда'истинный порядок лоследо.- вательности (р0, qo) много меньше предполагаемого (р, q). 5 Прочие методы. Из других отметим методы, основан¬ ные-на очевидной идее использования непараметрических оценок дисперсий Процесса■и- его среднеквадратических производных, получаемых линейной фильтрацией, метод модулирующих функций [54], методы, основанные на под¬ счете числа пересечений траекториями процесса нулевого (или другого заданного) уровня [86], на оценивании па¬ раметров через непараметрические оценки моментов, спек¬ тральной плотности или корреляционной функции, и т. д. Рассмотрим их на примере оценивания параметров Х{0)) и а корреляциойной функции /?(т)=/?(0)ехр(—а|т|) (l-fajx|) (5.31) скалярного стационарного процесса X(t). Дисперсия пер¬ вой СК-производной X'(t) такого процесса X(t) равна Dx'—R(0)a2.. Поэтому параметры #(0) и а функции (5.31) можно найти через непараметрические оценки дисперсий Ох и Ох, По формула^ R (0) =DX, а =\/~Dx,jDx • Траек¬ тория x'{ty процесса X'(t) может быть получена пропус¬ канием x(t) через дифференцирующий фильтр. С другой^ стороны, а определяет собой второй момент Пг нормиро¬ ванной спектральной плотности s (со), а также с точностью' до постоянного множителя совпадает со средним числом а 1 ч нулей процесса Х(0- Поэтому оценка а может быть по¬ лучена также по оценкам йг или й. Заметим, что подобные методы реализации могут сопровождаться значительными аппаратурными погрешностями. Кроме того, необходимо иметь в виду некорректность применения оператора диф¬ ференцирования случайных функций к отдельным траекто¬ риям, а также недифференцируемость многих практически важных случайных функций. Наконец, отметим, что помимо рассмотренных сравни¬ тельно «универсальных» методов оценивания параметров 0 в ряде случаев могут эффективно использоваться спе-1 циальные методы, пригодные для процессов или последо¬ вательностей одного.или нескольких сходных типов. Рассмотрим, например, скалярную стационарную, ре¬ гулярную последовательность скользящего суммирования 165
'(1.13), в Kofopofi .hk являются функциями п параметров 01 0я, являющихся вместе-с Р(0) параметрами корре¬ ляционной функцией IR (т) такой последовательности. В этом случае оценки Я (0) и 0 могут быть найдены по методу Уйттда — Уолкера минимизацией-выражения ЛПп£(0)+ИМе)/Д(0), (5.32) где N-1 WN (0) = N W (i; 0) (l - -t j M, (/), (5.33) Wn(i) определяется выражением (5.23); W(i; 0) коэф¬ фициент при z‘ в лорановском разложении функции о(г; -0) = [//(*; 0)Я(1/2; 0)]-*, Я(г; 0) = J] hk(Q)zk, ,k=0 когда такое разложение возможно в кольце, содержащем единичную окружность [116., 128, 129].. Если S (i) независимы, одинаково распределены и име¬ ют конечные четвертые моменты (кумулянты), парамет¬ рическое множество А компактно, | v(z; 0i) \2Ф |о(2; 0г)|2 почти для всех |г| = 1 при 0i#02eA, a S(v) и S-1(v) не¬ прерывны на [—я, я], то такие оценки $(0) и 0 будут состоятельными оценками <R (0) и 0. Если к тому же \v(z; 0) |2 имеют непрерывные частные производные по 0*, i= — 1, 'П, до третьего пбрядка включительно в окрестности „ " <та ^ 0О и ^ к\ hk | < оо, 'то распределение вектора У Я (0 — 0) fc=i является, асимптотически нормальным с нулевым средним и с корреляционной матрицей Rg.=G-1, где G имеет эле¬ менты [116, 129] __1_ Г^1п|Я(^х; 0)|» д In| Н(е'\ 0)|2 . I . ,r 34v 4я J дЪ[ (в55'®# —ТС В качестве второго примера рассмотрим АР^-последова- тельность. ' Для нее оценки параметров Bi, В2,..., Bq, являющихся параметрами корреляционной функции р(т)=р(0, могут быть найдены решением системы, уравнений, получаемой из уравнений Юла—(Уолкера (2.21), (1.22) .заменой p(t)’ 466
на непараметрическую оценку p(t), натриме{> p(i) .(5.21) (см. [63], алгоритм Левинсона — Дербина) . Аналогично может быть получена оценка G или as2, если в (1.21), (1.22) вместо R(n—i), R(n—i) подставить R(n—i), R(n—i) и положить i=0. Если в скалярном случае S(t) нормальны и одинаково распределены, т. е. X (i) —гауссова последовательность, то такие оценки можно считать эквивалентными (отличие на величины порядка N~l [129] ) МП-оценкам тех же па¬ раметров, которые, пренебрегая краевыми эффектами, можно получить, минимизируя т. е. на основе методов НК-оценивания, как-в случае обыч¬ ной регрессии [63]. В частности, для простой марковской последовательности (i4/?i) при ао=1, а\==а МП-оценка a=pi (1), что совпадает с ЗХ-оценкой. Другие специальные;методы спектрального оценивания, параметров авторегрессионных последовательностей, в том числе для нестационарного случая, когда спектральная плотность определяется по Пристли, рассмотрены в [137]. В частности, в данной работе рассмотрены метрды взве¬ шенных квадратов остатков Рао — Хуссаина и модифика¬ ции этого метода, данные автором. Замечания. В заключение, как это было условлено, сделаем несколько замечаний. 1. Параметрические оценки /?(т) могут определяться через оценки параметров 0, т. е. в виде lR(x, в), а также без ‘ предварительного определения оценок 0. Примером вторых оценок являются оцёнки значений корреляционных функций и спектральных плотностей мощности, определяе¬ мые подбором значений 0 и (или) функций S(v), миними¬ зирующих выражение (5.35) для случайных последовательностей [99] илц
для процессов, где Rn(т) и Rt(t)—непараметрические оценки R{т). Решение, получаемое по (5.36), (5.37) с ис¬ пользованием регуляризации по А. Н. Тихонову, обеспе¬ чивает получение 5 (А,), а по ней — неотрицательно опре¬ деленных оценок $(%) . 2. При определении оценок R (т) необходимо либо за¬ ранее „выбрать метод, обеспечивающий получение неотри¬ цательно определенных оценок, Либо проверять это необ¬ ходимое свойство корреляционных функций для каждой оценки R (т). 3. Для оценок параметров и параметрических оценок Я(т) справедливы замечания, аналогичные изложенным в § 4.3. Так, аналогом второго замечания § 4.3 является тот факт, что неудачно выбранные ЗХ-оценки параметров кор¬ реляционной функции могут быть мало эффективными. Например, для^ стационарной центрированной гауссовой СС1 -последовательности ЗХ-оценка р, полученная через ЭХ-оценку р (1) решением имеет дисперсию, в 3,6 раза большую оптимального зна¬ чения, обеспечиваемого МП-оцёнкой, при Р=0,5 и во мно¬ го раз большую при р, близких^к единице [64, 128] [ср. (5.24) с (5.2)]. 4. Во многих формулах данного параграфа использу¬ ются обратные матрицы. В связи с этим, необходимо иметь в. виду, что при этом исходная матрица должна быть не¬ вырожденной, что ранее нигде не оговорено. 5. Методы, основанные на использовании периодограмм /(А) (ММП-, МФ-оценивание), могут быть модифициро¬ ваны, если заменить периодограмму / г(А) на модифици¬ рованную (взвешенную) периодограмму или на какую-ли¬ бо другую непараметрическую оценку спектральной плот¬ ности мощности. Свойства таких оценок подлежат специ¬ альному исследованию. Можно ожидать, что использование состоятельных оценок 3(A)' позволит повысить эффектив¬ ность оценок параметров 0. 6. Рассматривался в основном скалярный случай. Ана¬ логичные методы справедливы в векторном случае, причем X(o=S(o+pg(i-i) (5.38) уравнения 168
оценки в векторном-случае имеют такое же сходство, ка'* кое имеют сами модели и их характеристики [ср. (1.6) — (1.25), справедливые для векторного и скалярного случа¬ ев] . Некоторые оценки для векторного случая даны в [6, 63, 64, 129]. 5.3. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СПЕКТРАЛЬНОЙ ПЛОТНОСТИ МОЩНОСТИ И ПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ СПЕКТРАЛЬНЫХ ХАРАКТЕРИСТИК Вводные замечания. Оцениванию параметров спект¬ ральных плотностей стационарных случайных процессов, особенно последовательностей,- посвящено множество ра¬ бот (см., например, [46, 63,143, 154]). В качестве уже рассмотренной совокупности методов оценивания параметров 0 спектральной плотности S(K) процессов- (Я=ю) и последовательностей (%=v) укажем все методы, рассмотренные в § 5.2. Поскольку корреляци¬ онные функции R(т) и спектральные плотности 5 (X) свя¬ заны пар<}й преобразований Фурье, оценка параметров одной из них равносильна оценке параметров другой. Воп¬ рос только в том, оценки каких параметров — R{т) или S (Я) — и в каких условиях более предпочтительны по со* вокупности показателей их качества. ММБ^оценивание. Как самостоятельный рассмотрим метод ММБ-оценивания, и в частности НК-, НМ- и МХК- оценивания, с использованием сплошных и решетчатых непараметрических -оценок 3(Я) плотности S(X) в ска¬ лярном случае. При использований решетчатых -оценок S (Я(), i=l, /(. НК-оценки параметров 0 (платности S (Л) находятся минимизацией квадратичной формы (2.14) — (2.16), в которой. yi=§(Xi), ту(хг, 0)=М{3(Я,-; 0)}, т. е. для асимптотически несмещенных оценок mY (*>•; 0)=» *«S(V, 0), t=l, К, a N=K. При использовании сплошных оценок 3 (Я) можно либо по ним получить значения 3 (Яг), i— 1, К, и воспользовать¬ ся предыдущей процедурой оценивания, либо оценки 0 на¬ ходить решением уравнений максимальному значению аргумента ю оценки 3(ю) для процессов; <р(Я)—некоторый весовой множитель, выбира- 169
емый из условия значимости в приложениях 5 (Я,) для раз¬ ных Я.” При МХК-оценивании необходимо воспользоваться формулой (2*21), в которой Np{(Q) есть доля мощности процесса или последовательности, приходящаяся на /-й (i= 1, К) интервал частот Я, a~Nt — эмпирическое значение этой мощности. Значение Np{(0)- находится интегрирова¬ нием по i-му интервалу частот плотности S (Я;- 0), a N{ — либо непосредственно по выборке, либо интегрированием непараметрической оценки 5 (Я) по i-му интервалу Я. Из,других ММБ-оценок отметим оценки, минимизируто- 'щйе. для фиксированного набора частот v [напримёр, Для точек БПФ-оценок периодограммы /w(v*)] одну из сумм .Первая оцейи для 0 представляет собой НК-оценку (2.16), когда вес <о< выбирается равным S-2(v;0). Как показано в [154], при определенных условиях подобные оценки J/ЛГ состоятельны И асимптотически эквивалентны друг другу и оценке 0, получающейся максимизацией , сум¬ мы [ср. с (5.11)] - 'Метод авторегрессии, максимальной энтропии и т. п. ’В последнее"'время внимание исследователей привлекли методы авторегрессии Парзена, предложенный. Бергом ме- Дод максимальной энтропии [63] и им подобные. Интерес к этим методам обусловлен тем, что они позволяют полу¬ чать повышенное разрешение по сравнению- с традицион¬ ными непараметрическими и параметрическими методами (в'частности, МП-оценками [63]). Хотя данные методы и связаны с оценками^ параметров, они являйэтся смешан¬ ными, основанными на аппроксимации X(t) 7й спектра S(Я), и поэтому рассматриваются отдельно. Методы ЧХ- и ЗХ-оценивания. Для оценивания пара¬ метров 0 спектральной плотности, можно успешно приме¬ нять ЧХ- и ЗХ-оцениваняе. Однако в этом случае может Г~ (5.41) 2lltt.S(v*:_0)-ln/*(v*: в)]!. к (5.42) (5.43) 170
оказаться удобнее вместо непарам^трических оценок S (Л,)] спектральной плотности 5 (Л.) использовать непараметри¬ ческие оценки нормированной спектральной функции с (Я). Подобная оценка 6ЦХ) либо может получаться непосред¬ ственно по выборке (например, фильтровым методом), ли¬ бо может быть найдеНа интегрированием £ (Я). - Метод квантилей (^-оценивание) сводится и нахож¬ дению 0 как корней одной из систем п уравнений Ярр^ (0) — Xpjf i —■ 11 fly с 0) —■ Piy ~i 1, fly > x(Xpt; 0) = ph i =,1, n\ 3(Я2; 0) = si, i = 1, n, где Яр —^квантиль» спектральной функции с (Я) лоряд- ка р; Яр, 6Щ, 5 (Я) — некоторые непараметрическиё оценки Яр, с (Я) и S(Я); п — число неизвестных* оценивае¬ мых параметров 0ь ..., 0П. Х-оценки наиболее удобны, если непараметрические оценки Я, 6 (Я) и 5(Я) находятся по методу типа полиграмм (см. § 6-5). Метод ЗХ-оценивания сводится к решению относитель¬ но 0 одной из систем л-уравнений S(A,; 0) = 3(Я2), i = 1. 7г; s (Я/; 0) = 5(Я2), /= 1. п\ _ с (Я2; 0) = с (Я,), i = 1, п. Первая система позволяет находить оценки-о2. Характери¬ стики подобных Ж~ и ЗХ-оценок могут быть легко полу¬ чены из "общих-* результатов, представленных в табл. 2.5. Определенный интерес могут представить оценки Я (0| и 0, получаемые обобщением метода числовых характери¬ стик, а именно — решением системы уравнений J Нк (Я) 5 (Я; Q)dX = f Hk (Я) S (Я) dX, ± = 67~п, (5.44) А ‘ А _ где Нк(Я) — должным образом подобранная система функций, а 5(Я) — некоторая непараметрическая оценка' для 5(Я), например «сырая» /Г.(Я) или модифицирован¬ ная периодограмма. Как частный случай из (5.44) полу¬ чаются м-оценки, если положить Я0(Я)=1, Як (Я) =Я2\ к= =1, 2, ..., когда интегрирование производится в симмет¬ ричных'пределах, или ЯА(Я)=ЯЙ,- когда интегрирование осуществляется в пределах А+= (0, оо) или Л+=(.0, я).
(Для таких оценок справедливо ранее сказанное в § 2.2 и '4.3 по отношению к м-оценкам. В частности, применение подобных, методов проблематично для полимодальных 'плотностей. Замечания. 1. До сих пор мы рассматривали в основном оценки па- раметров и параметрическое оценивание корреляционных функций и собственных спектральных плотностей мощности. Все рассмотренные методы могут быть перенесены на оценивание параметров и парамет¬ рическое оценивание взаимных • корреляционных функций и спектров и матричных характеристик. При этом, однако, изменяются формулы для асимптотических распределений и корреляционных матриц оценок. 2. После нахождения оценок параметров 0 спектральных плотно¬ стей по первому варианту параметрического оценивания, т. е. по фор¬ муле =Q (Ф; 0), могут быть найдены параметрические оценки самих спектральных плотностей S(X), 5(Я), спектральных функций С (Я), с (Я), дйссипантов, консервантов, коэффициентов (функций) ко¬ герентности, моментов и других характеристик спектров. Предваритель¬ ная работа при этом будет сводиться к однократному' определению аналитического выражения всех искомых характеристик по заданной спектральной' плотности S(A,) или коррекционной функции /?(т). 3. Для процессов и последовательностей с дробно-рациональной спектральной плотностью, представимых в виде (1.6), (1.10), (1.13), нали¬ чие оценок © параметров 0 и, следовательно, А В,а,Ъ>'с, dt позволяет сразу же построить параметрические оценки ков- и корспектральных плотностей первого и второго рода п-го порядка при любом п^2. Это следует из того, кто данные характеристики будут функциями тех же параметров 0 или А, В, а, Ьу с, й-> что ц корреляционная функция R(т) или спектральная плотность S(^), а именно параметров, определяющих саму модель процесса, или последовательности. Данный ^факт является следствием приятного свойства многофункциональной универсальности параметрических методов оценивания (см. принцип я-18). 4. В случае параметрического оценивания,' как показывает предва¬ рительный анализ, группирование, т. е. квантование по-уровню X(t), X(i), зачастую сказывается в меньшей степени, чем при непараметри¬ ческом оценивании. При этом также полезно использование вспомога¬ тельных (интерполирующих) сигналов/ 5. Автору известно лишь небольшое число работ, в которых ста¬ вятся и решаются задачи робастного (устойчивого) оценивания пара¬ метров корреляционно-спектральных характеристик (см., например, обзор [149], с. 313—338, и дискуссию к нему [149], с. 338—351). Оче¬ видно, что и здесь возникает проблема засорения выборки, возмож¬ ность ошибок классификаций — выбора не той модели. Данную задачу следует отнести к разряду наиболее актуальных в теории параметри- 172
ческого (а также непараметрического) измерения корреляционно-спект¬ ральных характеристик, прйчем некоторые результаты здесь можно по¬ лучать' на основе методов, широко используемых в теории робастного оценивания параметров распределений, либо специальными приемами, например, робастной фильтрацией, позволяющей осуществлять парамет¬ рическое и непараметрическое робастное оценивание спектральных ха¬ рактеристик [149]. 5.4. О ПАРАМЕТРИЧЕСКОМ ОЦЕНИВАНИИ ДРУГИХ ХАРАКТЕРИСТИК Нетрудно убедиться, что все характеристики Q (ф) оп¬ ределяются через базовые характеристики — законы рас¬ пределения или корреляционно-спектральные. Поэтому параметрическое оценивание произвольной характеристи¬ ки Q(ft) можно осуществлять по первому варианту, т. е. в виде <3(G)=Q(0; в), где оценка (Гнаходится как оценка, параметра 0 базовой характеристики. Однако такой метод не всегда оправдан. Существует большое многообразие специальных методов, пригодных для оценивания конкрет¬ ных характеристик Q (Ф), отличных от уже рассмотренных в настоящей главе. Это справедливо, например, для па¬ раметрических оценок регрессий, а также оценок пара¬ метров операторных моделей процессов и последователь¬ ностей. Параметрическому оцениванию других’ характери¬ стик пока еще, к сожалению, не уделяется должного вни¬ мания.' Глава шестая Непараметрическое оценивание законов распределения £.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Как уже упоминалось в гл. 1, при выборе алгоритмов оценивания характеристик Q(d) желательно стремиться к тому, чтобы они удовлетворяли требуемой совокупности принципов и- соответствующих им показателей качества. Наиболее часто требуют, чтобы оценки <$(•&) были несме¬ щенными и обладали как можно более быстрой сходимо¬ стью в требуемом смысле к характеристике <?(<►)> напри¬ мер имели минимально возможную дисперсию при задан¬ ном объеме выборки. Если эти условия выполняются для нескольких алгоритмов, то' предпочтение следует отдать 173
тем из'Них, которые лучше по другой- требуемой совокуп¬ ности показателей качества. При выдвижении подобных требований необходимо оценить их принципиальную реализуемость;;Вполне мо- |жет быть, что некоторые из заданных требований не мо¬ гут' быть реализованы — .нельзя подучить (и, следова¬ тельно, требовать) больше того, что может дать выборка. -’Например, может не иметь места 'несмещенность или со¬ стоятельность оценок. В.,связи с этим всегда необходимо уметы оценивать потенциально достижимые значения по¬ казателей качества и переходить к .новой совокупности, показателей, учитывающей реальность требований. С по¬ добной ситуацией мы встречаемся, например, при оцени¬ вании плотностей распределения вероятностей W{x) и производных от нее, при оценивании моды, спектральной плотности,.S(Я)/и"т. д. Так, можно показать [120], что* при достаточно общей постановке задачи не существует несмещенных оценок УР(х) произвольной’ неизвестной плотности W(x). В этом случае бессмысленно требовать реализации принципа несмещенности я). Одним из выхо¬ дов является замена* его требованием минимума- локаль¬ ных или глобальных показателей качества оценок, осно¬ ванных на. мерах близости Р[х)'.и IF(x) или №(х) и_Ц7(лс)! ’(см. § 1.5.4), локальных (А) и глобальных (A, v. V) по' казателей^ вида-1 (1.52)—(1.54). Если- при этом оценка 1Р(ж) имеет дисперсию, равномерно па х близкую или равную минимально возможной, то минимум А* (#), £=4* 5,.6 (а в глобальном смысле и |Д*, k—A, 5, 6), будет соот¬ ветствовать минимуму смещения етг (*) • Для параметрических оценок плотностей И?(Х) можно указать неравенства типа неравенства Рао — Крамера* минимаксных границ снизу [60] и т- п., а также попытать¬ ся найти асимптотически наилучщие в нужном смысле не¬ параметрические оценки^, которые, кстати, могут иметь бо¬ лее медленную, чем_ V^N, скорость сходимости [60]. Так, например, пусть W(x) принадлежит классу Gm,p* который определяется выражением Gm,p—{W: W — плот¬ ность, W, W', . ■ •> H7(m_1> абсолютно непрерывны, HWe feLp, ||^<’л)||р^М<оо},. где ||>|!р означает норму в Lp, а 'М — фиксированная константа. Пусть -IP (х) — .некоторая непараметрическая оценка неизвестной плотности W (дс)} по независимой дискретной выборке Х\, х%, ..., Xn объема 1 Разнообразие точностных показателей качества для оценок плот¬ ностей распределения рассматривается в [158]. 174
I/V. При данных условиях имеет' место неравенство [671 1(ср. [60, 133] ) ' — (im.— —] 1'(ъп+\— —] — в sup -m{E*(x)}>A(x)N v р, / к р) (6:1) W££GrHt р Тде А(х) — некоторая ограниченная функция; а е>0 сколь Угодно мало. Как будет показано далее (см, также [67]), при пра¬ вильном выборе параметров алгоритмов методов ядёрного, ортогональных рядов, гистосплаййов (гистограмм), и не¬ которых реализаций’ метода ^-ближайших соседей 'можно, добиться предельной скорости среднеквадратичной сходи¬ мости XS?(x) к W(х) при увеличении N, определяемой пра¬ вой частью (6.1) при/ е=0. Поэтому подобные методы яв¬ ляются «предельными», наилучшими в смысле -скорости сходимости W{x) к W(x) mo локальному показателю Ал ('б') X (б) или глобальному показателю1 Дй, У*, £=4^5,6. Следоватёльно, выбор того или иного алгоритма, .метода оценивания либо, решение о целесообразности разработки новых .методов и алгоритмов в данных условиях- должны осуществляться сопоставлением для этих алгоритмов зна¬ чений А(х) и значений других показателей качества; Теперь ^перейдем к рассмотрению конкретных методовГ и алгоритмов непараметрического .оценивания- «-мерных- распределений F{x; т), W(х; г) стационарных скалярных или /ьмерных векторных процессов и последовательностей X(if). Будем при этом .полагать, что траекторное усредне¬ ние осуществляется на интервале [0, Т!\ или. [О, i/V) при любых непрерывных или дискретных значениях т={ть Тг, ..Tn-i}. Другие возможные ситуации оговорены в на¬ чале § 3.1 и в формулах. (3.-14),. (3.45). Вопросы переноса результатов на случайные величины, векторы и' на неста¬ ционарные процессы и последовательности рассмотрены.в виде замечаний ; в конце § 3.2. Л>.2. МЕТОД ЭМПИРИЧЕСКИХ ХАРАКТЕРИСТИК Согласно определений, данному ,в •§ 3.2, обозначениям '{1.-26)— (1.28), (3.14), (3.15), результатам § 3.2 относи¬ тельно принятым обозначенйямТ=7 для непрерыв¬ ных алгоритмов, T=jV, t=i для дискретных алгоритмов и результатам § 3.3, касающимся Выбора значения х аргу- • При использовании глобальных показателей At, k=4, 5,.6, c-ко- скорость сходимости может быть немного лучше, чем следует иэ^ (6.1). 175
мента с Шагом А*, ЭХ-оценки Р(х\ т), №{х; т). введем как оценки вида ' ' ’ ' }}, (6.2) t (x; T) = A-^r'(l (п (*,(*+Vi) e(x,“A*y2f;., I H=1 х,+Дх/2))|}, (6.3) где, как и ранее, I {А} — индикатор события А, т. е. 1{А}=1, Д {Л}=0, h=&xlAx2 .. v Дх„. (6.4^ В одномерном случае ЭХ-оценка 1Р(х) может быть представлена в виде оценки Розенблата W (х) = (?(« + Ах/2) — F(x — Дх/2)] /Дх, (6.5) Из (3.17), '(3.18), § 1.2 и табл. 1.1 следует, что оценка !/?(*) является несмещенной, а х -f Дх/2 M{f(x; т)}=А-1 J nW (х; т)Лх, (6.6) х — Дх/2 т. е. несмещенность № (х; т) Асожет быть достигнута лишь для постоянных значений W(x\- т) в Дх-окрестности точки х, а малые значения смещения в остальных случаях полу¬ чаются только при достаточно малых Ax={A!xj, Ахг, ... ..., Ах„} в точках непрерывности W(x; т) [для одномер¬ ной плотности см. (3.64) при аТ=Л]. Корреляционные функции и дисперсии, оценок определяются выражениями (3,20), (3.21) и им подобными из § 3.2, когда о(/) опреде¬ ляются согласно '(3.43). При этом для Р имеем /?o(WJ Xj, Xg, Tj, Tg) —• 2П-Р (X,, Xg, Tj, Ut Tg) .nF №s> *г)>/ (6.7) 2^F(x., x2; t, 0, t)=/(x,Ax,; t), (6.8) где 2nP(•-) —2п-мерная функция распределения в точках. t, *+Ti,b ..., /-frj.n-i, t+u, t+u+-Г2Д, ..., /+Ц-К2.Я-1. а запись' x=XiAx2 означает x={min (xi,<, x2.i), »=1, n}. X Аналогично для W имеем Ra(u-, Xj, Xg! Tj, т25 Дх,, AXg) =—M {IF (x,, т,))^^ ХМ{Г(ха! x2)}+f У» xv «. ^dy.dy,, (6.9) дХ 176 T(x; т) == Mr |l j Д [xq (t + x9_,) < x9]
где W(•) соответствует 2^F^ из (6.7), а АХ,— область значений 0i<=(*—A*i/2, *i+A*i/2],‘y2ei[*2—Дхг/2, дс2-НД*г/2]. .(6.10* Для скалярного случая из (6.7) — (6.9) получаются широко известные частные случаи Rop{0-, x) = F(x)[l-F(x)], (6.11) RojO-, х; Ax) = -^[F(x'0-F(xfy[l-F(x'0 + + f ^ (*) 1(Д*Г - (6-12) \ где xr=x—AxJ2, x"=x-bAxJ2. (6.13) Значение: Re (0) позволяет при дискретном оценивании по некоррелированной выборке легко подсчитать по (3.41) дисперсии оценок. При этом полезным -может оказаться неравенство [124] nF(Xi, ..., Jfn)i(jfi) ... Fn{xn)y/*. (6.-14) При; оценивании по зависимой выборку можно ^сйоль- зовать формулы либо типа (3,20), (3.21), либо (3.49)— '(3.5,1). При этом необходимо учитывать, что интервалы или радиусы корреляции функции G (<) в данном случае могут быть существенно меньше, чем исходной функции !Х(/). Сказанное иллюстрируется рис. 6.1 и 6.2 на примере скалярных случайных процессов Х(0 с двумерным нор¬ мальном (см. рис. 6.1,а и 6.2,а) и гамма- (6.1,6 и 6.2,б)_ распределениями с -корреляционными функциями pi (т) '(непрерывные кривые) й ра(т) (штриховые кривые) из '(3.54) [40]. (см. также [53, 77, 85, 145]. > Необходимо отметить, что можно привести примеры «плохих» процессов и последовательностей [40], для кото¬ рых для ЭХ-оценок \Р{х) и iW(x) имеет место равенство- р<?(н)=рх.(и), т. е. TioG=Tox при любых х и Дх. Для такрх процессов соотношение- дисперсий непрерывных оценок при разных х, Ах такое же, как для дискретных ' «некор¬ релированных» (т. е. найденных по некоррелированной выборке) оценок, и определяется только^ соотношением между Rg (0). для разных х, Ах. Используя подобные кри¬ вые для Яв(0), можно соотнести диспепсии оценок зако- 12—192 17Т
^oxftoo 6 % и Li- .) I L _L _L_ _L -I—LJ L I- I ■ 1 3:<o v- oa ^ to Sgg. S. S. to to СГ cs* Cr> to to 0O 2? °> Fix) ^ p^- f-T'Cn to cn Ch to to to № ' И/ cJcJ'^cT'' cT °1°1 °i. °* to to to cT S)~< f“c. 6.1. Зависимость отношения. 70х/ъ>о от значений \x\fa и F(x) для ЭХ-оценок Р(х) нов распределения с дисперсиями ‘оценок математических ■ожиданий или других характеристик (см; далее) при тех .же условиях оценивания. * Заметим, что для оценок №(х) уменьшение Ах приво-. Дит в общем .случае, к уменьшению смещения Оценок и к' Я 78
Рис. 6.2. Зависимость отношения тох/тоа от значений. Ах/ах при разных. */о/для ЭХ-оценок #(х) > увеличению их дисперсий. В связи е этим можно для; каждого значения объема выборки (Т или <N) и корреля¬ ционных зависимостей рассчитать оптимальные значения !Длс, причем не равные при разных х из условия минимума одного из показателей вида (1.52)—(1.54). Примеры по¬ добных рекомендаций можно найти в .[-126, 136] (см. таю- же § 3.1, 3.3) :' С более общих позиций этот вопрос будет" обсуждаться ниже на примере независимых дискретных выборок. Здесь лишь заметим, что'для расчета оптималь¬ ных значений Ъх необходимо иметь довольно богатую ап-. риорную - информацию, что затрудняет применение подоб¬ ных* методов. Помимо поиска оптимального? Ах можно по¬ пытаться использовать случайное изменениеаргументах: 'в процессе‘'усрбднения [см. (3.67), (3,68)1, а также интер'- 'полирующие сигналы [85, 86] — случайные ^-коррелиро¬ ванные сигналы, равномерно распределенные в интерва¬ ле-. (—(АЬе/2,-.Ддс/2), добавляемые к х (t) перёд группирова¬ нием (квантованием по уровню). Важной проблемой является выбор числа интервалов; Ах и диапазона (хн, хв) изменения .аргумента оценки’ Щх) -и Р(х). Этот вопрос обсуждался с общих позиций? в § 3.1. При оцениваний по независимой выборке Р имеет би¬ номиальное (т. е. асимптотически нормальное) распреде¬ ление, сходится к F (х) для всех х почти наверное, а aN= • sup | F(x) — F(x)\ асимптотически имеет распреде- I ж 1,< °о 12* 179*
ление Колмогорова, сходится к нулю почти наверное, т. е. -с единичной вероятностью (лемма Гливенко — Кантелли), и подчиняется закону повторногр логарифма [65, 69]. По¬ добные свойства оценки Р свидительствуют о предпочти¬ тельности оценки Р перед оценкой № и, следовательно, выбора 1F вместо W при решении многих вероятностных задач. Необходимо, однако, учитывать, что функции рас¬ пределения Fi(x) и Р.2 (х),. соответствующие двум заметно отличающимся плотностям W\[x) и Wi(x) с заметно от- личающймися числовыми характеристиками, могут мало отличаться.в большом диапазоне изменения аргумента х. Так, например, если F\ (х)- соответствует стандартному ^т. е. имеющему нулевое среднее и единичный параметр масштаба) логистическому, a Р2(х) —^стандартному нор¬ мальному распределениям, то sup|F,(l,7x) — F2(x)| <0,01 ► 4 X для всех |х|<оо, в то время как коэффицйент эксцесса логического распределения -у2^ 1,2; а для нормального 72=0. Детальный обзор свойств, оценок Р(х) дан в [145]. 6.3. МЕТОД ДЕЛЬТА-ОБРАЗНЫХ ФУНКЦИЙ С работ Розенблата (1956 г.), Парзена (1962 г.) и На- дарая (1964 г.) [60, 75, 120, 126] начался настоящий бум в области ДОФ-оценивания [см. (2.45)] плотностей рас¬ пределения W (х), а именно — ядерных оценок (Я-оценок) плотностей W(x) и на их основе других характеристик. В последние годы в отечественной и зарубежной периоди¬ ке публикуются десятки статей в год. по Я-оценкам. Неко¬ торые из результатов ранних публикаций нашли отраже¬ ние в монографиях [28, 60, 75, 97, 117; 120, 126] й обзорах ;[67, 136]. ' v • ■— рассмотрим вначале Я-оценки lP'(x) на примере оце¬ нивания, одномерной плотности распределения W(х) по - независимой дискретной выборке Х\, х2, .. *., xN. В этом случае Я-оценка Т^(х) имеет вид (р(Х) » formal, (6.i5) - 1 h\N) I h(N) Jf Nh(N) | h(N) J где —— k Г —— ядоо оценки, a h (N) — последователь- • h(N) ' I A(V) ’ ность положительных чисел, стремящихся к нулю при так, что число выборок, попадающих в область про-ч 180
зрачЦости ядра, неограниченно возрастает при N-*-оо (ус¬ ловие состоятельноЬти ТР'),. \ Оценка (6.1В) является асимптотически несмещенной^ состоятельной в каждой точке непрерывности И7(х) и асимптотически1 нормальной' если k(y) и h{N) удовлетво¬ ряют следующим условиям: а) условию асимптотической несмещенности j k(y)dy = 1, j\k(y)\dy< оо, ^ jsup^ | k(y)| < oo, (6.16) lira \yk(y)[ = 0, lim h{N) = 0; (6.17) #-►00 jV->00 б) условию состоятельности limNh{N) = оо. ' (6.18) N-* oo При- выполнении условия равномерной сходимости lim Nh2(N)=,oo ' (6.19) N-+ со sup| #(х)— W (х) | сходится к нулю по вероятности, а при X выполнении условий Надар ая [117, 120] — почти навер¬ ное. Математическое ожидание и дисперсия оценок (6.15) равны 00 (6'20> ГНХ) D <► (*»'-т [г^Г Iк' irn-)'г 1{у)'iy- ^ • """ (6.21) Делая в (6.20) замену переменных yffo(N) =z и разлагая W [х—zh(Л!)] в ряд Тейлора в точке х (в предположении, что необходимые .производные Н7<*>(х) существуют и ко¬ нечны), смещение *рценки W(x) можно представить в виде [ср. с (3.67)] S # 00 *r(«) = J] W0) (х) |ylk{y)dy+0{hs*'{N)). (6.22) i=l —00 181
Из (6.22) следует, что ядро Ну) желательно выбирать симметричным' {тогда все нечетйые слагаемые в (6.22J будут равны нулю), имеющим всё моменты до (5+1),-го включительно как можно меньшие, особенно второй Мо¬ мент m2,h^Можно Потребовать, чтобы при четных А (р) все моменты до (г—2)-го включительно (г— Четное] равнялась .нулю. Подобные одра рассматриваются, напри¬ мер, В. Г. Алексеевым в спектральном анализе [4] (см, §8.4). Если выполняется условие (6.18), то из (6.2)) асимпто¬ тически имеем [120, 126] . . ОО Ь-^{К^^Ш)32’к' 32:* = Jk'№dyr (6.23) —оо *. Ранее мы упоминали о неравенствах для показателей качества оценок плотности распределения [см. (6.1)]. Уме¬ стно привести противоположные неравенства. Пусть W(х), |х|<оо, принадлежит множеству'^ (I, /) функций,,удов¬ летворяющих условию Липшица с постоянной к IУШ-УГ (*() | </| хртгхх |- (6.24) а функция А2 (у) интегрируема. Тогда при этих условиях смещение (х) и средний квадрат ошибки А+(х) (1.35) оценок (6.15) удовлетворяют неравенствам [60] [ср. с (6.20) — (6.23)] IV (х) I< lh ^ j Iyk Ш dy'~ (6-25> —00 if*<»>*<*-!*<*)>«•. (6.26) —00 w' sup sup Ai_(x)<CN~v\ (6.27.) i) икя r' где постоянная С не зависит отх и W(x) eZ(l, /). В [60] даны различные обобщения подрбнЫх неравенств., 4 Как следует ив - приведенных результатов, свойства Я-оценок (6.15) зависят от выбора ядра k(y) и парамет¬ ра (коэффициента) размытости Ji(iN)t причем при малом объеме выборки N особенно важно правильно выбрать k{y), а при большом N более существенным является вы¬ бор А (У) Г Поскольку k (у) и h(JV) по-разному влияют на смещение дисперсии оценбк, можно поставить задачу 182
поиска оптимальных к^{у) и bo(N), минимизирующих по¬ казатель’ качества оценок, учитывающий явно или неявно смещение и. дисперсии оценок^Так, наложим на k (у) до¬ полнительно условия неотрицательности k(y)^0, четности *(^) =т=^ (—У), существования всех 'моментов, k{у) и ра¬ венства единице второго момента (см. (6.22) при i=2). Тогда минимуму глобального показателя' качества оценки вида..А4/з2;Нг [см. (1.52), (1.54)],'как показал Епанечни- ков, будет соответствовать ядро кц(у), не зависящее от вида распределения и от объема выборки, которое- пред¬ ставлено в та,бл. 6.1 под первым’ номером. Для сравне¬ ния в таблице представлены некоторые типовые Ядра, удовлетворяющие тем же условиям. Другие ядра приве¬ дены в [140, 141]. Как видим, различные приведенные ядра. асимптотически мало отличаются по эффективности в смысле показателя Дz/32-.w или отношения дисперсий, асимптотически при одинаковом h('N) дают одинаковое смещение для всех плотностей W (х), допускающих разло¬ жение в ряд Тейлора в каждой точке ж {см. (6.22)], изда¬ ют почти равные дисперсии оценок [см. (6.23)]. Ъ. таких сЛучаях при больших N с точки зрения вычислительных затрат, и простоты реализации алгоритма'(принцип ям) предпочтение следует отдавать ядру_№ 3.в табл. 6.1, т. е. ЭХ:оценке (6.3), у которой Ax=2|/3ft(i/V). Оказывается, что при* тех же условиях ядрЪ № 1 в табл. 6.L является оптимальный' при любом п для Наце¬ нок n-мерных плотностей, определяемых в общем виде вы¬ ражением когда к (у и Уп) —к {ух) к (уп), hs=*hs(N) =h (N), s= ==1, п. Здесь и далее для сокращения записи аргумента,* дискретных оценок п)^(х; т) стационарных случайных процессов и последовательностей X(t) опускается, а под-ж, понимается {xit«(f), .x2,t(t-i-xi), xn,t(t-Hn-i)} Для ан¬ самблевых Оценок или (*4 (Ш), X2(iAt-\-Ti), ., xn(iAt-\- +Tn-i)} для Траекториях оценок,При этом дисперсия, по¬ добной оценки (6:28) асимптотически определяется выра¬ жением (6.23) с заменой W(x) на ^(ж), h(N) на hn{N), ^1 ^ ^1, I I •), (6.28) 183
g Таблица 6.1. Некоторые типовые симметричные ядра k (у) с единичным вторым моментом
Оптимальное значение Ло(М) легко получается мини¬ мизацией по А, например, выражения для A4=<[D{T?'}-f- „+е* ]*>, если е (ж) представить аналогично (6.22) мно¬ гомерным рядом и ограничиться квадратичными слагае¬ мыми, т. е. с использованием приближения Как видим, Ло(А0 определяется величиной, пропорциональ¬ ной ЛМАи-Н), и зависит от объема, выборки, от неизвест¬ ной плотности распределения W (ж) и от корреляции вы¬ борки. Понятно, что если изменить оговоренные выше усло¬ вия, накладываемые на k(y) и W(ж), или показатель ка¬ чества оценки, то оптимальными будут другое ядро ко (у) и параметр размытости ho(N). Подобнйе результаты при¬ ведены в [60, 120, 136, 140, 14L 148]. Рассмотрим, например, одномерную-плотность W{x) и четное ядро к (у), для которого все четные моменты до (г—2) -го включительно равны нулю. Заметим, что при это приводит к знакопеременным ядрам <k(y). Тогда в правой части' (6.22) можно оставить только слагаемое с ’*=/•.- Далее, минимизируя AjL.(x;) = е^. (к) -j--D { W (к)} по А(#), нетрудно найти оптимальное значение ho{N) пара¬ метра A(\N) прш заданном ядре к (у), а также оптимальное ядро, соответствующее минимуму А2& (ж) для каждого ж. •Нетрудно убедиться, что в этих условиях К ** 3$:k [Nhn (ЛОГ + h* (N)LI4- (6.29) При указанных выше условиях Ло(‘Л/) определяется выра¬ жением (6.30 (6.31) Отсюда 4 п К 1/(2г+1) (6.33) 185
а соответствующее Ло(Л0 значение Д^. (х) равно 2 Как видим, использование знакопеременных ядер (соот¬ ветствующих г^4 вместо г—2) может привести к суще¬ ственному уменьшению погрешностей: подобная оценка (х) будет Nr/(2r+1'>^y~N состоятельной. ' уЕсли нет информации о №<г)(х), а можно лишь пред¬ положить, что | Ц7(г)(х) | <^г, то в (6.33) и (6.34) необхо¬ димо заменить (х) на WT и приближенное'равенство в (6.34) заменить неравенством В качестве удобных для подобного случая ядер могут быть использованы.спек¬ тральные окна В. Г. Алексеева [4].' Обратим внимание, что если использовать знакопере¬ менные-ядра, то в (6.29) вместо A4 (lAOi/4 необходимо взять tn2r;hh2r(N)J(г!)2, а в выражении (6.31) для Ь=Ь2 вторую производную заменить на r-ю, т. е. положить L—Lr. Тог¬ да (6.30) и (6.32). перейдут в откуда с учетом принятого ранее равенства т2;ь=1 как Частный случай следуют (6.30), .(6.32). Сопоставляя (6.36) с (6.-1), видим, что погрешности подобных оценок близки к минимально возможным. Однако надо иметь в виду, что использование знакопеременных ядер может привести К получению отрицательных значений оценок №\х), вероят¬ ность чего, правда, ,с увеличением N стремится к нулю. Целесообразность использования знакопеременных ядер при г>2 следует обосновывать еще и потому, что убывание погрешностей дЛя них как jW-2r/<2r+n>] еще не означает получение погрешностей; при фиксированных N и k(y), заведомо меньших, чем при г=2. Нужно учитывать значение всех компонентов, входящих в (6.34), (6.36). Теперь остановимся на оценивании многомерных и ус¬ ловных плотностей распределения вероятностей. В общем виде, такая оценка представляется выражением (6.28), а'условия (6.16)—(6.18)_ преобразуются в аналогичные с 186
заменой, одномерной плотности на многомерную, yk (у) на У Л (у\, Vs=l, я, h(N) на произведение hi (i/V) hn(\N); Один- вид Я-оценок (6.28), когда! k(y)==k{yl) .,. k (уп), ha(?N)==h(iN), Vs= 1, я, был рассмотрен ранее. Обобщение на случай' неравных hs (N) рассмотрено в работе А. П. Се¬ рых (1973 г*) . v При условиях, аналогичных условиям для одномерных ллотцостей, для оценок nW{x) справедливы формулы вида ' (6.20)—(6.23), 'в которых вместо, одномерных плотностей, ядер и. ряда Тейлора будут я-мерные, т. е. оценки также будут асимптотически несмещенными, состоятельными в каждой точке х непрерывности W (х) и асимптотически нормальными. В ,[141] рассматриваются ядра вида | det Ад- |A;(Awp), где An — линейный автоморфизм в я-мёрном евклидовом пространстве. Показывается, что при определенных усло¬ виях, сходных с описанными выше, для них справедливы выражения,'аналогичные (6.20) — (6.23). В многомерном варианте, в частности, рассматриваются An диагонально¬ го типа Алг= Л‘ ^ .когда k(y)=k(ф), где L о _ <р= (г/21+</22+ ... +</2п) 2 . Показано; что условию мини¬ мума глобальной .среднеквадратической ошибки А4 соот¬ ветствует оптимальное значение~ показателя h{(N) типа ■(6.30), но" с другим, хотя и'сходным,*• коэффициентом при |дг-1/(п-н), а оптимальное ядро имеет вид!__ I (<?+!)! [(2»Н-4) — у81 1029+1(4+2)9+1 ’ ^ ср < ]/"2^ + 4, Я =.2<7, (24+3)! [(24+5) — уа]. (6.37) *(?) = L (2?+3) *9239+3(24+ 5)2 ' (<7'+1)! <р <)/2<7-|-5, fl = 2q-\-l И в частном случае, при я=1, совпадает с ядром Епанеч- никова № 1 в табл. 6.1. Оптимальное значение Д40пт, соот¬ ветствующее оптимальному ядру, (6.37) и ^оптимальным значениям Jii (N), пропорционально ^-4/(4+п):. Любопытно, чтоиесли. в качестве ядра k(y) взять произведение одно¬ мерных ядер № 1, 3 и 4 из табл. 6:1, то их эффективность 1 Предполагается, что г=2, т. е. ограничиваются только квадратич¬ ными членами ряда Тейлора. 187
в смысле отношения А4опт/А4 равна при п=2\ 98,83, 89,65 „и 92,44,%! соответственно, а нри п=3: 97,28, 85,83 и 89,29%.-Определенный интерес, представляет равномерное '(постоянное) в области <р=У 2^+4 при, n=2q или ф= = V2^+5 при n=2q-\-l ядро k(y)=k(q>j, эффективность ^которого.при п=2 равна 92,44%, а при п==3 91,88% [141]., В качестве многомерного ядра можно взять также дру¬ гие функции, в частности я-мерные плотности с симмет¬ ричными маргинальными. Чаще всего в качестве ядра вы¬ бирается я-мерная-нормальная плотность N(0, Rjv). с кор¬ реляционной матрицей Rw= {hi {N)hk (>N)plft; i, k= 1, N) i[126, 136]. Как и ранее,. hi(N) выбирается чаще всего в виде h(N) = CN~a/n, где С — константа, a as(0, 1) вы¬ бирается из условия состоятельности и равномерной схо¬ димости оценок. Выбор же корреляционной матрицы р не влияет на асимптотические свойства оценки, но важен, так как влияет на качество аппроксимации при конечном объеме выборки. Вопрос выбора оптимальной матрицы Ропт еще не решен. Чаще всего рекомендуется выбирать р пропорционально выборочной корреляционной матрице либо производить декорреляцию-данных (векторов) и в качестве р выбирать единичную матрицу [126, 136]. Наконец, отметим, что если отказаться от условия k (г/)^0, т. е. выбрать 4, то как в одномерном, так и в многомерном случае можно получить меньшие значения смещений и дисперсий, локальных и глобальных средне¬ квадратических ошибок, выбирая оптимадьные знакопере¬ менные ядра [120]. Однако при этом, как уже упомина¬ лось, с положительной вероятностью оценки ^(дс) может принимать отрицательные значения [120]. До сих пор мы рассматривали независимые выборки. Сходные свойства. имеют дискретные оценки (6.15) и в том случае, если элементы выборки коррелйрованы, но корреляция убывает с ростом расстояния между элемен¬ тами выборки [120]. Для-непрерывйых алгоритмов оценки (6.15), (6.28) преобразуются -очевидным образом. Так, '(6.28) для векторного процесса Х(()={Х»$), s=l, n} пре¬ образуется к виду г Х„—Хп( <+*„-!) (6.38) Thi(T),. ,hn(T) > • • • f 188
Свойства подобных оценок, так же как и оценок (6.15), (6.28) при коррелированных данных, можно изучить на основе результатов § 3.2. Заметим также, что оце^ри' (6.15), (6.28) можно вида>- изменить, представив их в рекуррентной, форме, введя бай¬ есовское оценивание, а также используя динамические ал^ горитмы. Аналогично получаются Я-оценки функций рас¬ пределения Z1 (ж) интегрированием в пределах (—оо, ж} оценки If (ж) либо по формулам типа (6.15), (6.28), (6.38) с заменой в них ядра на интеграл от'ядра в пре^ делах (—оо, дс]. Для условных плотностей W (х/у} Я-оценки можно получить либо отношением №(х, у)1№(у)т либо введением условных ядер k(x/y)—k(x, y)/k(y), либо введением условий типа k (ж/у) —k (ж) I (уе[у± Ду/2)}. Как видно из, (6.15), (6.28), методу Я-оценок свойствен существенный недостаток, связанный с необходимостью вычисления значений ядра для каждого элемента выбор¬ ки. Этот недостаток удается ослабить, заменяя Я-оценива- ние близким ему оцениванием по методу ^-ближайших со¬ седей (£-го ближайшего соседа, БКл-оценивание), введен¬ ного Кофтсгарденом и Кьюсенберри в 1965 г. [97, 126,136}» 6.4. МЕТОД БЛИЖАЙШИХ СОСЕДЕЙ Рассмотрим этот метод на примере дискретных оценок. Пусть жь ж2 xN есть дискретная выборка п-мерного случайного вектора X или функции ЛГ(;7). Обозначим через Sir (х, к^) область, содержащую те точки (элементы) хи ..., xN, расстояние d(x, ж,), t=l, N, которых (в смысле принятой метрики) не превышает рас¬ стояние dK до k-го ближайшего к х соседа из жг-, t=l, ЛГ. Через Vjv(x, к) обозначим объем области Sn(x, к), т. е. объем множества всех-,точек, расстояние которых до. точ¬ ки х меньше или равно dK. Например, если используется евклидово расстояние d(x, у)=[(у—ж)тА(у—ж)]1/2, то Vn(x, k)=(jtn/2dk”{|det А|) 1/2Г [(n+2)J2]}~\ Г(а) — гам¬ ма-функция. Тогда БСк-оценка 1Р (ж) имеет вид 1^(ж) = (k— 1)J[NVn(ж, к)]. (6.39) Величину к следует выбирать таким образом^ чтобы плот¬ ность W(x) была приблизительно постоянной внутри об¬ ласти Sir (ж, к), т. е. как можно меньше. Однако малым значениям к будет соответствовать малая доля элементов 18»
.выборки, попадающих в область Sw(*, к), что будет при- 'водить к : больший статистическим погрешностям. Таким -образом, 'выбор к влияет на смещение и дисперсию оценок в разных направлениях и'зависит от 1ЛГ (т. е. k=k (N)) и; ют неизвестной плотности. Можно показать, что если к== ±=k (N) выбирать ;из условий k(N)~*~oo и к (М)=С№~ 0< '<а<1 при ‘N-*-оо* то при независимой выборке оценка (6.39) является- асимптотически несмещенйой и состоя¬ тельной оценкой, плотности :W{x) • в каждой точке непре¬ рывности х' [97, 126, 136]. Понятно, что, задаваясь пока¬ зателем качества оценки, можно найти оптимальное зна: «чение <k в виде к (W) =CWa, а также попытаться решить вопрос об оптимальной метрике d(x, y) аналогично опти¬ мальному ядру в Я:оценивании; - В [126] показано, Цто эти меры позволяют получить Д4 порядка ДГ-4Лп+4) при SfeCAO, .пропорциональных ЛГ1А«+4>. В [1511 для показателя качества оценки Ддг=М{[1Р(х)-1—Щ*)-*]2} показано, что при k (iN) '-'N2{3 асимптотически Д^=0 (N~2/3) независимо Ът размерности п. В силу простоты реализации БСк-оцениваниё вызывает .особый интерес в ‘задачах, когда оценивание плотности вероятности" является вспомогательной задачей, например используется для целей классификации, когда достаточно •решить, лишь вопрос о том, какая из двух плотностей ве¬ роятности больше в данной точке, [97, 126]. 6.5.. МЕТОД ПОЛИГРЛММ Для оценивания функций распределения F(x) и плотностей распре¬ деления Щ*)> а также спектральных функций С (X) и плотностей мощ¬ ности S (X) 1 методами, в основе которых лежит идея группирования, т.е. избирательного усреднения элементов выборки с равномерным ве¬ псом; возможны, два- подхода, каждый из которых допускает, две моди¬ фикации. Первый подход основан на группировании в области опреде¬ ления функций F, W, С и S, т. е. на1 группировании значений аргумен¬ та х или X, и определении оЦенок вероятностей попадания значений элементов выборки для F(x), W(x) или оценок долей мощности траек¬ торий случайных функций для С(Х), S(X) в. эти интервалы группиро- шания; второй — на группировании в области значений функций F(x) и с(Х) и определении оценок объемов кв.антильных областей, т. е. областей, значений- "х и X, соответствующих интервалам группирования L Автору не известны публикации, в которых описываются методы оценивания С(Х) и S (Я) типа БСК и полиграмм, хотя подобные непа¬ раметрические оценки спектральных" 'характеристик очевидны и могут «быть весьма полезными. 4 190
F и с. Модификации внутри каждого подхода связаны с тем, как на¬ значаются -интервалы группирования. Рассмотрим их на примере дис¬ кретных оценок одномерных-функций и плотностей распределения-F(x)* и №(х). В'первой модификации первого подхода, соответствующей ме¬ тоду , гистограмм, интервалы группирования назначаются как состыко1- ванные полусегменты (х^, xj5+lj], когда [Xs+1] = x[s] + Ах, 5=1, л* Лх—фиксированная ширина интервала группирования, а хщ и Х[п+1] оп¬ ределяются либо априори из условия, что вероятности Р {А^ х^} » Р {X ^х[я4.х]} ке превышают наперед заданные малые значения, либо апостериори, например, как x[x]=x(i), x[n+1] = x(^)f где Х(х), Х(2ь ... Х(н) — вариационный ряд, соответствующий дискретной выборке Xi„ *2, .♦•» Kn. Оценки F(x) и 1Р(х) при этом получаются в виде ступени чатых-функций, .постоянных на интервале (хдо, Х[5+х]] с априори слу¬ чайным значением [/Cx+JC2+...+JC5]/W для*?1 (х) и Ks/NДх для №(х)* причем эти значения приписываются середине интервала группирования* Т. е. точке х = xps] + Ах/2, что' позволяет, как известно (см^ (6.5), (6.6), а также § 3.1 и 3.4), получать 'меньшее смещение оценок, при Их ступенуатой или линейной аппроксимации по сравнению со-слу¬ чаем, когда оцененные/значения приписываются другим, точкам" интер*- вала группирования. -Во второй модификации первого подхода с группированием выбора ки с фиксированным шагом Ах (ядерные оценки с равномерным весом)) F (х) и-1? (х) находятся как решетчатые оценки, когда назначаются не интервалы группирования, а конкретный набор значений аргумента х- В этом случае значение f(x) определяется как Кт/N, где Кх— номер» элемента Х(КХ) вариационного ряда, ближайшего к Хмелева, т. е. наи¬ большего, удовлетворяющего условию Х(к%) <х, или, иными словами* априори случайное число значений элементов выборки, ‘удовлетворяю¬ щих условию Xi^x. Значение же оценки плотности W(x) в точке *х равно /С(х, Ax) fNAxt где К(х,. Ах) — априори случайное ^число элемен¬ тов выборки, попадающих в . интервал (.х—Ах/2| х=4?Ах/2]. Очевидно* что, если назначить набор значении х в данном методе совпадающим со» значениями середин интервалов группирования в предыдущем методе; то оба метода дадут одинаковые результаты, совпадут. Во втором подходе априори группируются значения F(x) с шагом А/7, когда либо весь диапазон [0, 1] значений F(x) разбивается на m стыкующихся участков (F[r], F[r+1]], г = 1,1/w, либо оценка F (х) находится для4 заданного набора”’ значений F(^); F(a), F(m) и под г-м интервалом группирования понимается интервал* у которого F[r] = F(r) — О,БД/7, F[r+ x] = F(r) -f 0,5Д/\ Затем^ осущест¬ вляется апостериорное оценивание* по выборке объема V (г; AF) квантиль- ной*'области, (т. е. области значений аргумента X), соответствующей F (я) S (F[r], F[r+1]]. Заметим, что, поскольку в многомерном случае ^
зависимость между .AF и У (г, AF) не . является взаимно-однозначной, •необходимо заведомо договориться перед оцениванием, как образуется «вантильная область. Рассмотренное в предыдущем параграфе БС-оце- «ивание W(x) представляет собой пример дискретного оценивания по «торой модификации этого подхода, в котором AF=k/N, а оценка «вантильной области для фиксированных значений х (т. е. для > не¬ известных фиксированных F[r] = F (*)) определяется как Vn (*, k). Оцен¬ ка Р(х) в этом случае находится так же, как во второй модификации ^первого подхода. * Первая модификация второго подхода связана с группированием значений F(x) с шагом AF в т состыкованных участков (F[r], F[r+j] r=l,m, и с оцениванием F(x) и W(x) в виде ступенчатйх функций. При этом высота ступенек для Р(х) равняется AF и ступеньки накла¬ дываются, если идти от меньших х (по каждой координате) к большим, «а предыдущие значения Р(х) в точках х, равных непрерывным или дискретным оценкам граничных точек квантильных областей, т. е. кван¬ тилей, соответствующих F^jj.- Примером дискретной оценки Р(х) та¬ кого типа для одномерной'функции распределения F(x) является кван- тильная [120] оценка, принимающая положительное приращение K/N ъ точках x=*xisK), s=l,m, т. е. F(x) равняется sK/N при хе(х(^>; jc(^/c~4-/c)] - При К— 1 получается широко известная оценка F(x) (см., на¬ пример, [120]). В качестве оценки №{х) одномерной плотности W(x) © этом случае можно взять ступенчатую функцию, прини¬ мающую значения AF/(xr+i—хг) в r-м интервале (хг, Хн-г], тде хг — непрерывная или дискретная оценка квантиля хг, соответствующего F{x)=F[T]y r=l, т, F[T]= (г—l)AF\AF= = 1 /т. Примером такой оценки является полиграмма /(-го яорядка [120]. Пусть 'N=ntK, где т и К — целые числа, ■а {*(«•); t=l, N) — вариационный ряд, соответствующий дискретной выборке {*«•; t=l, Щ. Полиграммой, /(-го по¬ рядка называется статистика [ср. с (6.3) и'с (6.39)] / т fN (к) = — У1 , (6.40) Щ Ш Х(гк+К) ~Х(ГК) если (х(гк+к)—Х(тк)) —>-0 приW-*-oo и К=0 (N), где I {А} — индикатор события А. Из (6.40) видно, что полиграмма представляет собой ступенчатую функцию, постоянную в примыкающих друг к другу интервалах. Ак—(Х(Тк)', *(гк+ю], г=1, т, значение ступеньки на r-м интервале которой равно К/N{Х(Тк+к)— —Х(гК)) ■ 192
Целесообразность применения полиграммы (6.40) . в ка¬ честве оценки-(П-оценки) плотности W(x) обусловлена тем, что если W(х) >0' ограничена'вместе со своей первой производной W (х), т. е. 0<Щх)г£:с<оо и \W'(x) [}<оо для всех х в области tP(x)!>.0, а выборка {хс, t=l, N) не¬ зависима, то при K=>Na, 0<а<1/2, fjv (х) является состоя¬ тельней оценкой, W{x), а случайная величина tN= = N*(]/J]W If) распределена асимптотически нормально с нулевым средним Тн единичной дисперсией [120]. Обратим, однако, внимание на то, что при выполне¬ нии всех предыдущих условий, но при К конечном поли¬ грамма не является состоятельной оценкой W (х), так как ее момент, q-го порядка равен при этом WqKq~l (К—q) U (К—1)!, т. е. не зависит от объема выборки [120]. При оценивании, многомерных плотностей W(х) можно либо отдельно оценивать методом полиграмм безусловные и условные плотности, как это предлагается в [92], либо' вместо интервалов (х^ю, х{гК+ю], г=1, т, выбирать при¬ стыкованные друг к другу гиперпараллелепипеды, как можно более близкие к гиперкубам, проекции вершин ко¬ торых совпадают с элементами вариационного ряда по кажДой координате и в которые попадает К элементов вы¬ борки i= 1, 'N), предварительно упорядоченной по каждой из п координат; где п — размерность вектора х. Величина ступеньки оценки Tfr(x) для х, попадающей в г-й гиперпараллелепипед (г=1, т), будет равна -при этом K/NVr, где Vr — объем этого г-го гиперпараллелепипеда. 6.6. МЕТОД СГЛАЖЕННЫХ ДЕЛЬТА-ФУНКЦИЙ Данный метод (СДФ-оценивание), по-видимому, явля¬ ется менее всего исследованным. Согласно данному мето- -ду (траекторная) СДФ-оценка Ф'(х) плотности W (х) век¬ тора X (или функции X(t)) равна [см. (2.46)] „Г(х) = .#г{8с(х, *)}-, (6.41) где' бс (х, у) — «-мерная сглаженная дельта-функция. Сопоставляя СДФ-оценку (6.41) с ДОФ-оценкамй (6.15), (6.28), (6.38), видим их внешнее сходство. Отличие сводится к замене дельта-образного ядра (k(yfh).) 1 Если W (х) >0, то распределение является моноквантильным. .3—192 ' 193.
сглаженной дельта-функцией. Это приводит к тому, что согласно (2.46) оценки (6.41) будут несмещенными для тех плотностей W{x), для которых существует; 6С(*, у). Как упоминалось в начале параграфа, в приложении к оцениванию плотностей распределения вероятностей не¬ возможно найти оценку, являющуюся несмещенной для любой плотности распределения. В связи с этим нельзя надеяться найти сглаженную дельта-функцию (СДФ), для которой в отличие от дельта-функций выражение (2.46) будет'справедливым для любой плотности распределения вероятностей. В [75] предлагается для оценок плотностей W(x) вы¬ бирать в качестве СДФ 6С(*, У) потенциальную функцию, представимую в виде т \(х> (6-42) fr=о где Чгто(дс)={фй(дс), 6=0, т} — система ортонормирован- ных с единичным весом функций (неполный ортонормиро- ванный базис). В более общем виде Ч^дс) может представлять собой систему из т линейно независимых функций фь(лс), k— =0, m, с невырожденной матрицей А k, i=0, т}, составленной из скалярных произведений этих функций = (6-43) X Ортогональной системе соответствуют аш=0 при k=£i, а ортонормированной akk= 1, т. е. А==1. В этом случае СДФ (*, у) равна 6С(*. у) = Ч?т (х) А-1ЧГт(yf. (6.44) Тогда для любой плотности W(x), представимой в биде т (X) = 4V (х) С .= ^ (х), (6.45) k=0 С = {ск; k = 1Т¥} = ( А-1^ (х) W (х) dx, (6.46) х * будет справедливо выражение (2.46). Следовательно, при СДФ вида (6.42), (6.44) СДФ-оценна (6.41) будет несме¬ щенной только для плотностей (6.45). В остальных слу¬ чаях смещение ^(дс) будет р^вно разности W (х) и правой части (6.45). При этом подобные оценки совпадают с оцен¬ 194
ками, рассматриваемыми далее. Если плотность W (*) представима только бесконечным рядом (6.45), т. е. при- т=оо, то для оценки (6.41) с СДФ вида (6.44) при ко¬ нечном т будет справедливо равенство |[Г(лг)-М{^(*)}]’<£* = S I ckcnakn:(bA7) X k—m+\ п=т+1 которое для ортонормированных базисов переходит в сум¬ му квадратов c2m+i-f-c2m+2-l- Корреляция и глобаль¬ ная среднеквадратическая ошибка Д4 подобных оценок равны т' т R# (*,.. *.) = 2 S ^ A (*.) fn (Хщ), (6.48) k=0 /г=0 т т АЛ*Ч*)} = 2 2 Runflkn. (6.49) fc=0 n=0 т. e. для ортонормированных базисов A.= SD{?*}, (6.50) 4=0 где С = {ck; k = 0, m} = Mr {А~1ЧГГ„ (ж)}, (6.51) M (Ck} = ck\ Rkn = M {fa — ck] [?n — <?„]}. (6.52) Корреляции Rkn могут быть легко подсчитаны на основе (6.51) по формулам § 3.2. 6.7. МЕТОД ОРТОГОНАЛЬНЫХ РАЗЛОЖЕНИЙ (ПРОЕКЦИЙ) Для упрощения изложения рассмотрим вначале ОР- оцениваниё на примере одномерных плотностей W(x). До¬ пустим, что плотность W (xj определена на X й ее квадрат интегрируем на X с весовыми функциями р.(х). Тогда та¬ кую плотность можно представить по полной системе ор¬ тонормированных функций одним из следующих способов: 2 CkMx), с*=5 W(x)W (xfdx, (6.53) *=0 X W(x) = 2 ck9k (к), = Г пЦх^(х) W(x)dx, .(6.54) 4=0 X 13* 195
U7(x) = |*(*)Jj ^W,;c,= jV(4r(x)^, (6.55) *=o ' X W(*) = VдаЛ «*С(X), ck=U*(x)W(X)dK, (6.56) 4=0 X где звездочка означает комплексную сопряженность. При фо.(*) = 1 cn—Q(k), т. е. последовательность сь. есть линей¬ чатая обобщенная характеристическая функция. Полагая фь (*)=]/ ц (л:) £ (х), убеждаемся, что первый и-четвертый варианты представления эквивалентны. Второй и третий отличаются от них и между собой способом учета весовой функции р(лг). Под весовой функцией обычно понимают функцию,, которая обладает свойствами плотности и для ортогональных функций тйпа ортогональных полиномов имеет.все моменты. Известно [134], что в этом случае для каждой плотности вероятностей W(x)==,\i(x) существует единственная система ортогональных полиномов. В част¬ ности, плотностям, принадлежащим семейству распределе¬ ний Пирсона, .соответствуют только классические ортого¬ нальные многочлены, образующие три семейства: Чебы¬ шева — Эрмита ' '[Х=(—оо, оо), |x(jc)=N’(x; 0, 1), — стандартная нормальная плотность], Чебышева — Лагер- ра [Х=(0, оо), ц(х) =Г'(х; 0, 1; а) — гамма-распределе¬ ние'], обобщенные многочлены Якоби [Х=(—1, 1), p,(x) = = Be’i(x; 0, 1; а, Р) — бета-распределения I рода] и их частные случаи — многочлены Чебышева I рода [р,(х) = =Be’i(х; 0, 1; 1/2) — распределение арксинуса], II рода [p(x)=Be’i(x; 0, 1; 1/2, 0)], Лежандра [p(x)=Be’i (х; 0, 1; 1, 1) — равномерное распределение], Гегенбаэра [(д.(х) = Ве’х(лг; 0, lj-'a, а)] [12, 31, 43]. Помимо ортого¬ нальных полиномов с точки зрения простоты реализации определенный интерес представляют разложения по си¬ стемам ортогональных экспоненциальных функций [52], .кусочно-постоянных функций Уолша, Виленкина — Крес- тенсона, Виленкина — Понтрягина,.Хаа'ра, кусочно-линей¬ ных функций Шаудера и т. д. [27, 123], а-также по дру¬ гим ортогональным функциям [12, 31]. При. практической реализации оценивание на основе ортогональных разложений осуществляется при конечном числе т-\-1 членов рядов (6.53) —(6.56) аналогично (6.45). При определении съ. согласно указанным формулам подоб¬ ные конечные суммы tn-vi степени, как известно [12], дают наилучшее среднее квадратическое приближение в смыс- 196
Лё минимума левой части (6.47) в классах всёх, сумм /п-й степени по данной системе функций. ОР-оценки Ф(х) на¬ ходятся в виде т ^(*) = 2 «*Ы*). Ck = MT{qk{v)}, (6.57) о где gh{x) равно ф*(х) для (6.47), <pft{*), p(x)&t (х) или (х) С (*) для (6.48), ,(6.49), a qh(х) равно фЧ(лс), Ф*й(л:)р(х), |*к(х) или С* (х) ]/р, (х) соответственно. Не¬ трудно убедиться, что с*. есть несмещенная оценка с*. Подобные оценки lP'C*),. так же как и оценки (6.41). с (6.42), (6.44), будут несмещенными только для плотно¬ стей, точно представимых суммой ряда т-й степени. В об¬ щем же виде оценка будет смещенной и смещение будет тем меньше, чем больше будет т, Т. е. число членов ряда, и чем быстрее будут убывать члены ряда т с увеличением их номера (см. (6.47) при аьп=1, если k=n; и при аы=О, если 1гфп). В свою очередь данные показатели зависят от вида неизвестной пло'тности W (л:), от выбора представле¬ ния (6.53) — (6.56), от выбора системы базисных функций и от априорных данных. Как влияют априорные данные? Допустим, что неизвестная плотность имеет отличные от нуля параметры сдвига а и масштаба Я. Поскольку gu(x) и q(x) не учитывают параметров плотности W (х), что, кстати, и позволяёт получить непараметрическую оценку (6.57), то количество значимых членов ряда будет опреде¬ ляться значениями а, Я. Так, например, если Щх) есть нормальная плотность N(a, Я), р(х) =N'(x; О, 1) и.исполь¬ зуется разложение (6.55), когда £л(х) — полиномы Эрми- та, т. е. ряд Грамма — Шарлье, то при а=0, Я=1 мы бу¬ дем иметь всего один отличный от нуля нулевой член ряда N-(л:; 0, 1), а при аФ0 и (или) тем больше зна¬ чимых членов ряда, чем больше а, Я (см., например, раз¬ ложения в [109, 126]). С другой стороны, если бы значе¬ ния а и Я нам были известны, то вместо разложений (6.53) — (6.56)“ следовало бы -использовать разложение с заменой ц(х) и gk(х^на ц((х—а)/Я)/Я и gk((x—а)/Я)/Я, что в приведенном примере позволило бы при любых а, Я всегда иметь один отличный от нуля член рйда. Понят¬ но, что подобное разложение либо предварительное линей¬ ное преобразование (нормирование, стандартизация) вы¬ борки с целью получения о=0 и Я=1 можно осуществлять и в том случае, когда а и Я нещзвестны, а вместо них используются робастные оценки их. (Подобный прием для 197
ряда Грамма — Шарлье рассмотрен в [57].) При свобод¬ ном от распределений оценивании а и А, мы будем при этом находиться в классе непараметрических методов оце¬ нивания, в противном случае — в классе смешанных- ме¬ тодов (см. далее). Однако желательное для уменьшения смещения увеличение tn может оказаться нежелательным из-за значительного увеличения дисперсий оценок и пока¬ зателя А4, определяемых выражениями (6.48) ^(6.50). Задаваясь соответствующими точностными показателями качества оценок, например одним из показателей (1.52) — (1.54), можно поставить и решить, задачу поиска опти¬ мальных ортогональных функций и числа т членов ряда, обеспечивающих получение минимального'значения дан¬ ного показателя [133, 136]. Желательно при этом учиты¬ вать также другие показатели качества оценок. Оказыва¬ ется, что оптимальное m зависит от объема и корреляции выборки, а также от неизвестной плотности. В случае rie- зависимых выборок скорость сходимости ОР-оценок может достигать граничных значений, определяемых выражения¬ ми типа (6.1) [67, 136]. х Чаще, всего априори значение т числа членов ряда (6.57) определяется исходя из условия нецревышения пра¬ вой частью выражения'вида (6.47) (или показателей вида (1.48), (1.50), Ал, k=\, 6, вида Aft с заменой в Е,(6) оцен¬ ки <5(6') на М{<5(6)} и т. п.) заданного порогового зна¬ чения е. Поскольку оцениваемая плотность W(х) не изве¬ стна, поступают следующим образом. Для разных т. опре¬ деляют значения выбранного показателя качества для не¬ которого "множества типовых стандартных распределений W(x). Затем ^ выбирают такое минимальное значение т, при котором значение выбранного показателя качества оценки не превышает порогового значения е для всех или для определенного большинства типовых распределений. Апостериори значение т, если это позволяют условия экс¬ перимента, можно выбирать следующим образом. По опи¬ санной в'ыше процедуре вначале определяется начальное приближение m и находится оценка <5i (6) (или, если не¬ обходимо и возможно, М{<5(6)}). Затем т увеличивается на единицу и находится <5г (6), которая в смысле выбран¬ ного показателя (либо визуально или по другому какому- то критерию) сравнивается с <5i(6). Потом находится^* оценка <5з (6) при т+2 ч'ленах ряда, которая сравнивается с <52 (6) и т. д., пока изменение т практически не будет сказываться на значениях показателя М{<5(6)}. Не сле¬ 198
дует забывать при этом проявление статистических по¬ грешностей. Рассмотрим некоторые разновидности ОР-оценок. Пусть используются разложения вида (6.53), (6.55) по системе ортогональных полиномов. Тогда (лг) и £ь(х) представим в виде &0+М+ +bhxk, т. е. ch являются линейной комбинацией начальных моментов т* величины X, а именно ck±=ibo-\-bimi-\- Ц-ЬцШь. Следовательно, оценка^ может быть представлена в виде £k=bo + bifhi + A-bhfiih- При непараметрическом оценивании mh мы получаем тем самым непараметрическую момен^нуй) оцен¬ ку плотности W(x) [57, 117, 118, 126, 136] ...Поскольку при этом вид базиса влияет только на значения коэффициентов bi, i=0, ife, можно, по выборке однократно найти оценки ifii, tilt, ..., thm, а затем по ним находить различные оцен¬ ки _^_(х) по различным базисам ф&(л:), £*(.»), меняя t=l, т. Разложение по Системе кусочно-постоянных функ¬ ций (особенно по системе функций Уолша и Радемахера) удобно с точки зрения реализации алгоритмов оценивания (устранение операций умножения, использование.алгорит¬ мов БПФ). Допустим теперь, что плотность W(x) определена на конечном сегменте X=i[a, b). Тогда она может быть пред¬ ставлена рядом Фурье (6.53) по системе экспоненциаль¬ ных функций фьХ*:)=ехр {—2яjkx/(b’—а)}. В этом случае коэффициенты с*=©(2knJ(b—а)), т. е. совпадают со зна¬ чениями характеристической функции в(ы) в точках =2fort/(6—а), а в качестве.оценок 6*. могут быть использо- ваны любые непараметрйческие оценки 0(«й), например значения ЭХ-оценки Теперь снова положим Х=[о, &•] и допустим, что плот¬ ность W (х) достаточно измерить в фиксированном наборе точек xs=a-|-sAx, s=0, 1, ..., г—1. Выберем (t и Ах таким образом, чтобы выполнялись условия а=пуАх, Ь—а=п2Ах. Тогда в качестве систем opтoгoнiальныx функций следует взять системы дискретных ортогональных периодических функций с периодом п2 [123], в частности дискретных экс- [см. (6.58)], функций Уолша, Хаара, Виленкина — Крестенсона и т. д. При этом интегрирование в (6.53)— 199 (6.58) поненциальныхфункций (ДЭФ) t{>Aj(xJ = exp
(6.56) заменится суммированием и появляется возмож- * ^ / ность при оценивании W (х), 0(ы) использовать алгорит¬ мы ‘быстрого, преобразования Фурье (БПФ). Помимо периодических дискретных ортогональных. функций для указанных выше целей, а также при оценивании дискрет¬ ных законов распределения можно использовать неперио¬ дические дискретные ортогональные функции, например дискретные многочлены Чебышева, Кравчука, Пуассона — Шарлье, Мейкснера, Гана (Хана) и др. [12]. Аналогично осуществляется ОР-оценивание многомер¬ ных плотностей с заменой системы ортогональных функ¬ ций одной переменной на функции многих переменных [12, 159]/ Условные плотности W(x/y) могут оцениваться от¬ ношением W(x/y)J№ (у). Функции^ распределения F(x) мо¬ гут оцениваться интегрированием плотностей или непо¬ средственно по выборке на, основе разложения. самих функций распределения в ряд [120].- Подобные алгоритмы очевидны. , 6.8. МЕТОД НЕОРТОГОНАЛЬНЫХ РАЗЛОЖЕНИЙ Метод HP-оценивания отличается от предыдущего лишь тем, что функции .ф* (*'),. 6=0, т, в разложениях ви¬ да (6.45), (6.53) — (6.56) не являются ортогональными. При этом несмещенная оценка £={&; 6=0, т) опреде- ляется"выражением „ (6.57), а оценка №(х) в отличие от СДФ-оценки (6.41) определяется формулой (6.45) с. заме¬ ной. Ck на бк- Для данных оценок справедливы формулы (6.47) — (6.49). Опять-таки для HP-оценок-можно решать задачу поиска оптимальных базисов, обеспечивающих ми¬ нимум или максимум заданного показателя качества оцен¬ ки. Заметим, что если матрица А~' не является диагональ¬ ной, то согласно (6.51) вычислительные затраты на полу¬ чение HP-оценок могут значительно превышать затраты на ОР-оценивание. Некоторой компенсацией затрат может быть разве что получение меньших значений дисперсий (6.48) и показателя А4 (6.49) за счет наличия отрицатель¬ ных значений Rkn и akn при 6#га. В качестве неортогональных базисов можно использо¬ вать PL-функции, взвешенные функции Шаудера, функции Чебышева — Маркова, псевдослучайные сигналы, функции Чанга, другие системы линейно независимых функций [16, 27, 74]. С точки зрения реализации наиболее'предпочти- 300
feJtbHbtMit Из ййх явЛйЮтся функций,-ДопусНаюЩие приме¬ нение алгоритмов БПФ, свободные от сложных матема¬ тических операций. 6.9. ПРОЧИЕ МЕТОДЫ Из других методов огметим различные методы, направленные на повышение точности оценок путем учета априорных сведений о распре¬ делении '[57, 80, 100, 116], аналитического упрощенного описания иссле¬ дуемого физического объекта и специально организованных статистиче¬ ских испытаний с последующей оптимальной обработкой их результатов [101] , квантильное и контурное оценивание [100, 120], минимаксное инвариантное оценивание функции распределения [58], сглаживание оценок, оценивание методами выделения гладкой кривой из зашумлен¬ ных^ данных [67], моментное оценивание методом перевала, методы гар¬ моник [11] и преобразований. Фурье характеристических функций [139]. Особый интерес представляют методы, основанные на {/-статистиках (см. § 2.3). Однако в приложении к оцениванию распределений подоб¬ ные методы еще не нашли должной проработки (некоторые результа¬ ты можно подучить на основе [120], некоторые ссылки есть в [153]). В частности, в случае зависимых компонент X вектора X при дискрет¬ ном оценивании по независимой выборке, {/-оценки функции распреде¬ ления *F{x) совпадает с ЭХ-оценкой (6.2) [120]. 6.10. СМЕШАННЫЕ МЕТОДЫ. АНАЛИТИЧЕСКОЕ ОПИСАНИЕ ОЦЕНОК В ряде работ [64, 69, 80, 106, 116, 120, 122] в случаях, когда модель JT04HO известна, отдается предпочтение па¬ раметрическим методам перед непараметрическими. Для оценок распределений это предпочтение объясняется со¬ поставлением точностных показателей параметрических (см. § 4.4) и непараметрических оценок, а для ОР-оценок оно рассматривалось быше. '■ Например, для параметрической НРМД-оценки (4.15) нормальной плотности N’(x; а, IX) значение - 64= = Д4 | Jw!(K)dK —00 0,875N~x, для параметрической МП-оценки N' (х; к, D) * 17 имеем 84 ^^ 1,06yV-1, в то время как для оптимальной 16N непараметрической Я-оценки имеем асимптотически 64*= ^1,13 N-4'5, 7 асимптотически равно 8. «=* г * 8N -
Более существенная разница Получается для равномер¬ ного распределения [ср. (4.8) с (6.21), (6.23), (6.29)]. Однако, как указывалось в гл. 2, когда не удается исполь¬ зовать робастные методы, параметрические оценки могут резко ухудшить свои точностные показатели, если вид ис¬ тинного распределения, отличается от приписываемого вы¬ борке. Избежать подобных неприятностей, вызванных не¬ соответствием моделей, или существенно ослабить, их мож¬ но, если модель вводить или уточнять по выборочным дан¬ ным, т. е. на основе статистического подхода (см. введе¬ ние), использующего непар.аметрические методы. Тем са¬ мым мы приходим к двухэтапным, смешанным методам оценивания (измерения), когда на первом этапе с помо¬ щью непараметрических алгоритмов выбирается («оцени¬ вается») модель — в данном случае вид распределения, а на втором этапе производится ее параметрическое оце¬ нивание (измерение). Подобное•оценивание удобно тем, что позволяет получить аналитическое описание измеряе¬ мой характеристики, причем, как правило, в компактной форме, в более компактной, чем, например, при непара¬ метрическом ОР- и HP-оценивании. На примере ОР-оце- нивания такой выигрыш в компактности уже обсуждался. Поскольку непараметрические ОР-оценки находятся так, что функции базиса Ч*1™ (х) не содержат неизвестных' пара¬ метров распределения, число членов разложения при за¬ данных требованиях к смещению оценок может быть боль¬ шим, а само разложение — неудобной аналитической мо¬ делью. С другой стороны, априори (при чистом парамет¬ рическом оценивании) или апостериори (при смешанном оценивании) мы можем использовать модель распределе¬ ния-в виде ортогонального ряда по тому же базису, но ввести неизвестные параметры распределения (сдвига, масштаба и даже формы) в базисные функции фь(.к) *, ко¬ торые вместе с коэффициентом Ск будут оцениваться па¬ раметрическими методами: м, МП, НК и т. д. Подобное разложение будет, как правило, компактнее, т. е. иметь меньше слагаемых! В частности, вначале можно найти не¬ параметрическую ОР-оценку ТГ(лг), затем заменить раз¬ ложение по тому же базису {фь(х)}, но с внесением неиз¬ вестных параметров сдвига и масштаба в функции ’фл(х), т. е. заменить фь (х) на {x—a)Jk)' и осуществить Л 1 Например, для распределений, близких к ^"-распределению [43], можно использовать разложение по полиномам Лагерра- Lka(z) при z=[bc—а)Х_1]р, где. а й Р— неизвестные параметры формы. 202
параметрическое оценивание подобной плотности, пред¬ ставленной таким рядом, методами ЗХ, НК, МХК и т. д., не обращаясь повторно к выборке. Как указывалось в § 2.4, выбор вида распределения F(x), W(x) на первом этапе может осуществляться следу¬ ющими способами. Первый способ. Непосредственно по выборке находятся значения характеристик, положен¬ ных в основу методов упорядочения и Шбора распределе¬ ний (см. [43]), и затем по полученным значениям'этих характеристик выбирается одно из распределений задан¬ ного множества типовых распределений, например изме¬ ряются значения коэффициентов асимметрии и эксцесса ц_ по плоскости моментов выбирается одно из распределе¬ ний ГТирсона, Джонсона, Бородачева и т. п. либо измеря¬ ются квантили и - выбирается одно из .^-распределений [157]. Второй способ аналогичен первому с той раз¬ ницей, что значения характеристик для упорядочения и выбора распределений определяются по предварительно найденным непараметрическим оценкам Р (*), №(х). Нако¬ нец, третий способ основан на подборе вида распре¬ делений непосредственно по непараметрическим оценкам Р(х), №(х) одним из методов подгонки кривых, аппрокси¬ мации функций, восстановления функций по ее отсчетам и т. п. Вполне понятно, что непараметрические оценки Р(х), № (х) могут использоваться, кроме того, для провер¬ ки соответствия параметрических оценок F, W в итераци¬ онных процедурах идентификации объектов. Исходя из изложенного, можно заметить, что смешан¬ ные методы представляют интерес при многофункциональ¬ ном анализе, когда необходимо измерять несколько харак¬ теристик. В этом случае, особенно если по каким-либо при¬ чинам не всегда возможно или целесообразно всю обра¬ ботку, особенно измерение пёрвых ' характеристик,^вести на ЭВМ !, процесс измерений следует сделать двухступен¬ чатым: вначале с помощью простейших специализирован¬ ных • средств получить либо характеристики упорядоче¬ ния —'"выбора распределений, либо значения непарамет¬ рических оценок Р (дс), (х), либо вид распределения и (или) значения его параметров. Получение всех других характеристик .возложить на универсальную ЭВМ2, для 1 Например, из-за сложности, невозможности или нецелесоо'бразно- сти ввода экспериментальных данных в ЭВМ на линии с эксперимен¬ том, из-за недопустимых затрат времени на обработку на ЭВМ (недо¬ пустимого запаздывания) и т. д. 2 Получение вторичный характеристик^ зачастую возможно и целе¬ сообразно выполнять на настольных и карманных клавишных ЭВМ. 203
которой входными будут не экспериментальные данные — элементы выборки, а выходные результаты специализиро¬ ванного измерителя, объём которых и условия ввода в ЭВМ будут более благоприятными. В общем случае, без привязки к конкретным задачам и условиям,-нельзя дать рекомендаций о предпочтительно¬ сти- одного из рассмотренных вариантов смешанных^мето- дов или одного множества аналитически заданных распре¬ делений перед другим. В решении практических задач сле¬ дует, по-видимому, испробовать (теоретически или практи¬ чески) различные варианты, чтобы выбрать из них наи¬ более подходящий в данном случае. Как писал Гете: «Кто ищет, вынужден блуждать». Можно высказать лишь не-' которые общие соображения по этому вопросу. Так, если механизму случайности в значениях экспериментально на¬ блюдаемых данных свойственна однородность, наличие од¬ ного источника (прйчины) этой случайности, то следует ожидать унимодальных или бимодальных распределений. Тогда и в множество типовых распределений следует включать унимодальные или бимодальные распределения, аналитически описываемые в замкнутом виде, причем име¬ ющие как можно меньшее число параметров при большом разнообразии формы кривой распределения (см. [43]), Вопрос о включении или невключении конкретного рас¬ пределения подобного типа в множество распределений, которые будут участвовать в программной или аппаратной автоматизации параметрических или смешанных методов оценивания, должен решаться исходя из условия полноты (в смысле принятого способа упорядочения) набора рас¬ пределений и степени пригодности данного распределения для решения задач той предметной области, где будут, ис¬ пользоваться разрабатываемые программные или аппарат¬ ное средства. Если же образованию экспериментальных данных свой; ственна неоднородность, являющаяся следствием физиче¬ ской сущности явлений, происходящих в исследуемом фи¬ зическом объекте, или сопутствующих эксперименту усло¬ вий (помехи, засорение выборки), то следует ожидать йо- лимодальных распределений. В этом случае априори (пе¬ рёд параметрическим оцениванием) или апостериори (по¬ сле непараметрических оценок при смешанном оценива¬ нии) следует в качестве исходных или аппроксимирующих распределений выбирать распределения типа смесей) ор¬ тогональных или неортогональных разложений, сплайн- распределений (склеек) и т. п. 204
Наконец, отметим еще один' вариант смешанного оце¬ нивания и выбора моделей. Он основан на совмещении не-' параметрического и параметрического методов оценивания для разных диапазонов изменения аргумекта х функций F(x), W{x). Для данного диапазона изменения, аргумен¬ та х выбирается тот метод, который дает лучшие показа¬ тели оценок. Например, если при больших х>0 функция опасности Ьх(х) распределения F(x). удовлетворяет ра¬ венству Lx(x)=—Диг(*)> гДе JXw(x) — диссипант плот¬ ности распределения W (ж), то хвост распределения можно отнести к экспоненциальному типу и тем самым оценивать только параметры подобного экспоненциального распре¬ деления [80]. Хвост симметричных функций распределения с конечной' дисперсией можно аппроксимировать нормаль¬ ной функцией распределения [98] либо можно оценивать распределения через характеристики выбросов за высокий (или низкий) уровень методом экстремальных значений Гумбеля [80]. В. заключение отметим работы, в которых рассматри¬ ваются различные реализации методов смешанного ’оце¬ нивания и аппроксимации оценок распределений. Методы м-; МП-, НК-оценивания и др., основанные на использо¬ вании типовых унимодальных- и .бимодальных распределе¬ ний (Пирсона, Джонсона и т. п.), рассматриваются в [18, 102, 109, 115, 144, 157], измерение параметров через Я- оценки — в [148]; квантильное оценивание, метод смесей— в [2, 62, 109, 122, 147], ортогональных разложений — в- [52, 135, 136, 14"4], ступенчатой аппроксимации — в [100], сплайн-аппроксимации, склейки —г в [109], экспоненци¬ альной аппроксимации — в [52, 136] и т. д. 6.11. ПОЯСНЕНИЯ И ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ 1. Все рассмотренные алгоритмы предполагают изме¬ рение F(x), W(x) в фиксированной точке х. Поскольку сплошные оценки могут быть получены либо динамическим изменением х, либо с помощью непрерывных кривых по решетчатым оценкам F'(x), W(x), в обоих случаях мы должны учитывать дополнительные составляющие .погреш¬ ностей согласно результатам § 3.1 й 3.3. В связи с этим уместно заметить, что обычно метод гистограмм (гисто¬ сплайн) применяют, проводя предварительное группиро¬ вание сразу всей выборки. Тем самым автоматически, по¬ лучается решетчатая оценка 1^(дс) с шагом измерения Ах. Если же группирование всей выборки как таковое не про¬ 205
водить, а осуществлять преобразование согласно (6.3) только для данного конкретного значени'я х, в котором из¬ меряется №(*), т. . е. осуществлять локальное группирова¬ ние, то оценка (6.3) полностью совпадает с Я-оценкой (6.15), (6.28) с прямоугольным ядром (в одномерном слу¬ чае № 3 в табл. 6.1). 2. При выборе типа ядра для Я-оценок и базиса JFmf*) для OP, НР-, СДФ-оценок необходимо руководствоваться не только (и пожалуй не столько) оптимальными свой¬ ствами этого ядра, базиса* сколько областью приложений оценок 1Р(*). Дело в том, что ядра и базисы^ оптимальные или близкие к оптимальным при оценивании 1^(ж), могут оказаться мало пригодными при непосредственном нахож¬ дении по №(х) других характеристик методом базовых характеристик для конструирования на основе, ^(х) оце¬ нок других характеристик: начальных и центральных мо¬ ментов, моды; вероятностных моментов, s-x производных от плотности, диссипантов, консервантов, кондисантов и т. д. Так, например, если ставится задача измерить толь¬ ко значения W (х) (а по цей с помощью смешанных мето¬ дов получать все другие' характеристики), то наиболее простой в реализации и близкой к оптимальной будет Я-оценка с прямоугольным ядром (см. конец предыдущего замечания). Однако это ядро будет' непригодным, если использовать непараметрическую оценку s-й производной Й7<*>(х) плотности W(x) в виде [66, 120, 126, 136] Ws) (х) = Мт ! - &*> f —J, (6.59) \hs+HT) I Л(Г) J Г 1 ' поскольку s-я производная ядра будет не приемлема для расчетов. В то же время при удачном выборе ядра, когда его производные существуют и удовлетворяют условиям вида (6.16) — (6.19), оценка (6.59) обладает свойствами, сходными со свойствами Я-оценок самой плотности. Если s может меняться в широких пределах, то в качестве ядра целесообразно взять гауссово ядро (№ 4 в табл. 6.1), кото¬ рое, кстати, удобно, при оценивании полигауссовых распре¬ делений, т. е. распределений, представленных в виде смеси гауссовых [117, 126, 140, 141]. Аналогично (6.59) строится непараметрическая оценка частной производной >*»■••• %)(д:)' как (si-f-S2+ ...•4-$л)-я Частная производная Я-оценки (6.28). 3. Рассмотренные выше оценки не всегда записаны в форме, наиболее удобной при практической реализации. Принятая запись не делает очевидным эквивалентность 206
родственных оЦенок. Рассмотрим этот вопрос подробней Прежде всего отметим, что ОР- и НР-оцёнив'ание по (6.57) удобно тем, что по выборке находятся только оценки Коэффициентов-Cft, а уже по ним, без обращения к выбор¬ ке, находятся значения 1^(дс) для любого требуемого зна¬ чения х. Наоборот, Я-оценки (6.15), (6.28) и СДФ-оценки (6.41,) имеют ядро в замкнутой аналитической форме и предполагают обращение к выборке при измерении 'W (х) в каждой точке х. Однако эти оценки формально легко сводятся друг к другу. Так, подставляя в выражении (6.57) вторую формулу в первую и производя суммирова¬ ние по (6.41), (6.42), преобразуем ОР- и HP-оценки к фор¬ ме, принятой для Я- и СДФ-оценок. Опять формально ничто не мешает при этом ввести в базис gk {х) некоторый неизмеряемый варьируемый параметр h(N). Если полу¬ ченные таким образом «обобщенные» ядра, вида (6.44) бу¬ дут обладать свойствами СДФ или свойствами ядер, на¬ пример свойствами (6.16) — (6.19), то такие ОР- и НР- оценки будут полностью совпадать с соответствующими СДФ- и Я-оценками. Наоборот, ядро для h \ h ) Я-оценок или СДФ, бс (*, у) для СДФ-оценок можно точно или приближенно разложить в ряд вида (6.42) при бес¬ конечном или конечном т или в аналогичный ему ряд, где {фь (*)} и {фй (у)} — разные системы функций, не обяза¬ тельно ортогональные, и тем самым представить подобные оценки в форме (6.57). Необходимые для подобных пре¬ образований формулы в случае ортогональных полиномов можно найти, например, в [12]. Заметим также, что ядра в оценках (6.15), (6.28) могут выбираться как первые чле¬ ны ортогональных базисов [140, 141]. В силу возможного знакопеременного характера функ¬ ций базиса ОР- и HP-оценки №(*) при конечном т могу.т иметь отрицательные значения, что противоречит свойст¬ вам W(x). Особенно часто это наблюдается при больших х. Для устранения данного эффекта (Гиббса) можно вве¬ сти дополнительное взвешивание оценок одним из следую¬ щих способов (ср.с [128, 129]): №(*) = ^W(y)f(x — y)dy, (6.60) —ОО ОО W (х) = — f Ф (и) 0 (и) e~’uxdu, (6.61) 2п J —ОО 207
#(*)= 2 Wiy-nnHn. n=—00 (6.62) Функции <p(*), Ф(«) можно выбирать так же, как ядра табл. 6i 1 или как корреляционные спектральные взвеши¬ вающие функции (окна) [44]. Если, положить, что Ф(ы) и в(н)~ связаны с <р (л:) и 1£(*) соответственно парой преобразований Фурье, то оценки (6.60), (6.61) совпадут. Если же положить, что Ф(ы) — четная вещественная^ финитная функция (см. табл. 6.1), равная нулю при |и|5*2яа, то при <р„=(2а)-^ф(л/2а) и уп=п12а оценка (6.62) совпадает с (6.60), (6.61) . В этом случае выбор оценки можно осуществить, исходя из про¬ стоты реализации. По этому показателю, как правило, предпочтительнее оценка (6.62). Замечательным свойством данных оценок является то, что они позволяют управлять значениями показателей ка¬ чества оценки #(*) варьированием <р(*), Ф(и) или <рп без повторного обращения к выборке. Достаточно, один раз найти оценки №{у) или 0 (ы), чтобы уже по ним получать разные оценки № (*)• Это может привести к существенному уменьшению вычислительных затрат при больших объемах выборки, если по какой-то причине необходимо получать оценки с разными, весами (ядрами). Для уяснения этЬго рассмотрим такой пример. Пусть для получения Я-оценки с требуемым качеством при одном фиксированном ядре достаточно иметь П\ точек дискретной оценки №(*), опре¬ деляемой по выборке объема N. По условиям эксперимен¬ та желательно иметъ s Я-оценок 1^(jc) с разными ядрами. Тогда при непосредственном определении этих оценок по выборке потребуется astiiN операций, эквивалентных сум¬ мированию, где a=ai+ct2+ ... +а«, Of, (=1, s, — некото¬ рый коэффициент, зависящий от вида ядра. В то' жё вре¬ мя, если Использовать оценки вида (6162) при <7 отличных от нуля множителях <р„, то потребуется п2 точек оценки №(х) с равномерным весом.. Тогда на все s оценок 1^(дс) с разными ядрами будет затрачено 0n2N-\-yqstii операций; где 0, у некоторые константы. Очевидно, что второй вариант будет предпочтительнее первого, если $n2N-\- -\-yqsnl<atiiN, что при больших N будет иметь место при, fin2<ati\. Если ряка/s (вероятнее всего p<a/s) и п2^пи то выигрыш будет примерно в s раз. К этому же следует добавить, что оценки №(лс) и 0 (ы) могут вычисляться про- 208
стейшими способами ЭХ-оцёни&аййй с ПрйМоугОльНЫМ бе¬ сом. / Математические ожидания М{№(л:)} оценок (6.60) — (6.62) связаны с М{Т^(х)} и М{0(ы)} теми же соотноше¬ ниями (6.60)—(6.62). Сопоставляя подобное выражение для (6.60) с математическим ожиданием' Я-оценки (6.20), видим их полное внешнее сходство. Это наталкивает на мысль построения простых квази-Я-оценок (КЯ^оценок) с различными ядрами следующим образом. Одним из опи- сашных выше способов находим оценку № (х) с малым сме¬ щением. Затем по. (6.62) вычисляем значения КЯ:Оценок, выбирая ф„= (2а) -*k (nj2a). При этом значение а выбира¬ ется исходя из следующего.-Если К (и) — финитная функ¬ ция, то-а выбирается из условия К (и) =0 при \и\^2па. Если же К (и) не является финитной.функцией, то а можно выбрать приближенно из условия, что доля площади функ¬ ции K{uh) вне интервала [—2яс, 2зта] будет составлять не более 0,01—0,1 общей площади, равной 2я&(0). Для ядер № 1, 2, 4 из табл. 6.1 это будет приводить к сумми¬ рованию по (6.62) небольшого числа слагаемых вблизи п=0 независимо от объёма выборки. Объем выбор,ки влияет только на шаг измерения Ау=(2а)~1. Экономными в Этом отношении будут функции К(и), совпадающие с некоторыми финитными временными корреляционными спектральными окнами типа Хэмминга, Хэннинга, Тьюки, Блэкмана — Хэрриса и т. п. [44, 130], когда суммирова¬ ние распространяется на 3—5 слагаемых. Дисперсии оценок (6.60), (6.62) равны D{r(x)} = jj*^(y, z) f (x-y)?(x-z)dydz,. (6.63)_ —СО ^ ' D {W (*)} = 2 xS ~Jh' К ~Уп) fk?n’ ^6’64^ ’ —00 00 где Rty(y; г).— корреляционный момент (функция) для Ъ(у). Щг). 4. Для оценивания распределений, особенно при боль.- шом объеме выборки, можно успешно использовать дина¬ мические алгоритмы с детерминированным или случайным ’изменением значений аргумента х в процессе усреднения. Если,-например, динамическую оценку плотности^ W (*) по¬ строить согласно третьему примеру из § 3.3, то, сопостав- 14—192 209
Ляй (3.67), (3.6$) с'Матёматичёскйм о&йДанйём й Диспер¬ сией (6.63) оценки (6.60), убеждаемся в их тождественно¬ сти при условии, что плотность распределения Ч' равна ф(ф). При этом аналогично тому, как это сделано для Я-оценок, можно ввести параметр h в весовую функцию динамического усреднителя и отыскивать оптимальные значения h и весовых функций. 5. Для дискретных алгоритмов зачастую целесообраз¬ но использовать рекуррентные процедуры усреднения (см. § 2.4) [75]. В ряде случаев целесообразным может быть использование различных адаптивных алгоритмов. Например, для Я-. и КЯ-оценок можно мейять h{N) не только как функцию N, но и как функцию х, т. е. вместо параметра размытости ввести параметр h{Ny, х), учитывающий текущую форму кривой [см. (6.33)], а для ОР-оценок менять т не только в зависимости от N, но и от х. В более общем случае в зависимости от формы и значений W (х) следует менять также форму ядра или вид базисных функций. 6. Формулы, приведенные для случая независимых вы¬ борок, можно обобщить на случай зависимых выборок и непрерывных усреднений, воспользовавшись результатами § 3.2. В этом случае оптимальные значения hma(N) для Я-оценок необходимо определять, минимизируя соответст¬ вующие показатели, например Д4, когда дисперсия оценок находится с учетом корреляции элементов выборки. 7. В тех случаях, когда многомерное распределение в целом оценить затруднительно, можно воспользоваться из¬ вестными приемами снижения размерности случайного вектора, например выделить главные компоненты, осуще¬ ствить раздельное оценивание сильно или слабо зависи¬ мых компонент и т. п. либо упростить описание случайного вектора или функции, используя (см., «апример [92]). Глава седьмая Непараметрическое оценивание моментных характеристик 7.1. ОЦЕНИВАНИЕ ОДНОМЕРНЫХ ЧИСЛОВЫХ ХАРАКТЕРИСТИК Метод эмпирических характеристик (ЭХ-оценивание). Рассмотрим прежде всего оценивание начальных и цент¬ ральных моментов k-ro порядка т* и р*. В последнем слу¬ 210
чае будем рассматривать две оценки: р*; когда математй- ческое ожидание т\ известно, и ц*, когда вместо т\ ис- пользуется ЭХ-оценка tfi\y найденная по той же выборке. Как и ранее, будем полагать, что рассматриваемые про¬ цессы и последовательности стационарны 1; а образование выборки х и усреднение по ней осуществляются по одно¬ му из способов, указанных в § 1.5 (см. замечание 1 к §3.2). ^ ^ ЧУ ЭХ-оцейки тк, ц* и |lk находятся по формулам тк=\Мт{кк}, (7.1) £к — Лт{{х — тх)к}, н*== ЛТ{(х — т,)к). (7.2) Оценки тк, являются несмещенными, |х*— асимптотически несмещенными. Оказывается, что для k>N при неизвест¬ ном т\ вообще нельзя получить дискретную несмещенную оценку цк, а для k^2 в случае Зависимой выборки и для k^4' в общем случае нельзя подобрать функцию f (Г), умножением на которую оценку р* можно преобразовать в несмещенную (см. примеры в [77, 124]). Для независимой дискретной выборки несмещенные оценки Н-2, Ре И могут быть получены по оценкам ц2, ц8, р4 по формулам [71, 77] р2 = л£2 (N — 1)-1,|Г3 = з [(N - 1) (N - 2)]-\ =N [(№ -2N+ 3fp4 - 3 (2N- 3) (р2)2] X X [(N — 1) (N — 2)(N — 3)]“\ (7.3) т. е. при 100 k = 2, 3, 4. Корреляционные моменты оценок mk, тп, и их дис¬ персии (при k=n) могут быть найдены по формулам § 3.2. 1 Еще раз обратим внимание читателя на то, что траекторные. ЭХ-оценки могут быть использованы как состоятельные оценки ансамб¬ левых характеристик стационарных случайных функций X (t), лишь если X(t) являются эргодическими по отношению к измеряемым характери¬ стикам. Это имеет место, когда средний квадрат уклонения траекторной ЭХ-оценки, найденной по траектории длиной Т, стремится к нулю при неограниченном увеличении Т (или N при Af=const). 14* 211
При этом для оценок mk, тп корреляционная функция Re (и) =mh,n («)—mhmn,; (7.4) а для оценок Яв{и)=Цк,п{и)— (7.5) -где mk,ti{u) и ца,п(ы)—начальные и центральные моменты порядка k-\-n отсчетов X(t) и Х(И-ц). Отсюда, кстати, следует, что для нормальных векторов, процессов и после¬ довательностей при \k—п \ =1, 3, 5,...,Ra(u)=0, т. е. оценки и |а„ некоррелированы всегда, а не только пр-и независимых дискретных выборках. Согласно результатам § 3.2 в случае конечных т*, ц*- и ntk,k{u), Цк,к(и), однородности выборки, СК-эргодично- чсти к стационарности X(t) ЭХ-оценки mk, V-k являются асимптотически эффективными в классе всех несмещенных линейных оценок Шк, ц* вида (3.14)(3.15), т. е. вдоль всех возможных a(rf), аи Для некоррелированных выборок эта эффективность имеет место при любом объеме выбор- кйГ Для некоррелированных выборок процесса G(t) спра¬ ведлива формула (3.41), причем тк,п{0)=тк+п, (0) = -V-k+n [65, 71, 77, 107]. Корреляционные моменты и дис¬ персии оценок |а* в общем виде имеют сложные выраже-., ния (см. примеры в [77]). 1 В случае некоррелированных дискретных выборок G(t) корреляционный момент cor{j*fe, (*„} может быть асимпто¬ тически с точностью до членов порядка 1 /N2 найден по (3.41) при".(см. [65, 71, 107, 124]-) Ra (0) « pft+n—|д,*|д,„+ [ Цй—1 pTi—1 1 Pji+I HJXft+lpn—u (7.6) Из (7.6) следует, что для всех четных k в нормальном случае Rg (0) для оценок^ и при больших N будут практически совпадать. Для сравнения приведем точное и приближенное, по¬ лученное по (7.6), выражения дисперсии оценки дисперсии jt2 [71, 77, 107, 116]: D /а 1 __ Н-4 — fa2 2(^4 — 2р2а) — Зр.аа =jf[^(1-t)+2](1^t)’ <77> 212
D{it8}^D{?2} = (|i4-^)7^=(Y2 + 2) (7.8) где у2 — коэффициент эксцесса X, X(t). Заметим, что уже при небольших N дискретные оцен- ки-fii\ и р2, найденные по некоррелированной выборке, при конечных моментах р4, р6, ре имеют распределение, близ¬ кое к нормальному. Об этом, в частности, свидетельствуют коэффициенты асимметрии уь и эксцесса у2 этих оценок, равные для р2 где уь 72 — коэффициенты асимметрии и эксцесса X, X(t); 7з=«б/«23, —кумулянт порядка k X, X (t). Законы распределения дискретных и непрерывных оце¬ нок tnk, pfe> рассматриваются в [21, 22, 55, 65, 71, 124] и др. Сделаем некоторые замечания по рассмотренным ЭХ- оценкам для случая дискретных независимых выборок. Прежде всего отметим, что при 3 ЭХ-оценка Ш\ явля¬ ется ^допустимой НМД-оценкой т\ только для нормально¬ го закона распределения [58]. Отсюда следует, чтр при известном -распределении X оценки- пгк, цк могут быть НМД-оценками, т. е. эффективными оценками пц и р* в том и только в том случае; когда Xh, Xh(t) имеюТ'нормаль- ное распределение, что для четных k никогда, не имеет места. В’частности, эффективнее ЭХ-оценок тк, р* могут быть параметрические оценки [ср.. (7.5), (7.6) для • нор¬ мального распределения с (4.18)]. МД-оценкой (смещен¬ ной) дисперсии нормального распределения является распределений при любых N. Обратим внимание на то, что не всегда fhi сходится к т. Необходимые и достаточные условия, как известно, уста¬ навливаются теоремами закона больших чисел. Доста- Y.(™.) = YziVN, b(mi) = blN> Y,t) = lY.+4(3Y2+Y,2+2)] [(ь+2)3/2 ^]-‘+ (7.9) Y*(?*) = 0(1 IN). - ) оценка Pi[W(Af-f-l)]~‘ [58]. Поскольку сог{/д,, n2} = p,3(lV—l)N~2 [65, 107], оценки thi и p2 будут некоррелированы для всех симметричных 213
точным условием сходимости по вероятности оценок tfik к ntk и и* к р.* при зависимой выборке является сходимость к нулю их дисперсий при неограниченном объеме выборки. Понятно, что эта сходимость не имеет смысла, если мЪмен- ты mk, рл не существуют. Так, например, для распределе¬ ния Коши К(а, А) распределение оценки fh\, как нетрудно убедиться, не зависит от N и совпадает с К. (а, А), а для величины У=Х~2 в случае, когда X — нормальная случай¬ ная величина N(О, А), распределение tii\ становится все более рассеянным при возрастании N. Знание Ra (0) для оценок mk, р*, р* позволяет найти дисперсии оценок по точным или приближенным форму¬ лам § 3.2. При этом возникает вопрос, насколько то и т,0 отличаются от и itx исходной функции X (t). Иными словами, насколько сильно длд каждого k разнятся между ^ ^ ' собой дисперсии оценок mk, р*. р*. найденные по дис¬ кретной некоррелированной выборке, при Дt= tox, At = teX, &t = %oв, At = xto или при других At, а также по_сравне нию с непрерывными оценками. Можно было бы ожидать, что с увеличением k будет происходить все большая декор¬ реляция G(t) иГ следовательно, как «показано» в [88] ма¬ шинным экспериментом на примере гауссовых процессов, во-первых, с увеличением k правильный выбор At при раз¬ ных k существенно снизит дисперсии оценок, во-вторых, для непрерывных оценок соотношение между дисперсиями оценок при разных k будет лучше (с увеличением k дис¬ персии будут расти не так быстро), чем для дискретных оценок, найденных по некоррелированной выборке. Одна¬ ко, к сожалению, оснований для такого оптимизма не так уж много. Прежде всего можно указать, «плохие» стацио¬ нарные случайные процессы, например процесс, реализа¬ ции которого представляют собой ступенчатые фУнкИии (см. примеры в [40, 42, J7, 104]) с двумерным распреде¬ лением: (7.10) при 0^р(т)^1, W(x 1, х2; т)=р(т) №(л:1)6(*1—х2) + + [1-*(т)]Г(х,).Г(х2); "(7.10) процессы У(0=а1 {-^(0). W а —константа, a X(t) — про¬ извольный знакопеременный случайный процесс, и Y{t) = ==asignX(f) (при нечетных k, п), для которых для оце¬ нок ihk и _рй Rg_(u) =Rg{0)px(u). Для этих процессов при любых ktoG = 4x и '40 = "Чх. т. е. ожидаемое улучше- 214
215
ние дисперсий за счет ожидаемой декорреляций "процесса из-за нелинейного преобразования не будет -иметь места. _ С другой стороны, как видно из табл. .7.1'"(см. также далее' Re (и; 0) в табл. 7.3, 7.4 для р*)» не происходит су¬ щественной декорреляции и для нормальных процессов, что видно как^из выражений для ро(«), так и из соотно¬ шений между то о при разных-fe. В связи с табл. 7.1 любо¬ пытно отметить, что дискретные’ «некоррелированные» оценки p/ft при нечетных k имеют меньшие дисперсии, чем t Рб (напомним, что для нормальных процессов при нечет¬ ных k p.ft=0). Теперь рассмотрим ЭХ-оценки других характеристик. Прежде всего рассмотрим "оценки коэффициентов асим¬ метрии уь &i=vi2 и эксцесса уг, £2=Уг+З. Согласно опре¬ делениям ЭХ-оценки данных характеристик определяются как. БХ-оценки через ЭХ-оценки базовых характеристик Ра, и*: * * ^ <7 ‘‘) (Рг) (fts)? —з. (7-12) ы2 где >|< означает V» Л или Смещение и дисперсии оце¬ нок могут быть приближенно найдены по (2.35), (2.36). Для независимых дискретных выборок точные й прибли¬ женные выражения математических ожиданий и Дисперсий оценок (7.11), (7.12) даны, в [104], откуда следует, что дисперсии оценок имеют порядок l/i/V. В частности, для нормальных величин и функций М{у,} = 0, М{у2} = щ*-Ь/(N+1), D{y,} == 6(iA7 -2)/[(N-f 1) (N + 3)]~6/JV, D{y2}—'24/A^. B, [18, 156] исследуются законы распределе¬ ния оценок yi, уг. В [156] используется аппроксимация совместного распределения yi и Ьъ двумерным; состоящим из Su-Джонсона и гамма-распределений. Теперь рассмотрим ЭХ-оценки моды х t и квантилей Хр. Они находятся по ЭХ-оценкам Р(х), -w{x) согласно определениям табл. 1.1, а ^именно:X|={x:И^(х)=тах}, xp = {x:^(jc) = />}. Поскольку подобные оценки есть част¬ ный случай более общих БХ-оценок, они будут рассмотре¬ 216
ны с общих позиций ниже. Аналогично по ЭХ-оцёнкам Р{х), №(х) можно-найти ЭХ-оценки других числовых ха¬ рактеристику введенных в табл. 1.1. Метод базовых характеристик (БХ-оценивайие). Дан-, ный метод является по сути дела обобщением предыду¬ щего. БХ-оценки всех числовых характеристик находятся согласно их определению пр. формулам табл. 1.1, когда вместо F(x) и W{x) используются любые оценки их F(x) и 1Г(х). В последнее время очень интенсивно развивается теория БХ-оценок различных числовых характеристик на основе Я-оценок И7(х) вида (6.15) [28, 120, 126, 136J. По¬ казано, например,, что если Я-оценка Т^(х) равномерно сходится k W(x), т. е. выполняется условие (6.19), то БХ-. ‘оценка Xf, найденная по максимуму ty(x), является со¬ стоятельной; [126, 136]. Определим Я-оценку тк момента тк как оценку, най¬ денную интегрированием пох произведениям хк№(х), где ХР(х)'—непрерывная или дискретная Я-оценка (л:), на¬ пример (6.15). Тогда подобная оценка тк будет эквива¬ лентна ЭХ-оценке Ж г(а*(х)}, 'Где йк(х)—момент А-го порядка ядра h~lk [ (х—х) /А]. В частности, для симмет¬ ричных ядер , ml—= mt-\-h, mt — mi-f-3mji*-f-h3 и т. д., где тк=Жт {xk} — ЭХ-оценка mk. В [28] рассматриваются БХ-оценки tfik и р*, получен¬ ные на основе комбинированных, оценок t^(x), и показа¬ но, что они могут быть эффективнее ЭХ-оценок 'при .малых объемах выборки. Теперь рассмотрим БХ-оценки хр квантилей хр вида Xp={x:F(x)=p}, где Р{х)—любая несмещенная состоя¬ тельная оценка F{x).. Представдяя- хр в виде хр = F<_> [р — F (хр) + F (хр)] и разлагая F^-Цг) в ряд Тейлора в точке г=д с учетом, ра¬ венства dF^-i(р)/dp— [dF(xp)/dip]~l=[W(xp)]-1, убежда- емся, что при этих условиях асимптотически хр есть несме¬ щенная оценка хр с корреляцией сог{хр, xj = cor (F (хР), F/xq)} [И7 (хр) W (x„)]_1, (7.13)' где xp=F<->(p). й Из (7.13) асимптотически имеем Vfip} **D(F (хрЩГ (Хр)]-2. Г(7.14) ' 217
что для независимой дискретной выборки переходит в D Я} ^jj-F (хр) [1-F (хД(Г (х9)]-2 = [W (хр))~\ (7.15, Из (7.13), (7.14) нетрудно получить асимптотическое вы¬ ражение дисперсии характеристик (Xpix*), представляю¬ щих интерес при непараметрическом оценивании парамет¬ ров сдвига и масштаба, DЯ ± хД = DЯ) + D Я} ± 2согЯ- х,}. <7.16) которое обобщает известные результаты [65], полученные для независимых выборок. Помимо рассмотренных числовых характеристик БХ- оценивание применяется для измерения кумулянтов %к [65]. Подобные оценки хк находятся, как правило, через непараметрические оценки моментов тк, ц* по формулам связи кумулянтов щ с моментами тк, ц*, например БХ- оценка х3 = 1*3, к4 = |а4 — 3|х2.2 Для независимых дискрет¬ ных выборок имеем [65] D Я} = [И>8 — 12(х#6 — 8ц3|1.5 — jt4s -f- 48ii.4|x22 + + 64(t>2-36^]. (7.17) Следует обратить внимание на то, что при больших k (да- же при 3) подобное нахождение оценок %к или точных значений %к по заданным параметрам 0, как и нахождение оценок или точных значений \ik через оценки- или точные значения^*., может привести к существенным аппаратур¬ ным (вычислительным) погрешностям, вызванным ограни¬ чением разрядности представления промежуточного ре¬ зультата. Зачастую отдельные слагаемые имеют большие, но близкие друг к другу значения и грубое округление при нахождении каждого из них может привести к значи¬ тельному искажению искомого результата. Метод 17-статистик (17-оценивание)., Интерес к Дан¬ ным оценкам обусловлен тем, что, как указано в § 2.3, 17- оценки, если они существуют, являются несмещенными МР-оценками (в частности, МД-, НАН-оценками) соответ¬ ствующих числовых характеристик (функционалов рас- предедений) вдоль всех абсолютно непрерывных или дис¬ кретных распределений ■ [58, 120, 124]. Способы построе¬ ния Ll-оценок для независимых и зависимых' выборок 218"
рассмотрены в [120]. Там же, рассматриваются квази* [/-статистики, основанные на замене плотностей распреде¬ ления* да непараметрическими , оценками, в частности, Я-оценками. Для т\ и р2 (/-оценки тх, р2 в случае неза- /V _____ висимых выборок равны Ш\=тх=х, \i2=N(N—l)-1P2=iZ>, т. е. (/-оценки совпадают с несмещенными ^ ЭХ-оценками тх и |х2.[120, 124]. Заметим, что минимум дисперсий (/-статистики понимается здесь вдоль всех распределений, вид и параметры которых считаются неизвестными. Имен¬ но в этом смысле надо понимать, что тх=х и p2=iZ) яв¬ ляются МД-оценками среднего и дисперсии распределе¬ ния. Если же распределение известно, то несмещенными МД-оценками тх и р2 являются параметрические оценки, например СЭ-оценкилибо оценки Рао — Блэкуэлла — Кол¬ могорова. Так, несмещенной оценкой тх в случае экспоненциаль¬ ного распределения Э(а, X) при известном "К является оценка x(i)+X(JV—1 )/N, дисперсия которой равна №N~2 в отличие от Щх} =Х2АН. Однако подобная оценка непри¬ менима, если распределение не известно, и будет весьма плохой, если распределение будет отличаться от Э(а, Я) с фиксированным X, равным известному значению. Метод порядковых статистик (ПС-оценивайие). Чаще всего данный метод используется для оценивания кванти¬ лей хр по дискретной выборке [65, 71, 107, 124], иногда для оценок среднего и дисперсий. В качестве ПС-оценки Хр квантиля хр используется значениехр= *(Е[ед+1)где £■[«:] —целая часть числа г, если Np не есть целое число, и любое значение из замкнутого интервала [%гр>, *(jv>h)]> например 0,5 [xnp+xXnp+i)) , если Np — целое число. Для независимой выборки подобная оценка хр является асимп¬ тотически несмещенной, нормальной, с дисперсией (7.15). ^Прочие оценки. 1) В связи с бурным развитием и внед¬ рением цифровой вычислительной техники широкое рас¬ пространение получили ЭХ-оценки тк и рк, основанные на группировании экспериментальных данных. Известно, что из равномерных квантизаторов наиболее подходящими для группирования значений Хпри оценивании тк, р* являются квантизаторы I и II типов с выходными характеристика¬ ми, изображенными на рис. ТЛ, где cv{x\q), е(х|^) —*■ вы¬ ходное значение и шум e(x)=ct»(x:)—х квантизатора, q — шаг квантования. Если в ЭХ-оценках (7.1), (7.2) вместо хк и (х—trt\)k 219
Рнс. 7.1. Выходные характеристики квантизаторов I и II типов: CjM-cot*|<7; —0: Сп(д:)=со(л:|?; О: ejW-efcjfii —1); eXI<Jir)—е(дс]<7; 1) использовать [cv{x\q))k или [су{(*—то полу¬ ченные таким образом оценки будут иметь смещение, .ко¬ торое нетрудно оценить. Пусть Y=X для тк или Y=X—4tti\ для \хк. Поскольку М{^г{[со(У)]*}} = 2 C\m{Ys[t(Y))k-s}, (7.18) / 5=0 смещение легко оценить,-найдя выражение для_ М{У5Ег}, где Е=е(У) при любых k, s. Подобные моменты можно найти, представляя функцию [е (у) ]г для каждого г рядом Фурье. Выпишем первые подобные моменты. Для этого введем следующие обозначения: v=—1 для квантизатора I, v=—(— 1 для квантизатора Н: Нгю (у) = [d* Re 0у(м) /du°] ц=0 при s+lr четном, Яг<*> (у) = [ds Im ©у (и) /dus] u=v при s+r нечетном; z=2n/q; t——1 Для s=0, 1, 4, 5, 8, 9, ...,£=+1 для s=2, 3, 6, 7, 10, 11,...; |=-fl для s= =0, 3, 4, 7, 8,.;-., £=—1 для s=l, 2, 5, 6, 9, 10,..., где Re©y(«) и Im ©у (н)—действительная и мнимая части характеристической функции ©г (и) . 220
В принятых обозначениях имеем / ОО М,{ГЕ} = — Y. (/гг), (7.19) л ^ п П=1 оо М{ГЕг} = -£-М{П+ 2 ^ (raz)’ (7-20) /1=1 «{>"*} = -f - 2 -g [j - +т] ИР («),, (7.2!) /1=1 М(1'-Е<}=^М{П H-g- S -f [‘ - -лт]<te) - *=ь и т. д. (7.22) Отсюда легко получаются соответствующие выводы. Во-первых, полагая <7-Ц), т. е. ' 2^0, получаем известные приближенные поправки Шеппарда для . моментов [66, 71, 85, 86]. Во-вторых, наглядно видно, что в случае симмет¬ ричных распределений величины У, т. е.. при действитель¬ ных 0у(«), для всех моментов М{У*ЕГ} при нечетных (s+r) суммы 2 равны нулю при любых конечных значениях q. В-третьих, понятно почему для. L, J, U-образных распре¬ делений,.для ^которых скорость убывания ©.(«) с увеличе¬ нием \й\ мала, поправки Шеппарда применимы лишь тогда, когда на Интерквартильном интервале укладывает: ся несколько десятков значений q, т. ё. когда сами по¬ правки становятся практически бесполезными. Если же применять в этих случаях поправки Шеппарда при боль¬ ших q, т. е. когда на интервале [xi/4,. Х3/4] укладывается несколько значений q, то это может привести к еще боль-_ шему расхождению моментов, найденных по негруппиро- ванной и группированной выборкам [66]. Наконец, в тех случаях, когДа.статистические погрешности соизмеримые ошибками от группирования или существенно меньше их, по (7.18) — (7.22) можно для любых распределений ука¬ зать такие значения q, при которых ошибки от группиро¬ вания не будут превышать заданной величины. Например, без каких-либо ограничений на распределение У имеем |М{Е) | ^0,5<7, М{Е2}^<72/4 и т. д. Если же положить, что при |н|-^оЪ|0(м) |^|и|-!/2, то при <7~Ц) имеем |М{Е}|<| <0,ZZqiq, М{Е2} ^(<7712)11+1/^/1,53) и т. д. 221
Помимо уменьшения шага q смещение оценок /м*, р.*, вызванное группированием Y, можно уменьшить следую¬ щими способами. Первый способ. В произведении Yk=Y-Y• -Y хотя бы один из сомножителей подвергнуть более точному квантованию (т. е. группировать при меньшем q) и к тому же использовать для разных сомножителей квантизаторы различных типов [38, 53, 73]. Второй способ. Использовать изменение случайным образом значений заданного числа уровней квантования, например независимо между собой, равномерно распреде- ленно в диапазоне значений элементов выборки или в пре¬ делах (—<7/2, <7/2). ' ' Третий способ. Добавлять к исходным данным х перед группированием случайные интерполирующие' сигна¬ лы, изменяющиеся в диапазоне (—q/2, q/2) при малом q или в диапазоне значений элементов выборки при боль¬ ших q, т. е. при малом числе уровней квантования на этом диапазоне [32, 53, 73, 85, 86, 125]. Последний случай ис¬ пользуется, например1, когда применяется квантизатор II типа с двумя уровнями, т. е. производится только опера¬ ция выделения знака sign х. Подобный метод связан с увеличением статистических погрешностей, которые мож¬ но уменьшить специальными приемами [125].. Наконец, заметим, что в некоторых задачах можно использовать именно моменты группированных данных, т. е. не рассмат¬ ривать погрешности от группирования. Что касается дисперсии оценок, найденных по группи¬ рованным данным, то уже при (х3/4—xi/4)/<7« (10-^20) группирование практически не сказывается на дисперсии оценок. 2) С точки зрения удобства в практической реализации определенный интерес имеет алгоритм оценивания диспер¬ сии, основанный на ЭХ-оценке собственной структурой функции I рода Di(f, т) при т, обеспечивающем некорре¬ лированность X(t) и Х(/+т): Ь,=-1-^г{[л(0-Х(( + .)1-(, (723J <•=1 * Оценка D2 соответствует некоррелированной, дискрет¬ ной выборке. Достоинством таких оценок является отсут¬ ствие надобности измерять среднее значение выборки. Это 222
позволяет находить оценку в темпе с поступлением дан¬ ных, в том числе рекуррентными процедурами. В стацио¬ нарном случае подобные оценки при некоррелированности X (t), X(^-j-it) и X,-,' X,-+i являются несмещенными, с дис¬ персиями, асимптотически близкими к дисперсиям оценок Х-Ч V * ц‘2, Ц2- В частности, для оценки D2 имеем {х(; хт незави- симы)- D ID 1 = ^ (ТгЧ~ 3)|^aa. /j 24) ' 2(N — I')2 N ’ V ’ ’ т. е. дисперсия оценки D2* будет асимптотически^в (у2+ +3)/(у2+2) раз больше дисперсии ЭХ-оценок р,2, р-2- При¬ мерно такое же соотношение справедливо и для дисперсий непрерывных оценок (см. § 7.7). 3) Для оценивания числовых характеристик целесооб¬ разно использовать смешанные методы. .При этом оценки мод и квантилей часто выгодно находить методом > регрес¬ сионного оценивания, методами стохастической аппрокси¬ мации. 4) Как и для других' характеристик, для оценивания числовых характеристик часто удобнее использовать ре¬ куррентные процедуры. В частности, ЭХ-оценки = {itik)N и )ik= (рл) лг- можно представить, например, в ви¬ де (см. также [106]) (Щ)ы= (W—1) («*)„_!! = (w.ft)Af_1 + — (mk)s_t], (7.25) = т[23- т-п^‘ (Х"~(”')»)‘"+ /1=2 +(-1)'(Л1-1)-‘(»гя-(Й,)„)*], И»2, (7.26) 1)Ы„_,}. (7.2ва) При переменном N нахождение оценки (т^ по (7:25) предшествует на каждом шаге нахождению оценки (7.26), (7.26а). При больших k особенно целесообразно использовать (7.26) в тех .случаях, когда при больших переменных N одновременно необходимо оценивать р2, р3, • •., ць, а раз¬ рядность операндов обеспечивает получение требуемого 223
качества результатов с точки зрения вычислительных (ап¬ паратурных) погрешностей. Вторым, худшим с точки зре¬ ния требований к разряднрсти операндов, является вари¬ ант, когда (iik) и находится согласно формулам связи р.* с тп, n=\,k, по рекуррентным оценкам (7.25) начальных моментов n=\,k. Помимо дискретных рекуррентных процедур при оце¬ нивании числовых характеристик успешно могут исполь¬ зоваться непрерывные адаптивные итерационные алгорит¬ мы, о которых упоминалось в § 3.4. Например, оценку квантиля хР стационарного процесса X(t) можно найти в виде установившегося (стационарного) решения уравне¬ ния dxp (t) /dt= a (p—JCt{l{X (t)^xP (()}}], (7.27) когда Mt реализуется согласно (3.14) при соответствую¬ щем a (t), например (3.43). Уравнение (7.27) может быть решено аппаратурно с помощью соответствующей следя¬ щей системы, предусматривающей-варьирование xp(t). 5) Обратим внимание читателя на алгоритмы оценива¬ ния мод по методу ^-ближайших соседей [136]. Другие методы оценивания моды см. в [15]. 6) ‘Обратим также внимание на смещенное оценивание [7, 22, 24]. 7.2. ОЦЕНИВАНИЕ СМЕШАННЫХ МОМЕНТОВ ПРОИЗВОЛЬНЫХ ПОРЯДКОВ Для нахождения оценок смешанных моментов mkt k ..., kn, k k и кумулянтов %k k случайных век- 1, It f „ ^— If 2t ► торов, скалярных, и векторных процессов применимы все методы, описанные в § 7.1. Поэтому, не останавливаясь на них подробно, рассмотрим лишь для сопоставления ЭХ- оценки моментов mktn, ps.n величин X, Y или функций Х(0,У(0- ' , . По аналогии с одномерным' случаем определим ЭХ- оценки mk,n, Рй.п в виде Щ. п = {*У}^ (7.28) »•= {х —.)* (У — mo. .Г/. (7-29) ^ {(•* — ти ,)* (</ — ifl’ (7-30) 224
ГДе, Как и ранеё; убрёДнеНКе сбуЩес'Гвляе'гбя ho Jc{, у,, t** — 1, N. если X, У —случайные величины, или по д:(/), г/(<-}-*), если X-X(t).Y=zY(t-\--t); тий — тх. тв.л^=ту. В этом случае тк,п = пк.„ (t). {**, „ = ц*, „ (*), Оценки тк. „, !«.*,„ являются несмещенными, с корреляциями сог{тк.п, m0.s}, сог {цк „, fy'S}, определяемыми формулами §'3.2 со сходными выражениями для Ro(u). Например, пусть'!**, „ = = М {[£(?)]*.[£(* + *;]"}. Тогда для сот{£*,.„К), *?,,,(<,)} функция Ro (и) определяется выражением Re (и-, хи X2)=Цм,л,5(«, ть т2+ы) — ^ —ЦЛ,я(Т1УЦ(;,5(Т2), ("У-31) I»*.,v ^+H=M{>*(o^(/+«)V"(/+ + х i) (* + + «)}• -32) 9* Отсюда, кстати, следует, что в гауссовом случае при не¬ четных имеем Rg(u\ т.ь тг)=0, т. е, оценки моментов ц*,п, при таких k, п, q, s будут некоррёли- рованы при любых объемах , выборки Т, N. Функция - о о Ro (и) для т#,п(х) аналогична (7.31) с заменой X, У на X, У. Для моментов тк,п, р*,л случайных величин Л, У необходимо положить, Т1=т2=0. Из (7.31) имеем для дис¬ персии оценок [i*,n .. Ro (0; т) =Ц2*,2я (т) - [Ц*,4т) ]2. (7.33) Для сравнения приведем асимптотическое выражение Ro(0; т) для корреляции сог {р.*, „, j*,,s} некоррелирован¬ ных дискретных оценок в обозначениях |х«,п (т) =|л*-,п (ср. с (10.24). в [66]): Ш k(** +q, n+s V-h. nPq, ^ [ kq&a, Д*—i, лй*— i, s~}“ , ~t“ «^0’ n—iH*^, s—i , iH*A—l, nMvj, *—1 i + tV'k; it—1,> 4V,k+1, nPq—I, s , n+jfy. S—l —\kH-x. nV-я+и s — Wk, n- .fy, *+..+ 0 (Г-’)- (7 34) Отсюда легко получить два очевидных следствия. Первое. Полагая n=rS=0, из (7.34) получаем' (7.6). Второе. В гауссовом случае при четных k—q, n=s (7.34) асимптотически совпадает с (7.33). 15—192, 225
Из других вариантов оценивания моментов к _ 1^1>л к определенный интерес представляют мо¬ дификации ЭХ-оценок, связанные с применением знаковых (полярных) и релейных алгоритмов с использованием вспомогательных (интерполирующих [20]) сигналов [86]. Достоинством подобных оценок является упрощение вы¬ числительных процедур, недостатком — увеличение диспер¬ сий оценок по сравнению с традиционными ЭХ-оценками. В [20, 86, 125] описаны некоторые приемы, с помощью которых Ложно существенно уменьшить прирост диспер¬ сий оценок, не выходя из класса подобных оцёнок. Умень¬ шение . дисперсий оценок за счет, быть может, некоторой потери достоинств знаковых алгоритмов можно обеспечить также, если заменить грубое знаковое (двухуровневое) квантование квантованием на 4—8 уровней с использова¬ нием интерполирующих сигналов, равномерно распреде¬ ленных в пределах (—'<7/2, <7/2), где q—шаг квантования. 7.3. ОЦЕНИВАНИЕ НЕНОРМИРОВАННЫХ КОРРЕЛЯЦИОННЫХ Ф.УНКЦИЙ Вводные замечания. В связи с широким использовани¬ ем корреляционных характеристик рассмотрим их оцени¬ вание в отдельном параграфе. При этом учтем следующее. 1. Для упрощения рассмотрим оценивание корреляци¬ онных функций центрированных стационарных и стацио¬ нарно связанных случайных процессов и последовательно¬ стей X (/), Y(t). Результаты для оценок корреляционных характеристик случайных величин X, Y могут 'быть полу¬ чены из ^дискретных оценок взаимных корреляционных функций X(/) й У(2) заменой X(t) =Х, У(Н-т)=У. 2. Будем рассматривать оценивание «нелинейных» кор¬ реляционных функций Rfg(x), т. е. корреляционных функ¬ ций /[A'(f)], #[У(01> в частности «цифровых» корреляци¬ онных функций ^сьсД*), где Ci(t)=cv(X(t) |<7Ь vi>, а C2(t)=cv {X(t) | <72, v2) для автокорреляционных функций и C2(t) =cv (Y (t) \q2, v2) для взаимных корреляционных функций, и конкорреляционных функций Кх у (т). Выбор функций Rfg(т) Rcltc,(z) объясняется следующими обсто¬ ятельствами. Во-первых, «нелинейные» (в частности, «циф¬ ровые») корреляционные функции являются «универсаль¬ ными» в смысле учета наличия или отсутствия нелинейно¬ го преобразования (квантования по уровню). Выбирая разные f, g или <71, q2, получаем разные виды «нелиней: 226 ' *•
Таблица 7.2. Наименования и обозначения корреляционных функций Rfe(i) Вид функции g (у) Вид функций f (ЛГ) У (Й* = °) п (У 1 <?а) (0 < q2 <_оо) j sign (у) (v=.+ l, <?2-+00) ^ X (<71 = 0) Аналоговая (клас¬ сическая, мульти¬ пликативная; не¬ посредственная) Rxy (х) Стилтьеса Rxc (х) Релейная Rxs(х) CV (х 1 <7х) (0<^<оо) Стилтьеса Rcy (х) Цифровая разно¬ уровневая RctcA^ при qx ф ?9, одноуровневая 'Rcc(') ПРИ Цифрб- поляр¬ ная Res (х) sign (х) (v= +1. <?1—°о) Релейная Rsy (х) Цифро-полярная Rsc(z) Полярная (знаковая) Rss(z) ных» или «цифровых» корреляционных функций или раз¬ ные алгоритмы оценивания классической аналоговой (про¬ порциональной) корреляционной функции Rxx(x), Rxy(t) (см. табл. 7.2). Во-вторых, это. позволит нам сразу же оценить дополнительные погрешности, вносимые использо¬ ванием нелинейного преобразования (квантования), если оценки функций Rfg(т), Rclt са(х) используются как оцен¬ ки функций Rxx{i), Rxy(т). В-третьих, корреляционные функции Rfg(т) представляют- самостоятельный интерес и могут в некоторых случаях эффективно использоваться вместо функций Rxx{т), Rxy{т), т. е. не как приближения функций Rxx(т), Rxy(т), а как самостоятельные характе¬ ристики, позволяющие так же успешно и даже успешнее решить поставленную задачу. Так, например, в некоторых задачах использование полярных корреляционных функ¬ ций Rss{ т), RstsA'1) предпочтительнее аналоговых Rxx(т), ^хг(т) [75, 86]. Цифровые, в частности полярные, корреляционные-функции могут широко использоваться там, где важно выделение значений аргумента т, соответ- 15* 227
ствующих экстремальным или нулевым значениям функ¬ ции Д(т), при выделении периода, избавлении от нестаци¬ онарное™ по параметру масштаба и т. д. Кроме того, если вместо центрирования относительно математического ожи¬ дания ввести центрирование относительного другого пара¬ метра сдвига или центра распределения, существующего для всех распределений (например, относительно медиа¬ ны), то модифицированная таким образом полярная кор¬ реляционная функция (срединная полярная корреляцион¬ ная функция—п. 2.5 табл. 1.1) будет существовать для всех распределений в отличие от функции Rxy (т) . Для всех случайных процессов и последовательностей существует также введенная автором конкорреляционная функция KxY(т) и соответствующая ей конспектральная плотность мощности К(Я) (см, табл. 1.1). Замечательным свойством этих характеристик является их инвариантность к любым взаимно однозначным безынерционным функциональным преобразованиям /(•), #(•)» т.'е. если Z{t)=f[X(t)'\ й W(£) =g [Y(t)]; то Kzw (х)=Кху(т), Vzw(Я) = (Я). Рассмотрим вначале оценивание ненормированных, а затем нормированных корреляционных функций. Метод эмпирических характеристик (ЭХ-оценивание). Согласно определениям (5.22), (5.23) существует три раз¬ новидности траекторных корреляционных функций: 52i(t), $2(т),и Stz(т), каждая из которых может, быть принята в качестве ЭХ-оценки R(x) функции R(т). Функция Sti(t) может использоваться как оценка R(x) только в том слу¬ чае, когда длина Г участка реализации, по которому на¬ ходится оценка, не ограничена1, в то время как &г(т) и $з(т) могут быть использованы как при ограничении, так и без ограничения длины реализации. Для рассматривае¬ мых стационарных СК-эргодических по отношению к кор¬ реляционной функции случайных процессов и последова¬ тельностей всегда следует стремиться, если это возможно, использовать в „качестве оценки R (т) функцию Sti (т), по¬ скольку она для каждого т определяется без сокращения объема выборки. Если же объем выборки ограничен, то •можно использовать либо'&2 (т),. либо йз.(т), либо перио- дизированную модификацию 91\ (т) с заменой реализаций xr(t), ут (t) на х [г] (t), У^\, учитывая при этом извест¬ ные последствия от периодизации. 1 Это имеет место, например, в специализированных коррелометрах, работающих на линии с экспериментом, без предварительной регистра¬ ции исходных данных. -- 228
Для рассматриваемого случая необходимо в (5.22), • о (5.23) положить x(t)=x(t), y(t) =y{t). Тогда использова¬ ние 31ч {%) позволяет получать несмещенную оценку Rxy(т),'в то время как З23(т) хотя и будет смещенной оценкой Rxr(т), но будет иметь меньшие значения сред¬ него квадрата ошибки (уклонения) Ajf 2(т) по сравнению с 31ч (т) [21, 22, 68]. С другой стороны, 523 (т) есть несме¬ щенная оценка КФ /?г(т) = (1—|т[/Г)^?хх(т), |т|^Г; Rt (т) =0, |т| >Г,'эквивалентного стационарного процесса Лг(0. Не останавливаясь на этом подробно, далее будем в качестве ЭХ-оценки .R.(x) рассматривать функцию 3t\ (т), оговаривая, где; это необходимо, применимость полученных для нее результатов для'31ч{х)~ и 5?3(т). ✓*\ С учетом сказанного' рассмотрим ЭХ-оценку Rfg(x) функции Rfg(x) вида Rfg W - Jfrif l* (01 g[y(t+*)]}. (7.35) f[x(t)) = f[x(t)]-M{f[Xm. Для нее имеем (см. § 3.2) -ч M{£fr»}=».*/e(t), (7.36) Ra (и; V. \) = М (f [*(01 g [Y (< ■4- х,)] f [X (t + и)) X X g [Y(/+w + X2)]} - M(4(,,)} M {$fg K)}: (7.37) Проанализируем отдельно ' (7.36) и (7.37) для функций Rfg(т). сведенных в табл. 7.2. Из (7.36) следует, что ЭХ- оценки.являются несмещенными оценками Rfg(x). В ряде случаев в качестве оценки Rfg(x), можно взять оценку Bfg « = Лт {f [х (01 g [У (t+«)}. „ (7.38) Понятно, что подобная оценка будет несмещенной оценкой для Rfg (г), только- если M{jf[X’(0]}=0 или (и) M{g;[y(^)]}=0. Если же оцениванию подлежит Rixy(x), то оценки Rfg(х) и Bfg(т) будут несмещенными оценками для Rxy(x) только в случае равенства Rfg(x) =Bfg(x) =Rxy(x) . Остановимся на самих функциях Rfg (г) и на характере из£ отличия от Rxy(t) . Известно, что если на интерквар- тильном интервале [X174, х3/4] функции Х(/) (или на ин- .тервале [yi/4, Уз/4] функции Y(t)) укладывается не менее 8 значений q, а на втором интервале [yi/4, Уз/4] (или [Х1/4, Х3/4]) укладывается не менее 32—64 значений q, то при 229
хФО. можно считать Rc,ct (*) *=* Rxy(*), особенно если одна функция, например Я(<), подвергается квантованию I ти¬ па, а вторая—Y(t)—квантованию II типа [38, 53, 73, 75]. Аналогично^если на интервале [xt/4, Х3/4] или [yi/4, уз/4] укладывается не менее 32 значений q, то Rcy(т) « ~Rxy (т) , Res (т) ~Rxs(x) - или Rxc (г) ~Rxy{x), Rsc(x) ~ &Rsy(т) [38, 41, 73]. Пусть -Х(t), Y(i) относятся к клас¬ сам ЛК, ЛС [37], т. е. их собственные или взаимные условные математические ожидания имеют вид mZi (z3; С4)ЯМ | Zt%) = z,} = {Q + +^,(go-;(^)PZl2l(<, (7.39) где Zi{t)=Z2(t)=X(t) или Zi(t)=Z2(t)=Y(t) для собст¬ венных регрессий (ЛК-класс), Z\(t)—X(t), Z2(t)=Y(t) или' Z\(t) = Y(t), Z2(t)=X,(t) .для взаимных регрессий (ЛС-класс), ti и /2 — произвольные моменты из рбйасти задания t. Для подобных процессов независимо от вида числовой безынерционной, не зависящей от t 'функции /(•'), справедливо равенство [37] (см. также [32]) Rxnz) (т) —Rxf(Z) (0) pxz (т), (7.40) где Z(t)=X(t) для автокорреляций и Z(t)=Y(t) для взаимных корреляций. Отсюда, в частности, следует, что для ЛК- и ЛС-классов процессов и последовательностей Дхс (т) =/?xz (0) pxz (т), Rxs(т) —Rxs(0)pxz (т), t. e. стил- тьесовские н релейные корреляционные функции (КФ) пропорциональны аналоговым КФ Rxz(x). Наконец, о по¬ лярных КФ. Как .известно, для нормальны* функций А(<), У(^) справедливо равенство Rss(*) = — arcsin pxr(t). (7.41) Равенство (7.41) справедливо также для процесса (1.5) при неслучайной величине O'. Что касается других процес¬ сов, то для них формулы связи Rss(i) с рхх(т), рхг(т) необходимо получать индивидуально, так же как для сре¬ динных релейных и полярных корреляционных функций, которые, как в этом нетрудно убедиться, совпадают с обычными релейными и полярными КФ для процессов и последовательностей с симметричными относительно мате¬ матического ожидания распределениями. Теперь проанализируем (7.37). Как видим, в выраже¬ ние, для Rc(u; ть тг) входит смешанный-момент четверто¬ го порядка. Это не позволяет в общем случае непосредст¬ 230
венно использовать (7.37) для исследований и расчетов дисперсий и корреляций оценок Rfg(т), если даже задать¬ ся неизвестной КФ'/?/* (т) или использовать результаты ее измерений. Чтобы обойти эту трудность, возможны следу¬ ющие подходы: получить' точные выражения Ra{u; п, т2) как функции от Rfg(x) для конкретных .процессов и после¬ довательностей X(t), Y(t); найти неравенства для Ro(u; п. т2) вида мажорант и минорант как функций от Rfg{т), пригодные для как можно более широкого или для кон¬ кретного класса X(t)‘. Y(t); найти отдельно неравенства для Rd( 0; ть т2) и для тоо(ть т2); Каждый из этих подходов представляет интерес при тео¬ ретических исследованиях и в приложениях. Целесообраз¬ ность отдельного рассмотрения Ra(0; хи т2) и t0g(ti, т2) объясняется тем, что по ним с помощью (3:46) можно оце¬ нить корреляции непрерывных оценок, по Ra (0) можно непосредственно найти корреляции дискретных оценок, найденных по ^коррелированной выборке, а использова¬ ние при этом тоо позволяет по (3.50) — (3.53) и по рис. 3.1—3.6 оценить влияние корреляции элементов выборок G(iAt). t Рассмотрим прежде всего аналоговые^ КФ Rxx(r) и Rxy(т). Из (7.37), (7.31) для этого случая имеем Rg(u; Tj, t2) — V‘XYXY(*1f и, й-\^х2) — кхг(*г)Ихг(*г), (7.42) где 1*хуху (т- «• V) = М {X (t)Y (t -1 z)X (t+и) Y (t -b v)} = = (T> U' V)~\~V,XYXY (‘c’ u> v)> (7.43) Nxyjry (i, «, v) = Rxy (t) Rxy (v-— u) -f Rxy (v)Rxy (x — «) -|_ -\-Rxx(u) Ryy (v — z), (7.44 kxyxy—четвертый смешанный кумулянт. В табл. 7.3 приведены примеры отнормйрованных функ¬ ций г о (и; Zt, Zs) = Rq (к; ^ ,а) ^ (0) Rrf (0) для Rxy (х) и Rxx (*)• Сделаем некоторые замечания по результатам табл. 7.3. Из вида г0{и\ т) для процесса (1.5) (см. m 9 Табл. 7.3) следует,- что данный строго стационарный процесс будет СК-эргодическим по отношению к своей корреляционной функции только при условии неслучайности А—а и £2=Я, т. е. для гармонического процесса X{t)=a sin(M-t-O); При
232
Продолжение табл. 7.3 о в* а* Л. X М О СЗ V. + * « 2 2 w h _1 Ь + 5 2 | + 1 h X ^ 1 (М ь< . .?. *= + X - £ + + 2 "Ь ? + £ х + о. + и И *» К SS сг * 1 + 7 £ X X + £ а » iH 51 о- " •£■ + 'Ъ + "O' 1 Ь3 в) а, £ "г ~ ^ т*тх 1 1 S * X * + п&в + 5, ^ n <* г; £ + х i f •—^ 0 Т Д-, . у «Л? ? 8 1 1 ? Э' + -- 1- + + £ |vtw £ v. Х+ £ 4 V “Ч" £L V/ . £tw «. 5 5 ■£ "1” - $ *+ M” I V £ + V/ ^JL + ° 2 Y 5 I 1 «я *- О. «в X « S as - - Г 1 а 2 g 7 g.g 1 II А\ |! " I*§ II Ка £ 1 *. >* i § II ~5 Й а.>» >-. T ® - Л oa « -ilA в> ' П >ц ^ c* W >- Q> Тип. функций X(t).Y(t) ' 1* §:§ « с S О с а. -$5>' аГО ^ ^ - *4 a * g* S.4 ^ .з - % 3 ii с ^ s osg *r 3 w J.BV - a- ti _ a> S § в Is. « 5 _ о о я £ ж 9* CL|W i, IIS СХ. £ в ^ «я С 1 w 233
Продолжение1 табл. 7-3 а о i. К Я 5 X 9 «Г J Т си ^ W S *: р V* я ? о O' ►* Л е и ^ 1—4 о * ^ О V» £ч? 1 - fc X X X § в1 + р* а о? 1^ g U, X с* « <v к I й) S Си • с .4 X а; и X ю (N § «> и Й ° u u +з-т £2i 4- ®- w i I £ ^ "Э X. I + „ о. ~ сГ '+■ >- •w* + + _ N >- + I I + а £ -К г * т . I? ^ + а V Z. а в? V + ? <м о ~+ + £L в + CL. 9 £ + - w J-, о- •—* if Г £ 1 -f •£■ a ~ s. “ Q. o, О a-w я1** я* H *“• § О) V, « 2 я o-2 Я o - в 3o S f- 2 и «в <u * о Я с? * я w « о-а« о с g й ai^ ?§г >» * л и. > ^ il .** в* II Г I А О 5* ^ w М z $ « Э я >» •е* о я £ н ^ СО t? я s 8 § <5 S & + ж» а . S <о сл _^ ^ w 234
Продолжение табл. 7,3 * 3 + '7*' + 77 't*4 eg N о w 04 Q- b. Q- to w. cT 77 О "W к •« N to о to WN to w. + + + + а о в 'Ш* ^Ь + < * i в + з to « s ts я я $ + j + и to V. f» a N to N to i. + to ь» + to c*l. + 'S <55 ! w — *T 1: в X *L ъГ >< * + 3 + + ~ ' + a x4 Q-, X Си u О 'W'" N в- ^ I W ^ "Г 4. О- __ I L I I e to CO N 04 4- - s- 1 £ i-9 I- a* ^ + o? 5 ^ a ^ M N - N О » w * w+ N IT o ^ * cr _ * . я •* •S сг в- ^ £ * с 3 >4 >w* S «Н И s о я C4 "*4 ffi «3 w N 0) N CO <V s II II ”*4 'X* я X N a я я CQ О CL, s a, H s N ^ ^W-l! *T *; 51 П°- Cl-' о II “ T £ ^ 11 ^ 0? X eg >-^ Я Л.Ь а £ я 04 w а ^*PnJ.ii „pqji .*< и ii * ГРЯ1 л* >WI II -ti I % 1 -4 a? Я с <D Xs 3 3 s X § s <D X x, 04 >- Я fcj « *& 4> 3 s §. Ё S 235
Продолжение табл. 7? X S X _ 78 S А X 'v + "т" 4—' *v» ^ е’Г ъ* w *ао 7£ X + * - X + ПК >* £ U. X S? >- ■» £ v * t Х + X + а, О w к Я S# * Я — $ а 6 +’ + м . 134 1 1 £ + "S' X + а. 'у4 о *» X X £ <£ + *ь •е V л На ? + a + X I + X 7£ * * ^ о4 + 'w' 1 7Х ^ 1^д я ^ + + + X £ 'З4 + 1 a W т* - -*• х х х в. «. + ^ ^ ° Z 1 и ъг-е. * X J *3 ** Ъ £ + >* С? b .*о С* О + 8 V as- н £. А >- •й >- + >- >• X р? X © О Л _ V л Ь» 55 ° «м С* w_ JI V * § 4 1> I* к II У X * f f II « «> a a. >- II > + V И >. л » •0* с' *5 со £», S PJ I. 2^* СГ I *♦>* И Л f-4 A_ - t* V И. ж* 1 ii ! СО 'З' ><; s o- с «♦* • * > £ i M > к II ”♦*» 1 -♦** £ •St *30 236
этом р(т)==соз(Ат), а Непрерывные Rt(x) и дискретные Rn (т) оценки будут иметь приведенные дисперсии (х)= D {Rxy (х)} [#хх (0) Ryy (О)]-1 /2( равные S2 /-ч — з^(Х7’) S2 /-Ч sIii^AA*) ' — ЩТ)Ь • $N')~2N»sinцшу (1ЛЬ) Как видим, для такого процёсса, во-первых,- дисперсия имеет порядок 0(1/Г2), О (1/А2), в то время- как для дру¬ гих процессов и последовательностей — порядок 0 (1/7'), О (1/А). Во-вторых* она не зависит от аргумента т. В-третьих, при %Т—пп и ААД/=/ш, л=1, 2, 3..., диспер¬ сия равняется нулю. Наконец, в-четвертых, из_б^у2(т) на¬ глядно видна погрешность синхронности, о которой • шлд речь в § 3.2. Подобные свойства гармонической функции а (/)=о sin(Af+!®) позволяют ре1«омендовать ее в качест¬ ве образцовой для аттестации коррелометров, тем более что сигналы, описываемые такой моделью, легко генери¬ ровать, а вид корреляционной функции априори известен. Кстати, широко может использоваться также функция-(1.5) при случайных А, й, если корреляционные и прочие ха¬ рактеристики ее оценивать по дискретному ансамблевому алгоритму. Необходимость использования ансамблевых алгоритмов обусловлена тем, что при случайных А и Q строго стационарная случайная функция (1.5), как не¬ трудно убедиться, не является эргодической в среднем квадратическом по отношению к корреляционной функции; к начальным и центральным моментам (исключая мате¬ матическое ожидание), к плотности .распределения.и т. д. В противоположность гармонической функции с неслу¬ чайными а и_А нормальный случайный процесс с р'(т) = =cos(At), т. е. процесс вида X(t) —Х{ cos (A/) -\-Х2 sin(А^), где Хи Х2 — нормальны и независимы, D{a1}=D(A2} = =Rxx (0), не является СК-эргодическим по отношению к R(т), на что обращалось внимание в [104]. Для него Дис¬ персия D {£ (т)} не стремится к нулю при Т, А-*-оо. Известно [6, 10, 50, 63, 69, 128, 129] , что для линейных процессов (1.6) и последовательностей (1.13) дисперсии D {/? (-г)} определяются в основном формулами дисперсии оценки R(т)’ нормальных функций, т. е. первыми двумя слагаемыми- г а (и; п, т2). Последнее же слагаемое го(и; ть т2), представляющее собой приведенный кумулянт Kuia.i/DxDy, асимптотически при Т, А-*-оо приводит к до¬ бавке в дисперсии 6в2(т), равной Y2sP*r(Ti)p.j:>'(T2)/r. 237
Как видно из результатов табл. 7.3 (см. также 1125]), дисперсии оценок Я(т) нри отрицательном коэффициенте эксцесса для р(т) = 1 (в частности, для оценок дисперсий) могут быть меньше, чем для р(т) + 1. Этот факт на при¬ мере полярных корреляционных функций известен давно. Однако вопреки ему иногда встречаются высказывания, что дисперсия D{£xx(t)} всегда максимальна в нуле, т. е. при т=0, рлгх(т)=1. В ряде случаев целесообразно учитывать равенство гс(«; ть т2)=го(—и; т2, ti). Наконец, обратим внимание на.то, что оговоренные в табл. 7.3 ограничения на вид р(т) касаются лишь функций го(ы; ть т2). В то же время выражения для функций го (0; т) являются более общими, справедливыми для всех процессов с указанными во второй графе двумерными рас¬ пределениями, а не толь'ко для марковских функций, для функций с р (т) =ехр {—v | т |}. В [40, 45] автором для оценки сверху функций Ro (0; т) были предложены точные и приближенные неравенст¬ ва, которые в общем случае при наличии априорных дан¬ ных только об эксцессе одномерных распределений и о корреляционной функции нельзя улучшить, так как мо'ж- но привести примеры функций, для которых эти неравен¬ ства переходят в равенство. В последнее время предпри-* нимались попытки ввести более «близкие» неравенства [86], которые, однако, либо сводятся^ к неравенствам, вве¬ денным в [40, 45], либо не точны, либо, применимы с определенными оговорками. В силу важности этого воп¬ роса рассмотрим его подробнее. Прежде всего преобразу¬ ем га (0; т) к виду го (0; t) = a1> 2(г) — , (*) = 1 + + /(Т?х + 2)(Т2у + 2) pa,2W-plr(x).. (7,46) го (0; т)=1 + р2у(т)+ъ.г(*). (7.47) где 2 (t) = |х2> 2 (t)/iv 2 — коррелянтнри коэффициент порядка 2 + 2; р2,2(х) = Рв". (т) —коэффициент корреляции > о о порядка 2 + 2, т. е. коэффициент корреляции X' (/), Уг (t -+- х) или иодированная корреляционная функция для Хг (Г), i _i_ Y2(ty, Yp. q (х)=Хр, ,(*) [Ц 2 ] 2 —кумуляктны.т коэффициент порядка p+q. 238
Теперь, воспользовавшись неравенствами t82] |р2,2(т)|<1, Y2,2(t)+Yu2(t)+1^sy*i.2(t), y*m(t), (7.48J получаем для всех функций X(t), Y(t), для которых су¬ ществуют ур,я ПРИ (Р+<7) ^г4, точные неравенства га (0; х) > max {у?, г(х), T11 (x)} 5» 0, (7.49) r0(0; x)< 1 + V(T«+2)(yJ+2)- Pxr (x). .(7-50) В общем случае при наличии информации только о у2,о> Yo.2, Yb2 (тг), Y2,i (т) и рхг (т) улучшить данные -неравенства, по-видимому, невозможно. Однако их можно улучшить для некоторых частных случаев. Так, если X (/), Y (/) относятся к классам JIK, ЛС, то с учетом справедливых для них ра¬ венств [37] Р-1,3 (т) =Ро,4РХГ (т) Ох/ОY, Рз,1 (т) —Ц4,0рхг (т) Оу/Ох, (7.48) преобразуется к виду. ro(0; х)>тах{-(1х, у?у}р|у(х), " х(7.51) где Yix=Y3 0, Yir=Yo.3 — коэффициенты асимметрии A(f), У(0- Допустим, что X(t), Y(t) удовлетворяют условию Т*.г( I Р I = 1)р|у(') или, что то же самое, Р2.г(‘с) < PXY (?) === gf. lOO- (7.52) Для таких функций из (7.46), (7.47) с учетом (7.52) имеем (ср. с [86]) г0 (0; х) < 1 -|-( К(у2х+2)(т2у+2) - 1) р|у (х). , (7.53) Сопоставляя (7.53) -с (7.50), необходимо отметить, следую¬ щее. 1. Оба неравенства переходят в равенство при |р*г(т) 1=1. 2. При |р_хк(т)|=0 неравенство (7.50), оставаясь спра¬ ведливым, может давать сильно завышенные результаты, особенно при больших значениях у2. В то же время из (7.53) при р;су(т)=0 следует неверный в общем случае результат rG(0; т)^1. Он не имеет места, в частности, для гармонических и некоторых других функций (1.5) со знакопеременными p(t). Однако для-функций, у которых 239
йй Некоррелированности следует независимость нлй |рхт(т) |—»-0, | рдгх (т) | ~НО, |руг(т)|-»-0 при т->±оо, имеет место равенство гс (0; р=0)=1, т. е. неравенство (7.53) при т-»-±оо, р=0 переходит в равенство, что является его неоспоримым достоинством. 3. Условие (7.52) имеет место не для- всех функций j(0. Y(t). Оно не имеет места, например, для гармони¬ ческих1, ступенчатых и-гамма (при. у2>0) -процессов, tiro формальное применение в этих случаях может привести . к занижению значений г в (0; т). Для. более широкбТо класса функций X(t), Y(t) спра¬ ведливо Р.2,2 (т) < | РД5У (т) I, (7.5.4) что приводит к [407 45] ^(0; х)<1 + У(ти+2)(т2у+2) | Pjrr(t) | -thfy (7.55) Данное неравенство переходит в равенство для сту¬ пенчатых процессов [см. (7.10) ] при всех р(г) ^0, спра¬ ведливо для всех функций табл. 7.3. (для гармонических формально) так же, как и (7.53), переходит в равенство для релейных корреляционных функций ЛК- и ЛС-процес- сов и последовательностей с симметричным относительно тх. и (или) ту (если тх, ту, существуют) одномерным распределением, для аналоговых, релейных и полярных КФ нормальных функций, для полярных КФ всех процессов и последовательностей с симметричным относительно тх, ту распределением, для срединных релейных^ (где они суще¬ ствуют) и срединных полярных КФ всех процессов и по¬ следовательностей и т. д. Заметим, что для релейных и полярных -КФ под X{t), Y(t) понимаются клиппнрованные функции. В работах автора, результаты которых частично опуб¬ ликованы в [40, 45], и в работе Г. Я- Мирского [86] при¬ ведены примеры, характеризующие отличие правых частей выражений (7.46), (7.47) и (7.50), (7.53), (7.55). Эти ре¬ зультаты нетрудно дополнить на основе Данных табл. 7.3. Некоторые из них сведены в табл. 7.4, где ф (р) = = K<(p)/r-G(0; т), 1=17 2, 3, Ki (р), к2(р) и к3(р) есть пра¬ вые части (7.50), (7.53), (7.55) соответственно. Как видно из таблицы, для важных в практических приложениях случаях, когда ^2^12, использование нера- 1 Любопытно, что несмотря на это для гармонических функции формально неравенстве) (7.53) остается справедливым. 240
Табл ица 7.4. Экстремальные значения функций ф(р), .определяемые неравенствами (7.50), (7.53) и (7.55) Номер из табл. 7.3 Экстремальные значения ф (р) для (7.50) для (7.53) для (7.55) ruin max min max min max 1 1 3 1 1 1 1,42 2 1. 15 0,542 1 1 1,35 3 г 1 1 1 1 1 1 4 1 ъ 1 1 1 ^I/yT/2, .Ya>l 5 1 Y2 + 3 ^ 0,54 при Ya< 12 1 1 <1,5 7 1 Ya + 3 1 1 1 8 1 3 1- 2 1 2 12 1 Ya + 3 i 1 1 Ya>l венств (7.53), (7.55) приводит к результатам, близким к истинным значениям. При этом подтверждается, что ис¬ пользование (7.53) может привести к занижению результа¬ тов' по сравнению с.истинными значениями. Теперь рассмотрим, другие корреляционные функции. Что касается цифровых КФ, то в первом приближении можно считать, что если шаг группирования выбирается так, что поправками на группирование типа Шеппарда можно пренебречь [38, 66], то дисперсии цифровых КФ примерно, равны дисперсиям! аналоговых КФ. Это, в част¬ ности, подтверждается точными результатами (см., напри¬ мер, [41] и рис. 7.2). ' Для релейных и полярных КФ, я также для средин¬ ных релейных и полярных КФ можно получить точные выражения, аналогичные результатам табл. 7.3. В част¬ ности, для релейных КФ нормальных функций выражение го (и; п. Тг) дано в табл. 7.3, п. 3. Ограничимся лишь ана¬ лизом Ro (0; Ti, Т2). 16—192 " 241
м{яН} nd{r(?)} aid{r(o)} R*(0) Rz(0) rHo) Рис. 7.2. Влияние квантования по уровню на дисперсии оценок корре- ляционных функций (/ — аналоговой; 2 — цифровой; 3 цифро-поляр- йой; 4 — Стилтьеса; 5 — релейной; 6 — полярной) нормальных процес¬ сов; полученных усреднением N некоррелированных парных выборок: / — v=—1; // — v=+l ^ Для всех процессов и последовательностей X(t), Y{t), для которых существуют собственные и взаимные релейные Rxs{x) и полярные Rss (т) КФ или срединные релейные Gxs (т) и срединные полярные Gss (т) КФ, имеем /?о(0;т) = /?хх(0)-/^5(т), (7.56) /?о(0;т)=1-/&(*), (7.57) Rg (0; *) = Rxx(0)-GhW, (7.58) Rg (0; ’) = 1 — Gss О*). (7.59) Для ЛК- и ЛС-функций (7.56), (7.58) могут быть пре¬ образованы с учетом (7.40). Такой простой вид Rq(0; г) упрощает для подобных КФ определение дисперсий Оценок R{t), особенно если они находятся по некоррелированной выборке, и позволяет сделать вывод о предпочтительности (с точки зрения дис¬ персий оценок) обычных и срединных релейных и поляр¬ ных КФ при больших коэффициентах эксцесса. X(t), Y(t) [42]. Особый интерес в связи с этим, представляют сре¬ динные полярные КФ Gss(t) . Во-первых, так же, как Rss(t:)> они являются нормированными. Во-вторых, они существуют для всех процессов и последовательностей. В-третьих, они определяются через медиану, оценки кото¬ рой, как указывалось ранее, предпочтительнее оценок ма- 242
тематического ожидания. Недостатком подобных КФ яв¬ ляется более сложная зависимость между КФ входа и вы¬ хода линейных и нелинейных систем. В свете сказанного подобные КФ находят и могут найти широкое применение как самостоятельные характеристики либо как. вспомога¬ тельные, позволяющие от их оценок перейти к оценкам Rxx(t), •Rkk(t), /?хг(т) по формулам пересчета Rxs(xj, Rss(t), Gxs(t), Gss(r) в Rxx(x), Ryy(x), Rxy(x) [41, 42, 53, 73, '85,,86]. Обратим также внимание на конкорреля- ционныё функции Kxy (т) , для которых у2 = —1,2 незави¬ симо от коэффициентов эксцесса X(t) и Y(t). Наконец, рассмотрим т0с (т). Интегрируя т<?(«; Ti, ts) то и при Ti=t2=T и X(t)=Y(t) для разных р(т), можно убедиться, что в большом числе практически важных слу- 1аев значения too (т) =тоо (т) можно приближенно оценить вверху значением (0,5Ч-1)т1'о\*. До сих пор мы рассматривали оценки $(т), полагая, что тх, т'у или x0,s, уо,5 известны. Если же они не извест¬ ны, то вместо них необходимо поставить их ЭХ-оценки аналогично (7.30), т. е. брать оценки R(x). В этом случае для-рассматриваемых ЭХ-бценок будем иметь (ср. с [111; 124]) М {(? (т)} ^ R (х) — corT {т^, mY}, (7.60) где согт(-) определяется (3.20), (3.21) при Ro(u; di, дг)^ =#хт(ы-|-т), &6(и)=Г~2; t,n=Г.' Из (7.34) асимптотически имеем (7.46), (7.47). Более точный анализ дисперсий оценок R (т) показывает (см. [32, (11, 124]), что в зависимости от способа центрирова¬ ния и.оценивания тх, ту они могут существенно зависеть ох.тх, ту. Поэтому перед нахождением R (т) желательно как можно точнее скомпенсировать тх, ту до уровня /и-х« 0, miytt 0, затем уже находить оценки тх, thy и осу¬ ществлять центрирование. Это важно также с точки зре¬ ния аппаратурных погрешностей. Дисперсии подобных оценок #(т) асимптотически будут близки к дисперсиям оценок ^(т). Методы ' проекций (ОР- и HP-оценивание). Возможны две модификации методов ОР- и НР-оцениваиия: когда разложению в ряд подвергаются реализации функций X(t), Y(t)' либо когда разлагается сама КФ R(т). Первая мо¬ дификация чаще всего применяется при использовании кусочно-постоянных базисов [27], вторая — при различных 16* .243
ортогональных,, биортогональных и неортогональных бази¬ сах, в частности. при разложениях в ряд Маклорена [27, 30, 74, 85, 111]. В связй с тем что теория и практика ОР- и НР-оцени- вания ДФ мало чем отличаются от теории и практики'рас- смотренных ранее ОР- и HP-оценок законов распределе¬ ния, остановимся на них вкратце. Рассмотрим первую модификацию. Представим X(t), Y{t) на интервале *е[0, Г) или [0, оо), (—оо, оо) при¬ ближенным (СК-сходящимся при п-*-оо) рядом Фурье X(t)=mx(t)+2 Y(t) = my(t)+% Bi9i(t) (7.61) <=! i=l по системе базисных функций q>,(f), ортогональных на от¬ резке [0, Г) или [0, оо), (—оо, оо) с весом р(<), с М{Л,}=М{В,}=0( М {AiAk}=aik, M{BtBk}=bik, М{Л;В*}=с1й. В этом случае имеем R(t, i+т) (t, t-\- +т), где ( B$i (U + *) = 2 2 aikb(<).**(* + «). (7.62) Jslfcsl №. *+<)= E 2 (7.63) /=i k=i В разложении (7.61) выбор фу.нкций <р,(<) произволен. Однако от выбора ф,* (0 зависит число п членоб. ряда (7.61) или (7.62)+ (7.63), представляющих X(t), Y(t) или R(t, /+т) со среднеквадратической ошибкой (например, д!=<[я (t, х) (R(If, t+ х) -^"1 (t, t + X))]?, T>, (7.64) где %{t, т) — заданная весовая функция), не превышаю¬ щей заданную. Известно, что наиболее экономным в этом смысле является разложение Карунена — Лоэва, когда <рi(t) ортогональны и представляют собой собственные функции КФ R-{tu h) • При этом aik и равны нулю при 1фк, что существенно упрощает выражения (7,62). Разло¬ жения, обеспечивающие некоррелированности‘Л,-, Л* и Вг, Вн при 1фк, называются каноническими [98, 104, 134]. В этом случае (7.62) и (7.63) упрощаются. Например, Rfxit, ^ + х)=2 + (7.65) 2=1 244
Более простые разложения можно получить, если отка^ заться от условия ортогональности q>i(/) и заменить их условиями, биортогональности [104, 134]: **<№ V) ?* п*>=(о при !=к: (7.66) (0 при t*F=k, = <[R (t. s) <l> (s)]s>, (7.67) где <р< (t) —. система координатных функций, построенная на основе системы биортогональных функций, удовлетворят ющих (7.66). В этом случае оценивание R(tt Н-'*]’ или R(x) сводится к оцениванию коэффициентов Фурье а*, с,-, а функции (й), ф,(^) выбираются из условий мало¬ сти п при заданных требованиях к .А2д, определяемой (7.64), либо из условия простоты технической реализации, в частности минимума объема вычислительных затрат. Понятно, что здесь, так же как и для распределений, можно поставить задачу выбора оптимальных п при за¬ данных q><(f) или п и ф<(/) из условия минимума М{Д2^}, где Д2д определяется (7.64) с заменой aRM ее оценкой £[«] согласно (7.65) при а,=&. В последнее время подобные алгоритмы оценивания /?(т) строятся на основе использования в качестве биорто¬ гональных базисов кусочно-постоянных функций: Уолша, Чебышева — Маркова, псевдослучайных сигналов (ПС), последовательностей Чанга и т. д. [27, 74], допускающих для нахождения коэффициентов с,-, bi, ct в разложениях (7.61), а также R(iAt), i=0; п—1, непосредственно по тра¬ екториям дискретные алгоритмы быстрого преобразования типа БПФ д этом базисе. Использование быстрых преоб¬ разований позволяет существенно сократить число вычис¬ лений по сравнению с ЭХ-оценками [14, 16, 17, 74], а ис¬ пользование кусочно-постоянных базисов позволяет допол¬ нительно уменьшить количество вычислительных операций за счет замены операций умножения сложениями [16, 74]. Вторая модификация основана на теореме Мерсера и Связана с,^непосредственным представлением корреляци¬ онной функции рядом вида (6.53)—(6.56)' *хх (7-68) <=1 по системе ортонормированных на (0, оо) с весом р(т); функций £<(т). Оценки ai находятся аналогично (6.51), по 245
формулам вида at = Мт {х (t) <[* (t - и) gt (и) v. («>]„>}. (7.69) Обычно оценивание по (7.65), (7.68) имеет смысл прово¬ дить при аналоговой фильтрации, позволяющей получать значения внутренней скобки в (7.69). Особенно это целе¬ сообразно в тех случаях, когда число п членов ряда (7.62), (7.63), (7.68) существенно меньше числа точек R (т), кото¬ рые необходимо измерить. Для ОР- и HP-оценок R (т) справедливо многое из ска¬ занного для ОР- и HP-оценок плотностей распределения /см., например, [30]). Отметим лишь, что ЭХ-оценки (7.69) являются асимптотически несмещенными, а корре¬ ляции оценок Я(т), полученных по (7.68) с заменой о< на а,-, равны согДРЮ, ^(г2)} = 2 S сог{***• **}■£» К) «Г* К). (7-70) 1 = 1 &=1 cor{ ah %}=<[< [cor (Я (х), £(0)} gi (x) gk (0) ц (x) fv(0)]9>],>, (7.71) где £(т) — ЭХ-оценка (7.35) КФ iRxx(*t). Метод базовых характеристик (БХ-оценивание). Со¬ гласно определениям табл. 1.1 для стационарных и ста¬ ционарно-связанных функций существуют две базовые ха¬ рактеристики для КФ: двумерная плотность W(x, у; т) или ряд Р(х, у; т) распределения вероятностей и спек¬ тральная плотность мощности «S/Л.),. Поэтому возможны два варианта БХ-оценивания 'R (т): по оценкам распреде¬ лений или по оценкам 5(А.). Первый вариадт находит ог¬ раниченное применение и представляет интерес в основном при построении упрощенных специализированных или многофункциональных (когда основными характеристика¬ ми являются распределения) измерителей. Второй вариант основан на преобразовании Фурье оценки 5 (Л.), и поэтому назовем его ПФ-оцениванием. Особенно'интенсивно в по¬ следнее время развиваются методы, основанные :да дву¬ кратном преобразовании Фурье (ДПФ-оцениваниё) одно (прямое или обратное) ПФ используется для' нахождения 3(A) по траекториям X(t), Y {t), второе (обратное или пря¬ мое) — для нахождения £(т) noS(ft,). Это обусловлено следующими обстоятельствами: 1) в некоторых оптиче¬ ских, оптоэлектронных и других измерителях базовой опе¬ рацией является непрерывное преобразование Фурье; 246
2) широким распространением быстрых преобразований (ДПФ) и теоретико-числовых преобразований, позволяю¬ щих существенно сократить объём вычислений [1, 14, 16, 17]; 3) возможностью измерения спектров 5(Х) в базисе; отличном от экспоненциального, а именно в .кусочно-по¬ стоянных базисах Ч** и теоретико-числовых преобразовани¬ ях, позволяющих использовать алгоритмы быстрых преоб-' разований Фурье на этапе расчета S (X) в этом базисе, пе¬ ресчета его в экспоненциальный базис (в случае необхо¬ димости) и в оценку ,/?(т) i[l, 16]. Еще раз обратим вни¬ мание читателя на то, что в ряде случаев КФ R (т), полу¬ ченная по спектру в базисе Чг, и сам спектр могут быть использованы как самостоятельные характеристики, а не только как вспомогательные характеристики, упрощающие расчет классических функций R(т) и iS (Л), представлен¬ ных в экспоненцйальном базисе [1, 16]. Учщывая, что представляющие наибольший интерес ДПФ-оценки R (т) строятся на. основе формул, которые будут рассмотрены ниже для. оценок спектров, а также, что подобные алгоритмы уже достаточно описаны в лите-, ратуре [14, 16, 34 123], рассмотрим в данном параграфе лишь некоторые замечания к подобным оценкам, не рас¬ сматривая их отдельно. Прежде всего обратим внимание на следующее: 1) широко описаны-нюансы, связанные с ДЦФ-оценками R (т) по финитным сигналам, а именно: краевые эффекты, эффекты периодизации, погрешности -от округления опе¬ рандов в рекуррентных процедурах, и т. д.: появление лож¬ ных спектральных составляющих, размывание спектраль¬ ных компонент, паразитная амплитудная модуляция и пр. [14, 19, 34 и др.]; 2) использование дискретных алгорит¬ мов быстрого преобразования (БП) Фурье,'Уолша, пило¬ образных, числовых и т. д. требует получения и запомина¬ ния до начала вычислений большого числа отсчетов тра¬ екторий (сигналов) и результатов и приводит к задержке в получении конечного результата, отчего полностью не избавляет даже применение секционирования [17, 34, 105]. Правда, частично, за счет увеличения числа операций, эти недостатки., можно ослабить использованием рекуррентных алгоритмов на основе БПФ; 3) наличие рекуррентных процедур предъявляет жесткие требования к разрядности операндов — элементов выборки и промежуточных резуль¬ татов: для получения смещения не более 1% максималь¬ ного значения функций требуется представлять операнды не менее чем 10—16 двоичными разрядами [53], хотя за 247
счет уменьшения числа операций снижаются и вычисли¬ тельные погрешности. В то -же время в алгоритмах ЭХ-, рценивания можно обойтись 5—7 двоичными разрядами для представления элементов выборки и частных произ¬ ведений; 4) при аппаратной реализации ДПФ-оценивания необходимо воспроизводить (вычислять, хранить) значения базисных функций: тригонометрических, Уолша, Виленки¬ на—Крестенсона, • Хаара, терретйко-числовых и т. д.; 5) используемое при нахождении состоятельных оценок S (k) взвешивание может привести к существенному сме¬ щению ДПФ-оценок /?.(т); 6) очень часто i? (it) требуется оценивать в сравнительно небольшом числе п точек по большому числу N элементов выборки, причем требуемые п точек могут располагаться в разных областях значений аргумента т КФ tR(t). Использование дискретных ЭХ-оце- нок потребует при этом примерно1 nN действительных опе¬ раций сложения и умножения-либо примерно вдвое мень¬ шего числа операций умножения, если использовать по¬ парное объединение произведений. В то же время исполь¬ зование ДПФ-оценивания.на основе БПФ по основанию 2 потребует порядка NXogz'N комплексных операций сложе¬ ния и,умножения [16, 17, 105]; 7) как правило ЭХ-оценки находятся по слабо коррелированной выборке, а ДПФ- оценки •— по сильно коррелированной выборке. Это при том же IN может привести к существенно меньшим стати¬ стическим погрешностям ЭХ-оценок по сравнению с ДПФ- оценкамй, либо к потере преимуществ ДПФ-оценок в числе операций за счет резкого увеличения объема вычислений с целью получения ДПФ-оценок с требуемыми статисти- нескими свойствами (см. i§ 3.2). Некоторые другие предо- етережения против бездумного, не обоснованного должным образом применения ДПФ-оценивандя КФ» основанного на БПФ, приведены в [86].. При разработке специализи¬ рованных средств статистических измерений подобное оце¬ нивание, по-видимому, может, не вызвать особых возра¬ жений лишь в многофункциональных процессорах БПФ, основанных, в частности, на применении ЭВМ, в которых вычисление КФ есть побочный продукт. Во всех остальных случаях следует детально обосновать целесообразность’ ДПФ-оценивания R (т), как, впрочем, и других методов: и; алгоритмов 'оценивания, а не принймать, как считают не¬ которые авторы, безоговорочно какой-то один алгорйтм, например непрерывный [134] или ДПФ. ^ 1 Точное-значение 'зависит от значения Г=Л' или Г = (V—|т|. 248
Прочие методы. Из других алгоритмов отметим преж¬ де всего цифровые и знаковые ^алгоритмы, использующие вспомогательные интерполирующие сигналы [32, 53, 73, 85, 86, 125], алгоритмы условного среднего [85, 86], алго¬ ритмы нахождения четных и нечетных частей взаимной КФ, рекуррентные, адаптивные, динамические, улучшен¬ ные путем фильтрации и прочие. Особое внимание следует обратить на смещенное оцецивание КФ [7, .22, 24]. Отме¬ тим возможность оценивания R(x) при известном двумер¬ ном. распределений X (i), Y (t) параметрическими метода¬ ми, в частности методом МП (см. гл. 1, а также [6, 22, 50, 63, 129, 161]. 7.4. ОЦЕНИВАНИЕ НОРМИРОВАННЫХ КОРРЕЛЯЦИОННЫХ ФУНКЦИЙ^ Рассмотрим только наиболее часто используемый, ме¬ тод базовых характеристик. Возможны два варианта БХ- оценивания нормированных корреляционных функций (НКФ) р (т), а именно: ~ (7-72) Pfe(') = $feWVR„ (0)^(0), (7.73) где R(x) — некоторая оценка R (т) с дисперсией 0{£(т)}-й) при Г-»-оо. Желательно, чтобы оценка R(x) была несмещенной или асимптотически Несмещенной, т. е. чтобы l.i.m. R(x) =R(т) при Г-»-оо,тдё l.Um.—-предел в сред¬ нем квадратическом (СК-предел). i- Выбор формулы (7.72) или (7.73) определяется равен¬ ством теоретических НКФ: искомой р(т) и получаемой по (7.72), (7.73) при замене R(x) на /?(т)..В частности, фор¬ мула (7.72) применима для оценивания р(т)=р//(т), а также для оценивания р.(т) =рхх(С? У(т)=рхгД^^ДК- и JIC-функций по Rxnx)(т), Rxf(Y)(x), Rf(x)Y(х), например по релейным Rxs (т) и стилтьесовским Rxc(x) КФ. С дру¬ гой, стороны,л фррмул а (7.73). применима для оценивания р (т) =р/£ (т) по Rfg(x) при разных g [см. (5.21)], в том числе взаимных релейных и стилтьесовскцх НКФ. При т=0 формула (7.73) переходит в, известную формулу БХ-оценивания коэффициента корреляции величин f(X), g(Z), где Z=X или Z= Y. Формула (7.73.) сводится к (7.72),' есЛи f=g и X(t) = Y (/)-.- 249
Введем следующие обозначения: М {P/g (т)} =Р|2~(Т), Pi(t)=P12(t)/P12(0), р2(т) =Р 12(т)/VPi 1 (0)Р22(0) , А\(т) = =-[Лу,(т)-Ри(т)]/Р12(0), \ А М =$, (4~ ,(0)^(0) (7.74) и допустим, что существуют используемые ниже разложе- -у" ^ ния Тейлора и моменты. Разложим pfg(r) в ряд Тейлора в точке (Pi2(t), Pi2(0)): ?fg W.= Pi (z) + S (~ »)* (P,M ^ (0) - A (t) Л?"1 (0)1: k=\ (7.75) Отсюда имеем M fP/g (4} = л W+a (-1 )* [p. W M К (0)} -' k=2 -М'Ж’)^"1» (7.76) сог{р;,К), £gK)} = S £ *=1 Л=1 - V* К)] [p, К) Zn - V„ (x8)]}. (7.77) Z* = V(0)-M{4*,(0)}, (7.78) V* (4 = A (x) Л1-1 (0) - M {Al (x) Л?"1 (0)}. (7.79) Если l.i.m.Rfg{r)=Rfg(*t), f(x)=ax или g(x)=ax, где a— константа, X(t) — Y(t) и X(t) относятся к классу JIK, то при получении оценок $ (т) по независимой дискретной вы¬ борке G(iAf) оценка (7.72) будет несмещенной (что не¬ ожиданно!) оценкой НКФ Pxy (т) [33]. В этом случае при f (*) =g (х) =х имеем d & (4}=^ 2 s(- (°)Щм <**> х* {ш+ &=1 Л=1 1 = 1 4- 4 - Рхх (4 X* (Ш)} Atn-2 (0) j. (7,80) Из (7.§0) для нормальных функций X(t) имеем D{PxxW} = ^rF[l-piH41, N>3. (7.81) 250
В общем случае, когда D{[/?/«(t)]*}->0 при Г->оо-, ограничиваясь первыми слагаемыми в (7.76), (7.77), асимп¬ тотически получаем (для простоты опустим индексы f, g\ М {р (х)} ^ Pl (х) [J + я (0, 0)] - Я (т, 0), (7.82) сог {Г(*,), Г('с»)} Pi (',)•>, Ы Я (?. °) + Я (>, •'г) — - А К) Я (0, хг) - Рх (хг) Я (х1( 0). ’ (7.83) где Я (т„ Х2) = cor {£fg (X,), %(,,)}/^2 (0). (7.84) Аналогично, разлагая р(т) в ряд Тейлора! в точке с ко¬ ординатами Рп(т), Ai(0), Я22(0) и ограничиваясь пер¬ выми членами ряда, когда D{[/?/*(т)]*}-И) при Г->оо, не¬ трудно получить М{р>)}«аМ [2612-f- 36п 4 35 22— 4v, (X) - 4v2(x)+8], (7.85) О I cor {р (х,), p(xj.)}«=* — А (х,) аОчН^ц + ^Н- 261SS —J— + 4я(х„х2) — 2 [v, (х,) + v, (х2) + v2 (х,)4. v2 (х2)]}, (7.86) где в обозначениях Rn=Rtf, Rvt—R}g, #22=1Rgg имеем Д /х X ) = С0Г {Аз Ы . R12 (Xj)} 1,1 РиЫРпЫ ' v __ cor {Ryi (x) , /?fefe (0)} k As (x) TWO) ’ (7.87) g cor (At (9) > Rkk (Q)} ik Pu (0) Pkk(0) Из (7.85) и (7.86) при т=0 и ti=t2=0 получаем выраже¬ ние смещения и дисперсии для оценки коэффициента кор¬ реляции между f[j] и g[Z], Z=X или Z=Y, а при f=g и .Х(|) = У(*) получаем совпадение с (7.82), (7:83). Из полученных выражений следует, что при l.i.m. £(т) = =R (т) оценки р(т), р(т) являются асимпто^чески несме¬ щенными, У Г — состоятельными. Выражения для смещений, корреляций и дисперсий оценок р(т), р(т) для конкретных функций X(t), У(*) и алгоритмов оценивания R (т) могут быть получены по 251
,(7.82), (7.83), (7.85), (7.86) с учетом результатов § 3.2 и 7.3. В частности, можно воспользоваться (3.20), (3.21), (3.41), (3.46), (3.47). Например, согласно (7.83) функция Rg (и; хи Тг) Для оценок р(т) асимптотически определяется выражением R0р(«; 'г)= Pxi'i)рЛ'г)Ьа{ц\ 0, 0) + Л0(и; хх> ,2)_ - Л (ti) К («; 0„х2) - А (т2) А0 (и; х„ 0). (7..88) где f К (и; t2) = r0s(«; ч„ х2)/?/;(0)/?м(0) R^(0), (7.89) rGf,(u; ti, тг)~ определяется для R/g (т) аналогично табл. 7.3. При f(X)=X, g(Y)=Y функция tgr(щ Ть Тг) определяется непосредственно по табл. 7.3. Рассмотрим некоторые частные случаи для оценки р(т). Положим, во-первых, f(X)=g(Y)=X и р(т).= =Рхх (т) =р (т). Тогда из (7.88) имеем для оценок р(т) я0р (0; ')■■= 1 + (Y*. о — 1)Р2(-) + М-2? wт.., «• (7.90) Учитывая неравенства для кумулянтных .коэффициен¬ тов уй.п [82], из (7.90) нетрудно получить неравенства [а (х) - Ь (х)]* < /?0f (0; х) < [а (х) + b (х)]\ (7.91) где а (х) = }/"raR(°< х)> ь (х) = Я W У (Тм+2). (7.92) raR(0;х) определяется согласно табл. 7.3 при Х(£)=У(0. Степень близости левой и правой частей неравенств. (7.91) к точному значению Ро(0; т) можно оценить, на¬ пример, для ЛК-функций, Для них, учитывая, что уз.1(т)= =У4.ор(т) Б37], из (7.90) имеем Ra (0; х) = а’(х)-6‘(х). (7.93) Р Отсюда, учитывая, что Ro(0; t)>0, поскольку это дис¬ персия, для. ЛК-функций имеем [ср. с (7.51)] roR(0; х) > (Y2x + 2) 9хх (х). т. ё. при выполнении (7.53) для больших угх г о Y2x + 2)P^C')- 252
Полученные выражения можно преобразовать, учиты¬ вая неравенства (7.49), (7.50), (7.53), (7.55). Так, если справедливо неравенство (7.53), то из (7.93) длд ЛК-функ- ций имеем " Rot (°;х) < 1 “ Рг (*)• (7-94) Равенство в (7.94) имеет место для нормальных функций [ср. с (7.81)]. •« • Теперь положим f[X]=X> g[T]=sign [У], т. е. рас- смотрим релейный алгоритм оценивания ВНКФ pir (т). В этом случае для несмещенных ЭХ-оценок $xe(i) имеем для всех Л К- и ЛС-функций X (;t), У (t) равенство р(т)= =ри(Ч)=р(т) и , \ (0; х) = [ОД [1 + р2 (х)] - 2р (х) М {[X (t)Y sign [У (t)]X X sign [У (t + x)]}]7?j|(0). (7.95) Отсюда, учитывая, что | М {[X (t)]2 sign [X (/)] sign [X (t -f- —x)])- j ^ Rxx (0), получаем для всех ЛК- и ЛС-функций Ко„(0; х) л I1 - р ЮГ < Rxx(0) < I1 + Р ЮГ- (7-96> Наконец, положим f(X) =sign X, #(У) =sign X, т; e, рас¬ смотрим полярные КФ. Здесь для несмещенных ЭХ-оценок Явв (т). имеем р (т) =Rbb (т) = pss (fr)., и,: как и следовало ожидать, (7.88) переходит в (7.57) . Теперь рассмотрим ЭХ-оценки р(т) ВНКФ Р/«(т), по¬ лученные по несмещенным ЭХ-оценкам $ (гг). Для них р2 (т) =0fg (т) и асимптотически из (7.86) получаем % (0; ')=1+ъ.2(х)+4"р^(х)[т-«+т»-+ 2т*.*(°)+ + 4Р/«(0)] — Pfg(х)1т». 1 (х) + Т 1.г:I (0. х) + 2Pfe (0) рл (х) ], (7.97) где ук,п (т) находятся для f[X(f)], &[У(0], a yi,2;i(0, т) — для f [*(*)], ff [ЭД], g [Х(ОД)]. При f[X(0]= —S [У.(0]=-^(0 из (7.97) непосредственно следует (7.90). С другой стороны, при т=0 из (7.97) легко полу¬ чаются известные результаты [65] для оценок коэффици¬ ента корреляции величин / [Х(#)] и g [У(<)]- 253
Для сравнения приведем Ra (и; х„ х,) для нормальных Р о/ О случайных процессов X<t), Y (t), т.е. при /[ЛГ]==ЛГ, g [У] — X для оценок'р(х) и при f(X) = X, £(У) = У для оценок р(х). Для ЭХ-оцёнск р(х), полагая Рхх (х) = р.(х), имеем \ ((*> Ti> х?) — ^Р2 (и) Р (xi) Р (хг) ~h Р (и) Р (и хг — xi) Р (хг 4" + «) Р К --1') -- 2р {«Ир (х.) Р (Х2 +•«) + Р Ы Р (х, — «)]. (7.98) /<s(0;x) = l-p,(x). (7-99) Для ЭХ-оценок р (х) имеем \ (м> xi> хг) — РXX (м) Руу (м ~Ь Х2 xi)+ РуУ (хг"4“м) Pxy(xt и)~\~ +4" р*у ^ PJtT ^ ^хх ^ + р*г ^ + 2Рху(“)1— Рху (xi) X X [pjsrjp (U) РXY (Х2 — и) “Н Pjry (М) Руу(х2 и) ] Рд-у (хг) [Рддг (и) X X РXY (х1. “ Ы) “Н РXY (^) Руу (Х1 ' Ы)1’ (7-100) RGf (0; х) = 1 - 2Рху(0) Pxy(z) Руу (,) + pir (0) р|у(х), (7.101) причем использование знака «-}-» или «—» равноценно. Из (7.101) имеем [41] Л1 — I рд-у (0) Р*у (х) | .]*< R0f (О, х) < [1 + I Р*у (0) 9ху(г) | ]\ (7.102) ^Gp (0> 0) = [1 — р|у (О)]2. (7.103) Выражение (7.103) характеризует дисперсию оценки коэффициента корреляции гХу величин X(t), Y(t) и, по- видимому, послужило основой для широко распространен¬ ных (см. {32, 73] и др.) ошибок: замены (7.99) для оценки р(т) или'замены (7.101) для .оценки р(т) на ошибочное выражение R (0;х) = 11—р2 (х)]2. На наличие подобных Gp ошибок обращалось внимание в [41]. Детальное исследо¬ вание «некоррелированных» оценок г^г для нормальных величин можно найти во многих работах по математиче¬ ской статистике, в частности в [66]. Если вместо ЭХ-оценок R (т) вида (7.35) для построе¬ ния БХ-оценок р(т) вида (7.72), (7.73) используются оцен- 254
ки ад [см.-(7.60)), то полученные таким образом оценки р*(т)р**(т) будут в первом приближении асимптотически эквивалентны рассмотренным оценкам р (т) и р (т), причем для оценок р*(т) согласно (7.60) следует ожидать- отри- цательное смещение по сравнению с оценками р(т) при конечных Т, N. Детальное сопоставление БХ-, ЭХ-оценок р(т) и р (т) НКФ р(т) с ЭХ-оценками КФ Rfr) для разных функций X (t), Y (t) показывает, что статистические погрешности БХ—ЭХ-оценок НКФ могут быть существенно меньше ста¬ тистических погрешностей ЭХ-оценок КФ, особенно при больших значениях |р(т)|. Это наводит на мысль вместо КФ R(t) оценивать НКФ р(т) и отдельно более точными методами оценивать /?jmc(()), jRyy(O) или ах, сгу. В связи с этим представляет интерес исследование оценок р(т), jp(rr), полученных по другим оценкам R(r), отличным от ЭХ-оценок, а также исследование различных оценок R-(т), найденных по предварительно отнормированной к ах, <тг выборке, что приводит к оцениванию р (т). 7.5. СМЕШАННЫЕ АЛГОРИТМЫ ОЦЕНЙВАНИЯ КОРРЕЛЯЦИОННЫХ ФУНКЦИЙ. АППРОКСИМАЦИЯ,' АНАЛИТИЧЕСКОЕ ОПИСАНИЕ ОЦЕНОК Целесообразность смешанного оценивания КФ на кон¬ кретных прикладных задачах показана в ,[22, 51, 52, 106, .109, 134]. Обычно смешанное оценивание КФ осуществляется на основе непараметрического ЭХ-оценивания R (т) или (очень редко) <р (пг) с последующим оцениванием парамет¬ ров выбранной аппроксимирующей аналитической модели КФ методами ЧХ, ЗХ, ММБ. В качестве аппроксимирую¬ щей модели выбираются чаще всего разложения по орто¬ гональным функциям (как правило, полиномам) [73, 85, 1111, аппроксимация через экспоненциальные, косинусные и экспоненциально-косинусные функции [22, 77, 106, 109], треугольные и трапецеидальные функции [29, 35, 77], ин¬ терполирующими многочленами и функциями [77, 111]. Обратим внимание на то, что если параметры функций, аппроксимирующих КФ, находятся по R(x), то подобные смешанные методы оценивания могут привести к получе¬ нию оценок КФ, не отвечающих требованию неотрицатель¬ ной определенности КФ., Для избежания этоге нежела¬ 255
тельного я&лёния целесообразно аппроксимацию несмешан¬ ное оценивание КФ проводить в два этапа. На первом эта¬ пе производится аппроксимация оценок спектральных плотностей мощности (СПМ) iS (А) и находятся оценки 0 параметров 0 функции 5 (А,), аппроксимирующих S (А,). На втором этапе полученные оценки 0 параметров 0 СПМ 5(A) используются -как оценки параметров функций, аппрокси¬ мирующих КФ,-причем эти функции Д{т) -получаются ана¬ литическим преобразованием Фурье функций 5(A), аппро¬ ксимирующих 5 (А,). Если необходимо получить значения оценок КФ R (т) при отдельных конкретных значениях т, то они находятся вычислением по формуле £(т, 0) либо мето¬ дом преобразования Фурье (в частности БПФ в базисе Ч*1 СПМ 5) смешанных оценок 5 (А; 0). Такой двухэтапный прием смешанного оценивания КФ удобен также тем, что для СПМ можно широко использо¬ вать методы упорядочения и выбора типовых спектров аналогично тому, как это делается для законов распреде¬ ления [43]. Примеры типовых АКФ и ВКФ и соответст¬ вующих им СПМ даны в [29, 35, 86]. Наконец, еще один вариант смешанного оценивания КФ (и СПМ) сводится к изначальной аппроксимации не R (гг) или 5 (А), а процессов или последовательностей X (t), У (t) различными типовыми каноническими, неканоничес¬ кими и прочими моделями, в частности описанными в § 1..3. В этом случае автоматически обеспечивается выбор вида типовых функций, аппроксимирующих КФ, СПМ. Кстати, в большинстве случаев при должном выборе ап¬ проксимирующих функций для СПМ и КФ (например, в ниде дробно-рациональных функций и их преобразований Фурье в первом и втором способах) мы фактически "аппро¬ ксимируем X(t), У(t). Подобные алгоритмы в настоящее время бурно развиваются как смешанные методы оцени¬ вания спектральных характеристик [63, 161] —линейные: скользящего среднего (СС-оценивание), дискретного пре¬ образования Фурье (ДПФ-бценивание) и нелинейные: ав¬ торегрессионные (АР-оценивание), максимальной энтро¬ пии (МЭ:оценивание), АРСС-оценивание, корреляционное обобщение авторегрессионных-методов (КАР-оценивание), гармонических разложений или собственных чисел Писа¬ ренко (ГР-оценивание), экспоненциальных разложений, Прони (ЭР-оцениванйе), адаптивной узкополосной филь¬ трации Кейпона (АФ-оцениванйе) и т. п. 256
7.6. ОЦЕНИВАНИЕ УСЛОВНЫХ МОМЕНТОВ Для условных моментов применимы все описанные вы¬ ше методы. В настоящее время чаще всего используются параметрические., реже — непараметричёские и. смешан¬ ные методы, наиболее развитые в приложении К оценкам регрессий, причем используются параметрические оценки как зависящие от вида распределения, так и свободные от вида распределения. В качестве последних можно при¬ вести оценки регрессий методами НК, НМ или непара- метрическймй приемами бценивания параметров. Напрй- мер, если X (f), Y(t) — стационарные ЛС-, ЛК-процессы с регрессиями (7.39), то параметрические оценки тх{хг\ t, Ит), thx{xi,'t, Н-т) или тх (у, t, t+x), m'r{x; t, /-(-т) могут быть найдены независимо от закона распределения Х(^), У(£) по формулам (7.39) с подстановкой в них вме¬ сто Тпх, тх, р (т), ах, о± любых непараметрическйх оце¬ нок, т. е. не обязательно ЭХ-оценок, как в методе НК. Из непараметрических оценок чаще всего, используются ЭХ- и БХ-оценки; в частности Я-оценкй. Рассмотрим по¬ добные оценки на примере 'оценивания тьх(у, т) = (О IУ(f+T) =*/} и iihX(y, т)=м{[X(t)-mx(y, t)]ft| У(/^-т)=у}. Полученные результаты полностью пе: реносятся на величины X, У заменой X(t)=X, У (^-рг)=У и на собственные характеристики функции X (t), если по¬ ложить Y(t)—X(t). Как и ранее, полагаем, что X(t), Y(t) стационарны и стационарно связаны с корреляционной функцией Дхг (т) —охотр (т). ЭХ-оцёнки имеют-вид inkx (у; *) =.Jf-T {** (01 {y{t+т) = у}}- У е [у — y ’ У+" +1Г). (7.104) Нх(У' х) = ^г{\.к— (у; + =у}}. (7.105) где sfc=y\, если fhx^=mu и >|<=V, если ;m,=mb Ау^О. Оценки tfih, pft являются асимптотически несмещенными при Ду-й). Дисперсии и корреляции оцёнок могут быть найдены по. формулам '§ 3.2, 7.1. с заменой безусловных, моментов в формулах § 7.1 на аналогичные условные [43]. Примеры дисперсий ЭХ-оценок условных, математических ожиданий т\х (у,'г) для разных распределений .можно найти, например,'в [85; 86]. Аналогично обобщаются ре- 17—192 257
зультаты ЭХ-оценивания безусловных и смешанных мо- • ментов на соответствующие условные смешанные момен¬ ты. БХ- и Я-о‘ценки рассмотрим на примере момента tnhY{xu ..., хп)=ткт(х) вектора У, Х\, ..., Хп [отсчетов функции X(t) в моменты X(t), X{ti), ..., X'(tn)j. БХ-оцен- ка определяется выражением > х) dy I * (7.106) где 1Р(у, х) — непараметрическая оценка плотности <n+i)№(y, х). Я-оценка thrY(x) может быть представлена в виде т„ (х) = ЛТ {y'k [(х- х)1Н\}/Лг {к [(х ~ х)/А]}. (7.107) Так же, как для оценок плотностей №(*), можно ре¬ шить задачу о выборе оптимальных функций ik(y) и коэф¬ фициентов А (Г) для оценок (7.107). 7.7. ОБ ОЦЕНИВАНИИ ДРУГИХ ХАРАКТЕРИСТИК Не имея возможности, подробно остановиться на оце¬ нивании других моментных, подобных им и производных от них характеристик, отметим следующее. Прежде всего для оценок характеристик, представленных, в табл. 1.1 и им подобных, вполне очевидно применение ЭХ- и БХ-оце- нивания. При ЭХ-оценивании йеобходимо оператор М за¬ менить на оператор Лт, случайные элементы на их реали¬ зации и используемые под знаком М теоретические харак¬ теристики на их ЭХ-оценки. При БХ-оценивании необходи¬ мо характеристики, используемые как базовые для введе¬ ния измеряемой характеристики, заменить их оценками. В частности, ЭХ-оценки множественных корреляционных' характеристик, корреляционных матриц и их собственных чисел рассмотрены в [9, 58, 63, 66, 72, 103, 106, 107, 116], ЭХ-оцёнки корреляционных отношений, дисперсионных функций — в [51, 86, 106], ЭХ-оценки структурных функ¬ ций — в [23, 111]. Например, ЭХ-оценка структурной функции 1-го рода Dix (t, т) (см. табл. 1.1, п. 33) имеет вид D1Jf (t, ,) =ЛГ {[K(t) -x(t-f t)]*}. {7.108) .258 Яу(х) = Jy*^(y. x)efy JtT(y . —OO L—OO
Для стационарных функций и функций со стационарными первыми приращениями имеем *)}=-D,x(*. ') = Dlx(t), (7.109) I а дисперсия оценки (7.108) определяется, формулами § 3.2 при вв (“5х) = 2 («) + 14 г (х — и)+Н-2.2 (—“ — •') — 2(4 2( J (и, т) 2, I ( "О | I, 1, 1 (^i ^ — 2(4 2.1 (х — м. т) — 2р.,. 21 (« + •')• (7-110) В приложении к оцениванию спектральных характеристик непараметрические методы реализуются следующим обра¬ зом. ЭХ-оценивание реализуется в виде узкополосной фильтрации (УФ-оценивание) или методом периодограмм (ПГ-оценивание). БХ-оценивание реализуется как преоб¬ разование Фурье оценки корреляционной функции (ПФ- оценивание). ДОФ-оценки получаются с использованием различных взвешивающих функций и реализуются, в ча¬ стности, в виде Я-оценок спектральных плотностей мощно¬ сти, подобных Я-оценкам плотности распределения веро¬ ятностей, когда весовые функции выбираются из условий оптимальности (см. работы В. Г. Алексеева, И. Г. Жур- бенко). ОР- и HP-оценивание осуществляется аналогично ОР- и HP-оцениванию корреляционных функций, а СДФ- оценивание аналогично подобному оцениванию для W (х). Для спектральных характеристик значительно чаще, чем для других характеристик, используются различные мето¬ ды с1 улучшенными показателями качества алгоритмов из¬ мерения спектра. Это — различные методы быстрых дис¬ кретных преобразований (БДП-оценивание)> склеивания, накопления, усреднения и секционирования выборки и из¬ меряемых характеристик, оценивание с помощью методов временного сдвига Колмогорова — Журбенко (ВС-оцени- вание), методы динамических усреднений и случайной вы¬ борки, трансформаций спектров и т. п., а также различ¬ ные линейные и нелинейные методы смешанного оценива¬ ния [161]. Vr 17*
ПОСЛЕСЛОВИЕ Резюмируя изложенное, выделим основные акценты ра¬ боты. ^ 1. Разработку, исследование и применение алгоритмов статистических измерений (АСЙ), так же как и всех дру¬ гих средств статистических измерений, необходимо прово¬ дить с системных позиций, руководствуясь системными принципами, в частности изложенными в работе. 2. Еще раз обратим внимание, на следующие особенно¬ сти разработки и применения АСИ. Одни'и те же прикладные задачи, решение которых основано на использовании результатов статистических измерений, можно решить; применяя различные модели и характеристики случайных элементов. Поэтому прежде чем приступать к измерениям, надо тщательно обосновать выбор объекта измерения -г измеряемой характеристики, а также модели исследуемого физического .объекта — слу¬ чайных элементов-с учетом полноты и качества результа¬ тов решения конкретной прикладной задачи, затрат на из¬ мерение и на решение всей задачи. Необходимо постоянно заниматься поиском и исследованием моделей-исследуемо¬ го физического объекта и подлежащих измерению харак¬ теристик, а также средств их измерения, наилучшим обра¬ зом соответствующих решаемой задаче. При выборе объекта и алгоритма измерения необхо¬ дим многокритериальный подход, когда предварительно обоснованные критерии охватывают все наиболее сущест¬ венные, значимые факторы, влияющие на достижение по¬ ставленной цели с заданным качеством при приемлемых или минимальных затратах. Средства статистических измерений должны удовлет¬ ворять требованиям полноты и минимальной избыточности, обеспечивать варьирование ресурсами, в частности обес¬ печивать выбор различных, дополняющих друг друга по разным показателям качества алгоритмов измерения одних и тех же характеристик. 260
При выборе АСИ необходимо прежде всего, руководст¬ воваться принципами устойчивости и универсальности и аккуратно подходить к практическому применёнию. опти¬ мальных алгоритмов в силу следующих обстоятельств: во- первых, из-за некорректности оптимальных алгоритмов (решение, оптимальное по одному критерию, как правило, не является оптимальным по другим критериям; небольшое нарушение условий, при которых существует оптимальная оценка, может привести к существенному отличию резуль¬ тата оценивания от оптимального); во-вторых, из-за необ¬ ходимости проверки выполнения и поддержания условий, при которых существует оптимальное решение; в-третьих, из-за необходимости обосновывать практическую целесооб¬ разность оптимального решения — затраты на получение оптимального решения могут не окупиться получаемым при этом- выигрышем, и т. п. Однако теоретическое иссле¬ дование и поиск оптимальных АСИ всегда целесообразны. Оптимальные, решения позволяют определить предельные, потенциально достижимые значения показателей качества и в силу этого, оценить эффективность всех других алго¬ ритмов по данному показателю, решить вопрос о целесо¬ образности разработки новых алгоритмов или о совершен¬ ствовании базовых алгоритмов в направлении улучшения данного показателя качества. При практическом примене¬ нии оптимальных алгоритмов необходимо выбирать их из класса устойчивых (робастных) алгоритмов. 3. При исследовании, разработке и описании средств статистических измерений целесообразно чаще использо¬ вать морфологический анализ. Как видно из работы, при¬ менение морфологического анализа к алгоритмам стати¬ стических измерений позволило осуществить декомпози¬ цию — «расчленить» их на составные части и затем рас¬ смотреть отдельно каждую часть, ее возможные реализа¬ ции, .выявить и исследовать общие принципы построения, свойства, сходство и отличие аналогичных оценок различ¬ ных характеристик случайных величин, векторов и функ¬ ций. 4. В работе с использованием декомпозиции’ рассмот¬ рены лишь основы алгоритмов оценивания в статистичё- ских измерениях в общем виде и в приложении к .типовым характеристикам случайных величин, векторов и функций. Приведены формулы (точные, приближенные или в виде неравенств, требующих минимума априорных данных) для расчета наиболее часто используемых специфичных для статистических измерений метрологических показателей
качества, характеризующих методические составляющие погрешностей измерений, в основном смещения, корреля¬ ции или дисперсии оценок либо связанных с ними показа¬ телей. Результаты работы являются основой для дальней¬ ших исследований алгоритмов по другим.показателям ка¬ чества, что в рамках данной; книги не считалось целесо¬ образным делать по следующим причинам. Во-первых, это не соответствует общему замыслу и назначению книги. Во-вторых, задачи и содержание подобных исследований существенно зависят от назначения,» от цели исследований. Например, исследование многих технических показателей качества алгоритма целесообразно проводить лишь с при¬ вязкой к практической реализации алгоритмов в виде"спе- циализированных (опять-таки аналоговых, цифровых или гибридных) или универсальных (например, на -основе ЭВМ) средств. В-третьих, не всегда можно провести не¬ обходимые исследования в общем виде, компактно; Так, если для многих непараметрических алгоритмов измерения конкретных характеристик можно указать объем вычисле¬ ний на уровне элементарных арифметических операций, то для многих парамётрических алгоритмов этого сделать нельзя. Например, количество арифметических операций для МП-оценок зависит от аналитического описания изме¬ ряемой характеристики, от количества неизвестных пара¬ метров,' от варианта реализации процедур поиска экстре¬ мальных значений функции правдоподобия и т. д. 5. Многие полученные’ в первых главах результаты представлены в общем виде с привязкой к конкретным из¬ меряемым характеристикам лишь через обобщенные пока¬ затели. Это позволяет читателю легко адаптировать их к используемым им характеристикам, не нашедшим отра¬ жения в книге. Например, многие результаты по статиче¬ ским и динамическим, непрерывным и дискретным алго- рйтмам могут быть легко перенесены на ЭХ-оценки раз¬ личных характеристик, допускающих представление через оператор усреднения по вероятностной мере соответствую¬ щего функционального преобразования от исследуемого случайного элемента.
\ СПИСОК ЛИТЕРАТУРЫ 1. Агарвал Р. К., Баррас К. С. Теоретико-числовые преобразования для быстрого вычисления цифровой свертки.—ТИИЭР, 1975, № 4, с. 6—20. 2. Айвазян С. А., Бежаева 3. И., Староверов ,0. В. Классифика¬ ция многомерных наблюдений. — М.: Статистика, 1974. —240 с. 3. Алексеев А. А. Обзор устойчивых методов оценивания.—г В кн.: Методы вычислительной математики и их применение. — М.: Наука, 1979, с. 51—63. 4. Алексеев В. Г. Некоторые практические рекомендации по спек¬ тральному анализу гауссовских стационарных случайных процессов.— Проблемы передачи информации, 1973, т. 9, № 4, с. 42—48. 5. Алимов Ю. И. Элементы теории эксперимента. — Свердловск: Уральский политехи, ин-т, ч. I—III, 1978.—275 с. 6. Андерсон Т. Статистический анализ временных рядов. — М.: Мир, 1976. — 759 с. 7. Андреев Н. .И. Теория' статистически оптимальных систем управления. — М.: Наука, 1980. — 416 с. 8. Бакут П. А., Логинов В. П., Шумилов Ю. П. Методы опре¬ деления границ точности в задачах оценивания неизвестных пара¬ метров.— Зарубежная радиоэлектроника, 1978, № 5, с. 3—36; № 6, с. 3—28. 9. Бард И. Нелинейное оценивание параметров. — М.: Статисти¬ ка, 1979.— 349 с. 10. Бартлетт М. С. Введение в теорию случайных процессов.— М.*.' Изд-во иностр. лит.* 1958. — 384 с. 11. Бачйло С. А. Погрешности определения одномерной плотно¬ сти вероятности и ее производных. — Тр. ХГ Всесоюзного симпозиу¬ ма «Методы представления и аппаратурный анализ случайных про¬ цессов и полей». — Л.: ВНИИЭП, 1980*it. 1, с. 76—82. 12. Бейтмен Г., Эрдейи А. Высшие трансцендентные функции.— М.: Наука, т. 1, 1965. —296 с.; т. 2, 1966. —296 с.; т; 3, 1967. — 300 с. / 13. Белл Р. Дж. Введение в Фурье-спектроскопию: Пер. с англ.:— М.: Мир, 1975. — 384 с. 14. Бергланд Г. Д. Руководство к быстрому преобразованию Фурье.-г* Зарубежная радиоэлектроника, 1971, № 3, с. 152—72. 15. Блохин А. В. Аппаратурный анализ характеристик случай¬ ных процессов. — М.: Энергия, 1976. —96 с. 16.. Большаков И. А.* Ракошиц В. С. Приложение ортогональных систем дискретных функций- к микропроцессорной обработке ^сигна¬ лов.—Техническая кибернетика, 1977, . Ш 5, ч. 1, с. 143—157:. № 2, ч. 2, с. 142—156. 263
17. Борджоли Р. К. Вычисление корреляции с помощью быстрого преобразования Фурье в сравнении с прямым методом временной дискретной корреляции. — ТИИЭР, 1968,. № 9, с. 213—215. 18. Бостанджиян В. Д. Определение плотности вероятности. Необ¬ ходимый объем выборки. — М.: Наука, 1971.— 160 с. 19. Бриллинджер Д. Временные ряды. Обработка данных и тео¬ рия: Пер. с англ. — М.: Мир, 1980. — 536 с. 20. Веселова Г. -П. О методе уменьшения дисперсии при .стоха¬ стическом квантовании. — Автоматика и телемеханика, 1980, '№ 4, с. 87—90. 21. Виленкин С. Я. Статистические методы исследования систем автоматического регулирования. — М.: Советское радио, 1967. — 200 с. 22. Виленкин С. Я. Статистическая обработка результатов иссле^ дования случайных функций: — М.: Энергия, 1979. — 320 с. 23. Виленкин С. Я-, Гейдаров Т. Г. Некоторые^ статистические во¬ просы случайных процессов со стационарными приращениями.— Автоматика и телемеханика, 1976, № 7, с. 178—183. 24. Виленкин С. Я., Набатов Ю. А. Смещенные оценки автокор¬ реляционной функции гауссовских стационарных случайных, процес¬ сов и последовательностей. — Автоматика и телемеханика, 1981, № 5» с. 60—66. 25. Воллёрнер Н. Ф. Аппаратурный спектральный анализ сигна¬ лов. — М.: Советское радио, 1977. — 208 с. 26. Галушкин А. И., Зотов Ю. Я;, Шикунов Ю. А. Оперативная обработка экспериментальной информации. — М.: Энергия, 1972.-- 360 с. 2Т. Гармонический анализ на группах в абстрактной теории си¬ стем. Межвузовский сборник.—Свердловск: Уральский политехи, ин-т, 1976.—156 с. 4 28. ГасКаров Д. В., Шаповалов В. И. Малая выборка. — М.: Статистика, 1978. — 248 с. 29. Гельфандбейн Я. А. Методы кибернетической диагностики ди¬ намических систем. — Рига: Зинатне, 1967.— 543 с. "30. Геранин В. А. О существовании оптимума каналов ^ортогональ¬ ного статистического анализатора. — Тр. IV Всесоюзного "симпозиума «Методы представления и аппаратурный анализ случайных процессов и полей». —Л.: ВНИИЭП, 1971, т. 4, с. 33—37. 31. Градштейн И. С., Рыжик И. М. Таблицы интегралов, сумм, ря¬ дов и произведений. — М.: Физматгиз, 1976.—1100 с. 32. Грибанов Ю. И., Веселова Г. П., Андреев В. Н. Автоматиче¬ ские цифровые корреляторы. — М.: Энергия, 1971.—240 с. 33. Грибанов ‘ЮгП., Мальков В. Л. Выборочные оценки спектраль¬ ных характеристик стационарных случайных процессов. — М.: Энергия, 1978.—152 с, 34. Голд Б., Рейдер Ч. Цифровая обработка сигналов.—М.: Со¬ ветское радио, 1973.—368 с. 35. Горяйнов В. Т., Журавлев В. Г., Тихонов В. И. Статистическая радиотехника. Примеры и задачи.— М.: Советское радио, 1980.—544 с. 36. Губарев В. В. Дисперсия динамических оценок, вероятностных характеристик • эргодических стационарных случайных > процессов. — Автоматика и телемеханика, 1974, № 3, с. 37—44. 37. Губарев В. В. Линейно-коррелированные и линейно-связанные случайные процессы.—Тр., IX Всесоюзного симпозиума «Методы пред¬ ставления и аппаратурный анализ случайных процессов и полей».—Л.: ВНИИЭП, 1976, т.-З, с. 36—43. 38. Губарев. В. В. О погрешности определения корреляции при 264
использовании квантования по уровню.—В кн.: Автоматическое управ¬ ление. Вычислительная техника. — Новосибирск: Зап.-Сйб. кн. изд-во, 1569, вып. 1, с. 53—63. 39. Губарев Bv В. О смещении динамических оценок вероятностных характеристик случайных процессов.—Тр. V Всесоюзного симпозиума «Методы представленияи аппаратурный анализ случайных процессов и полей».—Л.: ВНЙИЭП, 1972, т/3, с. 109—114. 40. Губарев В. В. Об общей теории оценивания' характеристик слу¬ чайных процессов.—Тр. I Всесоюзной конференции «Теория и прак¬ тика измерений статистических (вероятностных) характеристик».—Л.: ВНИИЭП, 1973, с. 17—31. 41. Губарев В. В. Погрешности непосредственного и знаковых спо¬ собов измерения корреляции по ограниченным данным. — Автометрия, 1968, №-4, с. 3—18. 42. Губарев В. В. Сравнение непосредственного и релейного мето¬ дов измерения корреляции, -г- Тр. II Всесоюзного симпозиума «Методы представления и аппаратурный анализ случайных процессов и полей».— Новосибирск: СНИИМ, 1969, т. 2, с. 196—201. 43. Таблицы характеристик случайных величин и векторов/В. В. Гу¬ барев.— Новосиб. электротехн. ин-т: Новосибирск, 1980.—225 с. Ру¬ копись деп. в ВИНИТИ 26.06.1981, № 3146—81 Деп. 44. Губарев В. В., Панова М. А* Корреляционные взвешивающие функции и их аналоги. — В кн.: Измерительные информационные системы: Межвуз. сб. научн. тр. — Новосибирск: НЭТИ, 1978, с. 54—68. 45. Губарев В. В., Постоенко Ю. К. Неравенства для среднеквад¬ ратических погрешностей оценок вероятностных характеристик случай¬ ных процессов. — Тр. II Всесоюзного симпозиума «Методы представ¬ ления и аппаратурный анализ случайных процессов и полей». —Ново¬ сибирск: СНИИМ, 1969, т. '2, с. 16—21. 46. Джапаридзе К. О. Асимптотически эффективное оценивание параметров спектра гауссовского временного ряда.— Тбилиси: Изд-во Тбил. ун-та, 1977,—129 с. 47..Джапаридзе. К. О. Методы, оценки параметров- стационарных случайных сигналов с рациональным спектром. — Проблемы передачи информации, 1973, т. IX, вып. 4, с. 33—41. 48. Джапаридзе К. О. Новый метод оценки параметра спектра регулярного, стацибнарного-процесса с дискретным временем.—Теория вероятностей и ее приложения, 1974, т. 19, вып. № 1, с. 120—130. 49. Джапаридзе К. О. О методах нахождения асимптотически эф¬ фективных оценок параметра спектра гауссовского стационарного про¬ цесса с рациональной плотностью. — Теория вероятностей и ее прило¬ жения, 1977, т. 16, № 3, с. 562—567. 50. Дженкинс Г., Ватте Д.- Спектральный анализ и его приложения: Пер. с англ.—М.: Мир, ч. 1, 1971.—317 с.; ч. 2, 1972.—288 с. 51. Дисперсионная идентификация/ Н. С. Райбман, В. В. Кагшто- иенкб, Ф. А. Овсепян, П. М. Варлаки. — М.: Наука, 1981.—366 с. 52. Дмитриев А. А. Ортогональные экспоненциальные функции в гидрометеорологии. — Л.: Гидрометеоиздат, 1973.—120 с. п 53: Домарацкий А. Н., Иванов JI. Н., Юрлов Ю. И, Многоцелевой статистический анализ случайных сигналов. — Новосибирск: Наука, Сибирское отд-ние, 1975.—164 с. 54. Дубовский В. В. Метод определения основных параметров авто¬ корреляционной функции стационарного случайного* процесса. — Авто¬ матика и телемеханика, 1977, № 2, с. 177—180. 55. Дюге Д. Теоретическая и прикладная статистика. — М.: Наука, 1972.—384 с. 265
56. Ершов А. А. Стабильные методы оценки параметров: Обзор,— Автоматика и телемеханика, 1978, №. 8, с. 66—100. 57. Зажигаев JI. С., Кишьян А. А., Романиков Ю. И. Методы пла¬ нирования и обработки результатов физических экспериментов. — М.: Атомиздат, 1978.—232 с. 58. Закс Ш. Теория статистических выводов. — М.: Мир, 1975.—г 776 с. 59. Ибрагимов И. А. Об оценке методом максимального правдопо¬ добия параметров спектральной плотности стационарного процесса. — Теория вероятностей и ее приложения, 1967, т. XII, № 1, с. 128—134. v 60. Ибрагимов И. А., Хасьмицский Р. 3. Асимптотическая теория оценивания.—М.: Наука, 1979.—528 с. 61. Иванов А. В. Об оценке параметра корреляционной функции стационарного процесса. — Теория случайных процессов, 1979, № 7, с. 45—53. 62. Исаенко О. К., Урбах В. Ю. Разделение смесей распределений вероятностей на их составляющие.—В кн.: Итоги науки и техники. Сер. Теория вероятностей. Математическая статистика. Теоретическая кибернетика. — М.: ВИНИТИ, 1976, т. 13, с. 37—58. 63. Кей С. М., Марпл С. JI. Современные методы спектрального анализа: Обзор.— ТИИЭР, 1981, т. 69, № 11, с. 5—51. 64. Кендалл М. Дж., Стьюарт А. Многомерный статистический ана¬ лиз й временные ряды. — М.: Наука, 1976.—736 с. 65. Кендадл М. Дж., Стьюарт А. Статистические выводы и свя¬ зи.—М.: Наука, 1973.—900 с. 66. Кендалл М. Дж., Стьюарт А. Теория распределений.—М.: Нау¬ ка, 1966.—588 с. 67. Классификация и кластер. — М.: Мир, 1980.—39£ с. 68. Кобринскйй Н. Е. Информационные фильтры в экономике. Ана¬ лиз одномерныхч временных рядов.— М.: Статистика, 1978.—287 с. 69. Кокс Д., Льюис П. Статистический анализ последовательностей событий. — М.: Мир, 1969.—312 с. 70. Кондаков Н. И. Логический словарь-справочник. — 2-е изд., перераб. и испр. — М.: Н)аука, 1975.—720 с. 71. Крамер Г. Математические методы статистики. — М.: Мир, 1975.—648 с. 72. Куликов Е. И., Трифонов А. П.. Оценка параметров сигналов на фоне помех. — М.: Советское радио, 1978.—296 с. 73. Курочкин С. С. Многоканальные счетные системы и коррело¬ метры.— М.: Энергия, 1972.—344 с. 74. Лабунец В. Г., Ситников О. П. Неканонические разложения случайных процессов и их приложения к корреляционнсщу анализу.— Тр. X Всесоюзного симпозиума «Методы представления и аппаратур¬ ный анализ случайных процессов и полей». — Л.: ВНИИЭП, 1978, т. 3, с. 89—94. 75. Левин Б. Р. Теоретические основы статистической радиотехни¬ ки.— М.: Советское радио, т. 1,' 1974.—552 с.;>т. 2, 1975.—392 с.;. т. 3, 1976 — 288 с. 76. Лемешко В. Ю. Оценивание параметров распределений па группированным наблюдениям. — В кн.: Вопросы кибернетики; — М.: 1977, вып. 30, с. 80—96. 77. Лившиц Н. А., Пугачев В. Н. Вероятностный анализ систем автоматического управления.—М.: Советское радио, 1963, т. 1.—896с.; т. 2.-484 с. 78. Линьков Ю. Н. О неравенствах типа неравенства Крамера— Рао и асимптотической достаточности статистических оценок. — В кн.: 266
Теория вероятностей и 'математическая статистика. — Киев: 1978, № 19, с. 92—111. 79. Лифшиц И. А., Олевская Е. А., Абрамович В. И. Статистиче¬ ская теория оценивания. Библиографический указатель.—Л.: -Наука, Ленингр. отд-ние, 1976.—188 с. 80. Лихарев В. А. Цифровые методы и устройства в радиолока¬ ции—М.: Советское радио, 1973.—456 с. 81. Лумельский Я. П. Статистические оценки результатов контро¬ ля качества. — М.: Изд-во стандартов, 1979.—200 с. 82. Малахов А. Н. Кумулянтный анализ негауссовых случай¬ ных процессов и их преобразований. — М.: Советское радио, 1978.— 376 с. 83. Маркюс Ж. Дискретизация и квантование. — М.: Энергия, 1969. — 144 с. 84. Мартынов В. А., Селихов Ю. И. Панорамные приемники и ана¬ лизаторы спектра. — М.: Советское радио, 1980. — 352 с. 85. Мирский Г. Я. Аппаратурное определение характеристик слу¬ чайных . процессов.—М.: Энергия, 1972.—456 с. 86. Мирский Г. Я. Характеристики стохастической взаимосвязи и их измерения. — М.: Энергоатомиздат, 1982.—320 с. 87. Морозов А. М., Судаков Д. М. О. дисперсии оценок среднего значения стационарного случайного процесса. — Вопросы вычислитель¬ ной техники и управления, 1978, т. 18, № 2, с. 182—191. 88. Москанов Н. Д. О статистических погрешностях вычисления мо¬ ментов высоких порядков одномерных законов распределения случай¬ ных процессов^—Тр. IX Всесоюзного симпозиума «Методы, представ¬ ления и аппаратурный анализ случайных процессов и полей».—Л.: ВНИИЭП, 1976, т. 1, с. 54—57: w 89. Мудров В. И., Кушко' В. Л. Методы обработки измерений (ква¬ зиправд оподобные оценки).—М.: Советское радио, 1976.=—192* с. 90. Ольховский Ю. Б., Новоселов О. Н., Мановцев А. П. Сжатие данных при телеизмерениях.—М.: Советское радио', 1971 —304 с. 91. Ольшевский В. В. Декомпозиция как метод построения акусти¬ ко-океанологических имитационных моделей.—Препринт № 38.—Львов: Физико-механический ин-т АН УССР, 1980.-72 с. 92. Ольшевский В. В. Многомерный статистический анализ и ими¬ тационное моделирование в акустико-океанологических исследованиях.— Тр. Пятой научно-технической конференции по информационной аку¬ стике.—М.: АКИН АН СССР, 1980, с. 21—32. 93. Ольшевский В. В. Основы теории статистических измерений.— Таганрог: ТРТИ, 1976.-—107 с. 94. Ольшевский В. В. Статистические методы в гидролокации. —Л.: Судостроение, 1973.—184 с. * 95.* Ольшевский В. В., Миддлтон Д. Современная метрология экс¬ периментальных акустико-океанологических исследований.—Тр. Третье¬ го семинара «Акустические статистические модели океана».—М.: АКИН АН СССР, 1981, с. 76-87. 96. Ольшевский В. В., Мухина А. Ю. Методы построения двумер¬ ных полиграмм на ЭВМ.—Тр. Четвертой Всесоюзной конференции по информационной акустике.— М.: АКИН АН СССР, 1978, с. 59—64. 97. Патрик Э. А. Основы теории распознавания образов. — М.: Со¬ ветское радио, 1980. — 408 с. 98. Петров В. В. Суммы независимых случайных „ величин. — М.: Наука, 1972.—416 с. 99. Пираношвили 3. А., Хуцишвили Н. Г. Об одном методе оцени¬ вания корреляционной функции и спектральной плотности стационар- 267
ного случайного процесса. — Сообщения АН ГССР, 1977, т. 86, № 2; с. 313—316. 100. Полляк Ю. Г. Вероятностное моделирование на электронных вычислительных машинах. —М.: Советское радио, 1971.—400 с. II. Пугачев В. Н. Комбинированные методы Определения вероят¬ ностных характеристик. — М.: Советское радио, 1973.—256 с. 102. Пугачев В. Н., Шапиро Е. И. Параметрическая. оценка зако¬ нов распределения. — Зарубежная радиоэлектроника, 1975, № 2, с. 3—27. 103. Пугачев В. С. Теория вероятностей и математическая стати¬ стика.—М.: Наука, 1979.—496 *с. 104. Пугачев В. С. Теория случайных функций и ее применение к задачам автоматического управления. —»М.: Физматгиз, 1962.—884 с. 105. Рабинер JI., Гоулд Б. Теория и применение цифровой обработ¬ ки сигналов, -у М.: Мир, 1978.—848 с. 106. Райбман Ц. С., Чадеев В. М. Построение моделей процессов производства. — М.: Энергия, 1975.—376 с. ' 107. Рао С. Линейные статистические методы и их применение. — М.: Наука, 1968.-548 с. 108. Расчет систем управления на ЦВМ: Спектральный и интерпо-" ляционный методы/ В. В. Солодовников, В. В. Семенов, М. Пешель, Д. Недо. — М.: Машиностроение; Берлин: Ферлаг Техник, 1979— 664 с. 109. Рожков В. А. Методы вероятностного анализа океанологиче^ ских процессов. — Л.: Гидрометеоиздат, 1979.—280 с. 110. Розенберг -В. Я. Введение в теорию точности измерительных систем..—М.: Советское радио, 1975.—304 с. III. Романенко А. Ф., Сергеев Г. А. Вопросы прикладного анали¬ за случайных процессов. — М.: Советское радио, 1968.—256 с. 112. Саридис Дж. Самоорганизующиеся стохастические системы управления.—М.: Наука, 1980.—400 с. ' 113. Смоляк С. А., Титаренко Б. П. Устойчивые методы, оценива¬ ния (Статистическая обработка неоднородных совокупностей).—М.: Статистика, 1980.—208 с. 114. Соболь И. М. Численные методы Монте-Карло. — М.: Наука, 1973.—312 с. - ' - 115. Сологуб Е. И., Шац М. X., Шутов Л. П. Аппроксимация за¬ конов распределения кривыми Пирсона и Грама — Шарлье на ЭЦВМ.— В. кн.: Математические методы ЭВМ в Ьбогащении. — М.: Недра, 1971, с. 4—32. 116. Справочник по теории вероятностей и математической стати¬ стике/ В. С. Королюк, Н. И. .Портенко, А. В. Скороход, А. Ф. Тур¬ бин.— Киев: Наукова думка, 1978.—584 с. 117. Статистическая классификация, основанная на выборочных распределениях/ В. Н. Иголкин, А. Б. Ковригин, А. И. Старшинов; В. А. Хохлов. — Л.: Изд-во ЛГУ, 1978.—104 с. 118. Статистические методы в экспериментальной физике/ В. Идье, Д. Драйард, Ф.. Джеймс и др.— М.: Атомиздат, 1976—335 с. 119. Стогов Г. В., Макшанов А. В., Мусаев А. А. Статистическая обработка результатов измерений по неполной выборке. — Зарубежная радиоэлектроника, 1979, № 10, с. 3—21. 120. Тарасенко Ф. П. Непараметрическая статистика. — Томск: Изд- во Томск' ун-та, 1976.—294 с. - " 121. Темников Ф. Е., Афонин В. А., ДмитриевгВ. И. Теоретические основы информационной техники.— М.: Энергия, 1979.—512 с. 268
122. Ткачев Ю. А., Юдович Я. Э. Статистическая обработка геохи¬ мических данных.—Л.; Наука. Ленингр. отд-ние, 1975.—233 с. 123. Трахтман А. М., Трахтман В. А. Основы теории дискретных сигналов на конечных интервалах.—М.: Советское радио, 1979.—208 с. 124. Уилкс С. Математическая статистика.—М.: Наука, 1967.— 632 с. 125. Филаретов Г. Ф. Статистические погрешности измерения кор- рёляционных функций марковских процессов. — Тр. X Всесоюзного симпозиума «Методы представления и аппаратурный анаддз случайных процессов и полей».—Л.: ВНИИЭП, 1978, с. 50—59. 126. Фукунага К. Введение в статистическую теорию распознава¬ ния образов: Пер. с англ.—М.: Наука, 1979.—368 с. 127. Хан Г., Шапиро С. Статистические модели в инженерных зада¬ чах: Пер. с англ:—М.: Мир, 1969.—395 с. 128. Хеннан Э. Анализ временных рядов. — М.: Наука, 1964.—276 с. 129. Хеннан Э. Многомерные временные ряды. — М.: Мир, 1974.— 576 с. 130. Хэррис Ф. Дж. Использование окон при гармоническом ана¬ лизе методов дискретного преобразования Фурье.— ТИИЭР, 1978, ъбб, № 1, с. 60—96.^ 131. Цветков 3. И. Основы теории статистических измерений.—М.: Энергия, 1979.—288 с. 132. Цыпкин Я. 3. Обучающиеся системыГ Элементы теории и при¬ менения.— Измерения, контроль, автоматизация, -1978, № 3 (15), с. 25—37. ' 133. Ченцов Н. Н. Статистические решающие правила и оптималь¬ ные выводы..^М.: Наука, 1972.—520 с. 134. Чернецкий В. И. Анализ точности нелинейных систем управ¬ ления.— М.: Машиностроение, 1968.—246 с. 135. Чернявский А. Ф., Бекетов С. В., Потапов А. В.-Статистиче¬ ские методы анализа ^случайных сигналов в ядерно-физическом экспе¬ рименте.— М.: Атомиздат, 1974. — 852 с. 136. Шапиро Ет И. Непараметрические оценки плотности вероятно¬ сти в задачах х обработки результатов наблюдений. — Зарубежная’ра¬ диоэлектроника, 1976, №2, с. 3—36. ,137. Abdrabb N. A. New Approach to the Problem of estimating spec¬ tral parameters of non-stajionary time series models: — J. Commutat. and AppL Math., 197.9, vol. 5, №_ 2, p. 125—129. 138. Anderson O. D. A complete proof -of a time series inequality with some implications. — Statistics,' 1978, vol. 38, JSfe 2, p. 189—206. 139. Blum Yv Susarla V. A Fourier inversion method for the esti¬ mation of a density and its derivatives. — J. Austral. Math. Soc., 1977, vol. 23, № 2, p. 166—171. 140. Deheuvels P. Estimation npn parametrique de is densite par histogrammes generalises.— Rev. Statist: 'Appl., 1977, vol. 25, № 3, p. 5—42. 141. Deheuvels P. Estimation non parametrique de is densite par histogrammes generalises (II). — Pub. Inst. Stat. Univ. Paris, 1977, vol. XXII, №Л, 1, p. 1—24. 142. Drbssos C. A., Philippou A. N. A Note on minimum distance estimates. — Ann. Inst. Statist Math., 1980, vol. 32, № 1, p. 121—123. 143. Dzhaparidze К. O., Jaglom A. M. Asymptotically efficient esti¬ mation of the spectrum parameters of stationary stochastic processes: — Proceedings of the ^Prague symposium on .Asymptotic Statistics. — Pra¬ gue: Caarles Univ. Press, 1974, p. 55—105. .269
144. Elderton W. P., Johnson N. L. Systems of Frequency Curves.— Cambridge University Press, 1965. — 216 p. 145. Gaensler P., Stute W. Empirical processes: a survey of results for independent and identically distributed random variables. — Ann. Pro- bab., 1979, vol. 7, N° 2, p. 193—243. 146. Gaster М., Roberts J. B. Spectral Analysis of Ramdomly Sam¬ pled Signals. — J. Inst. Math. Applies, 1975, vol. 15, p. 195—216. 147% Holgersson М., Jorner U. Decomposition of a mixture into nor¬ mal components: a review — Inf. J. Bio-Med. Comput., 1978, vol. 9, N° 5, p. 367—392. 148. Hominal P., Deheuvels P. Estimation non parametrique de la densite comptetenu d’informations sur le support. — Rev. statist. Appl., 1979, vol. XXVII, N° 4, p. 1041—1064. 149. Kleiner B., Martin R. D., Thomson D. J. Robust estimation of power spectrum.— J. Roy Statist. Soc., 1979, vol. B41, N° 3, p. 313—351. 150. Ng. Vee Ming. On the estimation of parametric density func¬ tions. — Biometrika, 1980, vol. 67, N° 2, p. 505—506. 151. Pakula L. Convergence fates of к/ri/ — nearest neighbor density estimates. — Analele stintifice =ale iniversietii; «А1. I. Cuza», Iasi, 1978, see. I, t. 24, N° 2, p. 375—378. 152. Parzen E. On sonsistent estimates of the spectrum of a statio¬ nary time series.—.Ann. Math. Statist., 1957, vol. 28, N° 2, p. 329—348. 153. Parzen E. Non-parametric Statistical Data Modeling.— J. Amer. Statist., 1979, vol. 74, N° 365, p. 105—131. 154. Rice J. On the estimation of the parameters of a power spect^ rum. — J. Multivar. Anal., 1979, vol. 9, № 3, p. 378—392. 155. Robinson P. M. Alternative models for stationary stochastic pro¬ cesses. — Stochast. Process, and Appl., 1978, vol. 8, N° 2, p. 141—152. 156. Shenton L. R., Bowman K. O. A Bivariate Model for the Distri¬ bution of bi and l>2. — J. Amer. Statist. Assoc., 1977, vol.- 72, N° 357, p. 206—211. 157. Slifker J. F., Shapiro S. S. The Johnson system: Selection and parameter estimation. — Technometrics, 1980, vol. 22, № 2, p. 239—248. 158. Steele J. M. Invalidity of average squared error criterion in den¬ sity estimation.— The Can: J. Statist., 1978, vol. 6. N° 2, p. 193—200. 159. Sterbucher H. On non-parametric multivariate density estima¬ tion.— Rev. roum. math, pures et appl.,-1980, vol. 25, № 1, p. Ill—118. 160. Woodward W. A. Subroutines for computing minimum variance unbiased estimators of functions of the parameters ’ in the normal and gamma distributions. — Commut. Statist., 1977, vol. B6, N° 1, p. 63—73. 161. Современные методы оценивания спектральных характеристик случайных функций/ Губарев В. В.; Новосиб. электротехн. ин^т. Ново¬ сибирск, 1984. 205 с. Рукопись деп. в ВИНИТИ 4.07.1984, N° 4664—84. /Деп.
ОГЛАВЛЕНИЕ Предисловие 3 Введение 5 Глава первая. Алгоритмы статистических измерений как объект исследования с системных позиций 12 1.1. Вводные замечания .... 12 1.2. Основные системные принципы и правила в приложении к методам и средствам многофункциональных статисти¬ ческих измерений и анализа (МСИА) 12 1.3. Объекты статистических измерений 16 1.4. Морфологический анализ алгоритмов . 30 1.5. Типовые принципы и показатели качества алгоритмов статистических измерений 39 Глава вторая. Типовые параметрические и непараметрические алгоритмы 52 2.1. Вводные замечания . . . 52 2.2. Параметрические алгоритмы 56 2.3. Непараметрические алгоритмы 74 2.4. Смешанные алгоритмы 80 Глава третья..Алгоритмы, связанные с дискретизацией ар¬ гументов 92 3.1. Сплошные и решетчатые алгоритмы . 92 3.2. Непрерывные и дискретные алгоритмы 100 3.3. Статические и динамические алгоритмы 113 3.4. Рекуррентные и итерационные алгоритмы 119 3.5. О других алгоритмах таблицы 1.3 127 Глава четвертая. Параметрическое оценивание одномерных характеристик . 128 4.1. Вводные замечания^ .... . 128 4.2. Оценивание параметров положения а и масштаба К распределений . . ... 130 4.3. Оценки -параметров типовых распределений . . . 134 4.4. Параметрическое оценивание функций и плотностей рас¬ пределения вероятностей .... . . . 146 4.5. Параметрическое оценивание одномерных производящих, характеристических, семиинвариантных функций и число¬ вых характеристик 150 271
Глава пятая. .Параметрическое оценивание многомерных и условных характеристик . 152 5.1. Общие замечания о параметрическом оценивании много-, мерных, и условных характеристик . . . 152 5.2. Оценивание параметров и параметрическое оценивание корреляционных функций . . .153 5.3. Оценивание параметров спектральной плотности мощно¬ сти и параметрическое оценивание спектральных харак¬ теристик ... . . . . . 169 5.4. О параметрическом оценивании других характеристик 173 Глава шестая. Непараметрическое оценивание законов рас¬ пределения 173 6.1. Вводные замечания .... 173 6.2. Метод эмпирических характеристик 175 6.3. Метод дельта-образных функций 180 6.4. Метод ближайших соседей 189 6.5. Метод полиграмм .... 190 6.6. Метод сглаженных дельта-функций . . 193 6.74 Метод ортогональных разложений (проекций) 195 6.8. Метод неортогональных разложений 200 6.9. Прочие методы . . 201 6.10. Смешанные методы. Аналитическое описание оценок 201 6.11. Пояснения и практические рекомендации 205 Глава седьмая. Непараметрическое оценивание моментных характеристик . ► 210 7.1'. Оценивание одномерных числовых характеристик . . 210 7.2. Оценивание смешанных моментов произвольных порядков 224 7.3. Оценивание ненормированных корреляционных функций 226 7.4. Оценивание нормированных - корреляционных функций 249 7.5. Смешанные алгоритмы оценивания корреляционных 255 функций. Аппроксимация, аналитическое описание оценок 7.6. Оценивание условных моментов ' . . 257 7.7. Об .оценивании других характеристик 258 Послесловие . 260 Список литературы 263