Текст
                    . ЧЕТЫРКИН
СТАТИСТИЧЕСКИЕ
ЕТОДЫ
ПРОГНОЗИРОВАНИЯ


Четыркин Ei М- 454 Статистические методы прогнозирования. Изд. 2-е, перераб. и доп. М., «Статистика», 1977. 200 с. с ил. Эта книга о статистических методах, применяемых при прогнозировании экономических показателей. Автор рассматривает пути использования трендов и регрессий, проблемы обработки динамических рядов, оценки параметров различного рода кривых и доверительных интервалов. В специальном лриложении рассматриваются математические основы нелинейного метода .наименьших квадратов. В работе анализируются предпосылки и условия применения соответствующих методов прогностического анализа. Книга рассчитана иа специалистов, занимающихся проблемами прогнозирования. „ 10805-020 Л ^ 21-77 33 008(01)-77 © Издательство «Статистика», 1977
ВВЕДЕНИЕ Лучшие ученые занимались предсказаниями. Если следующим поколениям и казались смешными способы, применявшиеся предшествующими, то ни одно поколение не избежало пренебрежительной иронии последующего. В. Иванов. Русь великая В недавнем прошлом прогнозирование как специфический вид научного анализа находило более или менее широкое применение в области естественных явлений (прогноз погоды, паводков, урожайности и т. д.), ныне оно охватило самые различные сферы деятельности людей: политику, международные отношения, экономику, научно-технический прогресс, демографические и социальные процессы, образование и т. д. Формируется новее научное направление— прогностика, в котором на основе синтеза методов, заимствованных из философии, социологии, статистики, математики, и собственных методов разрабатываются -общие научные основы прогнозирования и определяются перспективные оценки развития общественных процессов и явлений. Интерес к будущему вытекает из непосредственной и острой практической потребности сегодняшнего дня. Необходимость предвидения вероятного исхода событий в будущем никогда прежде не была столь насущной, как сейчас. Это прежде всего связано с бурным развитием мирового революционного процесса, высокими темпами научно-технического прогресса и многими другими явлениями современности. Предвидение событий дает возможность заблаговременно приготовиться к ним, учесть их положительные и отрицательные последствия, а если это возможно.— вмешаться в ход развития, контролировать его, и что более важно — работать для претворения в жизнь одной из выявленных альтернатив будущего. Предстоящие крупные сдвиги в области науки, техники, социальных отношений, отдаленные от нас на десятки лет, в той или иной мере коренятся в событиях сегодняшнего дня. Решения, принимаемые сегодня, опираются на оценки развития явлений в будущем; в свою очередь они в большей или меньшей степени воздействуют на это будущее. 1* 3
Плановое ведение хозяйства вовсе не устраняет необходимость в прогнозах. Всякий народнохозяйственный план осуществляется в обстановке, отдельными элементами которой мы не можем полностью (погода) или частично (некоторые явления международной жизни, демографические процессы) управлять, т. е. изменять в соответствии с целями и задачами своей деятельности. Таким образом, имеется целый ряд явлений и процессов, непосредственно не охватываемых народнохозяйственными планами и вместе с тем существенно влияющих на развитие народного хозяйства./Разрабатываемые для таких процессов прогнозы вооружают плановые органы различного рода предплановыми материалами и оценками, позволяющими более глубоко и всесторонне обосновать тот или иной вариант хозяйственного плана/ более точно учесть влияние действующих или назревающих тенденций в различных областях деятельности человека *. Руководящая роль Коммунистической партии, осуществляемая ею научная организация развития общества требует «безбоязненного предвидения будущего и смелой практической деятельности, направленной к его осуществлению»2. Важные задачи в области дальнейшего совершенствования управления экономикой, планирования ее развития, и улучшения организации производства поставлены нашей партией перед экономической наукой. Особую роль при решении этих задач приобретает прогнозирование. Масштабы, а главное, темпы развития и сложность общественных, в том числе экономических, связей определяют важность повышения надежности перспективных оценок, необходимость дальнейшего совершенствования методологии прогнозирования, распространения и совершенствования имеющихся, разработки новых методов, применяемых при прогнозировании. ПРОГНОЗ И ПРОГНОЗИРОВАНИЕ Прежде чем перейти к изложению существа дела, сделаем несколько замечаний о содержанки некоторых терминов, употребляемых в экономической прогностике. Дело в том, что развивающийся и еще не установившийся характер прогностического подхода к общественным явлениям, самой прогностики как совокупности методологических представлений и методических приемов в рамках такого подхода обусловил значительную неопределенность, а иногда и субъективность содержания, которое вкладывается различными исследователями в эти термины. Под прогнозированием мы понимаем научное (т. е. огшшштгюе на системе фактов и доказательств, установленных причинно следственных связей) выявление вероятных путей и результатом ирод- 1 Вопросы, связанные с определением места и функции пропит н пттмг народнохозяйственного планирования, достаточно подробно ргнтмптрты и работе «Научные основы экономического прогноза» (М., «Мысль-. М>'/1. г.п I, <* Л) м в целом ряде статей. 2 Ленин В. И. Соч., т. 26, с. 75. 4
стоящего развития явлений и процессов, оценку показателей, характеризующих эти явления и процессы для более или менее отдаленного будущего. Таким образом, прогнозирование—это научная деятельность, направленная на выявление ^изучение возможных альтернатив будущего развития и структуры его вероятных траекторий. Каждая альтернативная траектория развития связывается с наличием комплекса внешних относительно исследуемой системы (явления) условий. Объектами прогнозирования, естественно, не могут являться любые явления или процессы. Если результат процесса однозначен, то его прогнозирование не имеет смысла. Напротив, если имеется множество возможных альтернатив для реализации процесса, то прогноз дает новую информацию. Таким образом,(Гпрогнозирование распространяется на такие процессы, управление которыми и тем более планирование их развития (во всяком случае в момент выработки прогноза) либо возможно в весьма малом диапазоне, либо совсем невозможно, исходя из современного уровня знаний или наличия инструментов управления, или, наконец, оно вполне возможно в принципе, но требует учета действия таких факторов, влияние которых не может быть полностью или однозначно определено,* Ряд западных авторов не делают различий между терминами прогноз и предсказание, а иногда и предвидение; в ряде случаев в этом же смысле они употребляют термины план 1 или план-прогноз. На критике такого подхода и особенно на смешении понятий план и прогноз мы останавливаться не будем, так как различие в содержании этих терминов для экономиста очевидно. В работе, изданной Конференцией по торговле и развитию ООН2, предлагается термин проектировка для обозначения гипотетической оценки значения некоторого показателя, которое может реализоваться в будущем, если наступят некоторые оговоренные условия. Иначе говоря, проектировка — ожидаемый результат реализации какого-либр условного утверждения, которое в явном виде с помощью формальной математической модели или неформальных качественных обоснований связывается с этими условиями. Термином прогноз обозначается возможное будущее значение некоторого показателя (условное утверждение), однако в отличие от проектировки он связывается не с любыми условиями, а лишь с теми, которые будут превалировать в будущем, т. е. с условиями, имеющими наибольшую вероятность. Таким образом, ^прогноз в данной системе терминов можно рассматривать как наиболее вероятную проектировку.^ Заметим также, что многие западные авторы подразделяют прогнозы на условные и безусловные. Нам представляется, что для 1 См., например, Тейл Г. Экономическое прогнозирование и принятие решений. (Пер. с англ.). М., «Статистика», 1971. 2 United Nations Conference on Trade and Development. Trade Prospects and Capital Needs of Developing Countries, № 7, 1968. 5
такого деления нет, по существу, оснований, поскольку любой прогноз является условным утверждением, хотя в ряде случаев условия в явном виде и не формулируются, но все же они обязательно имеются в виду при разработке прогноза. Например, могут предполагаться условия типа «если тенденция в развитии явления не измелится, то...» или «если наступит событие А, то...» и т. д. Кроме того, применение того или иного метода прогнозирования также предполагает принятие ряда условий. Щериодом упреждения при прогнозировании мы называем отрезок времени от момента, для которого имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз.} Некоторые' авторы именуют его прогнозируемым периодом, периодом прогноза, что представляется нам недостаточно удачным. По длительности периода упреждения общепринято различать три вида прогнозов: краткосрочные — период упреждения от нескольких дней до года, полутора лет; среднесрочные — свыше года до 3—5 лет; долгосрочные — от 6 лет и выше. Указанные виды прогнозов, естественно, различаются по своему существу. Долгосрочные и, в известной мере, среднесрочные прогнозы нацелены на выявление общей тенденции развития экономической характеристики. Обычно предполагается, что в будущем в силу воздействия кратковременных, в том числе случайных факторов, будут наблюдаться некоторые отклонения от этой тенденции. Краткосрочные прогнозы предназначены для выполнения другой функции. С их помощью пытаются уловить конкретные реализации изучаемого процесса, иначе говоря, краткосрочные прогнозы оценивают влияние тех факторов, которые и приводят к отклонениям от долговременных тенденций. Итак, прогнозирование является в нашем представлении специфическим видом научно-прикладного анализа. Главная его особенность заключается в том, что он нацелен на будущее; вторая важная черта — учет неопределенности, связанной с этим будущим. Неопределенность обусловлена отсутствием знаний о точном значении тех или иных экономических параметров, отражающих влияние основных или дополнительных факторов, о действительных условиях, в которых будет развиваться изучаемый процесс, и т. д. На наш взгляд, нельзя рассматривать перспективный анализ как прогнозирование, если он не учитывает формально (с помощью теории вероятностей) или неформально (если для применения теории вероятностей нет достаточных оснований) различного влияния неопределенности. В последнем случае экспертным путем устанавливается некоторая область ожидаемых значений прогнозируемой переменной. При этом, естественно, принимается во внимание значительно большее число качественных особенностей (и, в частности, учитывается возможность изменения окружающих условий, влияющих на формирование явления, и т. д.), чем это представляется возможным при формализованном подходе к разработке прогноза. Так или иначе прогноз, по-видимому, должен быть представлен в такой форме, которая отражает неопределенность в про- 6
н.ессе формирования явления, поскольку нет способа однозначного определения того, что будет на самом деле. Вероятностный (стохастический) подход к прогнозированию, по-видимому, является наиболее строгим, но в практике он может быть применен далеко не всегда. По характеру исследовательской работы прогнозирование нельзя полностью противопоставлять историческому анализу. II тот и другой виды анализа исследуют тенденции и закономерности развития явлений, вскрывают причинно-следственные связи, выявляют механизм действия изучаемых процессов. Прогнозирование, так же как и исторический анализ, обязательно предполагает систему научных доказательств, использование ряда методов и приемов, характеризующихся известным уровнем формализации, и увязку (приведение к согласованности) отдельных суждений и оценок, хотя последние и относятся к будущему. ^Как известно, прогнозы экономических явлений и процессов могут быть разработаны в виде качественных характеристик раз- пития (общее описание тенденции и ожидаемого характера изменений, а в самом простом случае—утверждение о возможности или невозможности наступления каких-либо событий) и количественных (точечных или интервальных) оценок, характеризующих будущие числовые значения прогнозируемых показателей и величины вероятностей достижения этих значений.) Разумеется, что каждый научно разрабатываемый прогноз охватывает обе стороны развития перспективно оцениваемых явлений и процессов — количественную и качественную. Соотношение характеристик этих сторон в прогнозе зависит от специфики объекта прогноза и целей прогнозирования, от степени совершенства методики прогностических исследований. Система обоснования и доказательств качественных и количественных характеристик будущего развития может включить в себя самые различные, подходы — применение математических методов коксе не является обязательным. Структура этой системы зависит от целей прогноза, наличия информации, продолжительности периода упреждения, конкретных особенностей изучаемых процессов, сроков подготовки прогноза и т. д. Основой системы доказательств является качественный (содержательный) анализ процесса, т. е. вскрытие и обоснование причинно-следственных отношений, формирование общих гипотез и концепций будущего развития, оценка характера влияния основных составляющих этого процесса и т. дДДачественный анализ яв- г/нтся отправным и заключительным этапом процесса прогнозирования.'} Количественный анализ, дающий возможность получить прогностические оценки в числовом выражении, в том числе и то <ю направление, которое рассматривается в настоящей работе, не ю.щ.ко исходит из результатов изучения процессов по существу, но it свою очередь обогащает и подкрепляет содержательный ана- III t, делает его более доказательным, сокращает область неопреде- 7
ценности прогноза, в частности, отсекая явно невозможные и противоречивые выводы., Кардинальное значение при разработке прогнозов в области социально-экономических явлений и процессов имеет, таким образом, теория их развития, которая охватывает характеристику сущности основных причинно-следственных связей и закономерностей неэкономических, социальных и политических последствий развития объекта прогноза. Правильность исходных теоретических предпосылок, методологической основы прогноза решающим образом влияет на его результаты и возможность их практического использования. Теория развития в конечном счете определяет содержание системы доказательств и концепций развития, закладываемых в прогноз, а следовательно, в значительной мере влияет на выбор применяемых для прогнозирования методов. Методами социально-экономического прогнозирования мы именуем совокупность приемов мышления, позволяющих на основе анализа ретроспективных внешних и внутренних связей, присущих объекту, а также их измерений в рамках рассматриваемого явления или процесса вынести суждения определенной достоверности относительно его будущего развития. Таким образом^если методологической основой прогнозирования служит теория развития объекта, которая раскрывает существо закономерностей, содержание основных причинно-следственных связей рассматриваемого процесса, то методы прогнозирования позволяют найти меру влияния отдельных закономерностей и причин развития, представить объект прогноза как динамическую систему измеренных с определенной степенью достоверности взаимодействий реальных явлений, факторов, сил общественной деятельности и тем самым дать возможность воспроизвести с определенной степенью вероятности поведение этой системы в будущем) Марксистско-ленинская теория развития общества, в частности научная политическая экономия, является общей методологической основой прогнозирования экономики, в принципе гарантирующей достаточную его надежность. Однако все более полная реализация этой возможности обеспечивается развитием и применением все более совершенных методов прогнозирования. ИНЕРЦИОННОСТЬ И , СТАТИСТИЧЕСКИЕ ЗАКОНОМЕРНОСТИ Процессы развития в экономике носят диалектический характер, который, в частности, проявляется в сочетании черт устойчивости и изменчивости этого развития. Соотношение этих черт, их удельный вес в характеристике развития за определенные хронологические интервалы весьма важны для экономического прогнозирования. Так, если изучаемые и прогнозируемые процессы имеют достаточно длительную историю и накоплен материал, позволяющий вскрыть закономерность и тенденции в их развитии и взаимосвязях с другими явлениями, а сами процессы обладают большой инерционностью, то гипотеза о будущем развитии этих процессов
и значительной мере, хотя и не исключительно, может базироваться im анализе прошлого. (Инерционность в социально-экономических процессах проявляется двояким образом: во-первых, как инерционность взаимосвязей, т. е. как сохранение в основных чертах механизма формирования явления (иначе говоря, сохранение зависимости, корреляции прогнозируемой переменной от совокупности переменных-аргументов); во-вторых, как инерционность в развитии отдельных сторон процессов, т. е. как некоторая степень со- чранения их характера — темпов, направления, колеблемости основных количественных показателей на протяжении сравнительно длительных хронологических отрезков. Инерционность развития экономики страны связана с длительно воздействующими факторами, например, такими, как структура основных фондов, их возраст и эффективность, размеры инвестиций прошлых лет, степень устойчивости технологических взаимосвязей отраслей производства, исторически сложившаяся структура потребления и т. д. Немаловажное значение для существования инерционности имеет и то, что сроки внедрения технических нововведений от возникновения идеи до практической реализации все еще относительно велики. Следует также учесть, что научно- технический прогресс в основном материализуется цутем постепенного накапливания небольших улучшений, усовершенствований, новшеств, относительно медленным вытеснением старого. Несомненно, что характер развития под влиянием неравномерности изменений в окружающей% социальной и экономической действительности, отдельных крупных прорывов и скачков научно-технического плана и т. д. сам с течением времени изменяется. Однако новые факторы, пришедшие на смену старым, в свою очередь способны оказывать более или менее длительное инерционное воздействие. (По-видимому, степень инерционности зависит и от такого фактора, как размер или масштаб изучаемой системы или процесса^ Если рассматривать производственную систему, то чем ниже ее уровень в иерархии «предприятие —отрасль — народное хозяйство», тем менее инерционными оказываются соответствующие характеристики. Последнее обстоятельство можно объяснить и тем, что влияние отдельного фактора (например, внедрение новой технологии) на низовом уровне часто оказывается доминирующим. На макроуровне показатели более устойчивы, поскольку на их значение оказывает воздействие уже гораздо большее число факторов. Изменение действия ряда из них (иногда оказывающих противоположное влияние) приводит к меньшей потере инерционности, чем на микроуровне. Инерционную тенденцию можно уподобить равнодействующей системы сил в механике. При большом числе составляющих изменение одной из них не окажет серьезного влияния на положение и размер равнодействующей в рамках всего хозяйства. Опыт свидетельствует также и о том, что чем «моложе» изучаемая система (экономическое явление, процесс, отрасль) и соответственно чем меньше имелось времени для формирования более 9
или менее устойчивых взаимосвязей и основных тенденций в ее развитии, тем меньшей инерционностью она обладает. Итак,^при значительной инерционности рассматриваемых экономических процессов и взаимосвязей и сохранении в будущем важных внешних причин и условий их развития правомерно с достаточной степенью вероятности ожидать сохранения уже выявившихся черт и характера этого процесса) Причем наличие инерционности нисколько не означает, что явление в своем развитии будет жестко следовать уже наметившейся тенденции. Несомненно, различные факторы будут в большей или меньшей степени воздействовать на явления, приводя к отклонениям от тенденции. В этих условиях становится целесообразным применять разнообразные методы обнаружения и экстраполяции преобладающей тенденции развития анализируекого объекта, использовать для прогнозирования найденные взаимосвязи экономических показателей и закономерности их изменения. При этом естественным является применение статистических подходов к прогнозированию. СТАТИСТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ Статистические методы прогнозирования, которым посвящена настоящая работа, не являются единственно возможными. Известны и другие. Например, в последнее время в прогнозировании научно-технического прогресса интенсивно используются различные нормативные (т. е. основанные на изучении возможных будущих потребностей в технических новшествах) и статистические методы4. Широкое, применение получили прогнозы, основанные на экспертных оценках.уВ ряде случаев прибегают к разработке так называемых сценариев развития, морфологическому анализу, историческим аналогиям и т. д. К Новым подходом к прогнозированию научно-технического прогресса является «симптоматическое прогнозирование», суть которого заключается в выявлении «предвестников» будущих сдвигов в технике и технологии2. Большие возможности для прогнозирования кроются в применении имитационных моделей. В практике прогнозирования экономики, однако, преобладающими, по крайней мере до сего времени, являются статистические методы. Как уже говорилось выше, это связано главным образом с наличием инерционности в развитии экономических явлений и объектов. Немаловажным для практической работы является и то, что статистические методы опирается на аппарат анализа, развитие и практика применения которого имеют достаточно длительную историю. (Процесс прогнозирования, опирающийся на статистические ме- 1 Краткая характеристика названных методов при их использошшип для прогнозирования научно-технического прогресса содержится п книге: Я и ч Э. Прогнозирование научно-технического прогресса (Пер. с англ.). Изд. *2~г. М., «Прогресс», 1974. 2 Bright J. Forecasting by Monitoring Signals of Tooliiiolo^u-nl СЛинщо.— В сб.: A Guide to Practical Technological Forecasting. N. Y., 1!)7.'{. 10
in ij»r, распадается на два этапа. Первый, индуктивный, заключает- 1 -л и обобщении данных, наблюдаемых за более или менее продол- .к игольный период времени, и в представлении соответствующих « г.тгнстических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции р.тшития, или в виде уравнения зависимости от одного или нескольких фактор-аргументов. В ряде случаев — при изучении сложных комплексов экономических показателей — прибегают к разработке i; 1 к называемых взаимозависимых систем уравнений, состоящих it основном опять-таки из уравнений, характеризующих статистические зависимости. Процесс построения и применения статистической модели для прогнозирования, какой бы вид последняя не имела, обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода. Второй этап, собственно прогноз, является дедуктивным. На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака!) Следует подчеркнуть, что полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использо- иании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели, должна осуществляться корректировка обнаруженных статистических характеристик в соответствии с ожидаемым изменением обстоятельств их формирования. Короче говорилиайденные с помощью статистических методов прогностические оценки являются важным материалом, который, однако, должен быть критически осмыслен. При этом главным является учет возможных изменений в самих тенденциях развития экономических явлений и объектов!) Известная условность в получаемых выводах связана с тем, что целый ряд статистических методов базируется на довольно жестких требованиях к качеству обрабатываемых данных (например, к их однородности) и строгих гипотезах о характере поведения анализируемых величин (их распределениях). На практике же экономист зачастую, особенно если исследуются динамические ряды, имеет дело с информацией, качество которой в отношении выдвинутых требований оставляет желать лучшего или просто неизвестно. Обычно неизвестен и тип распределения переменных. Таким образом, §уш практика остаются две альтернативы: или вообще отказаться от применения большинства методов и довольствоваться достаточно скудным инструментарием, или применять разнообразные статистические методы обработки данных, не забывая о соответствующих этим методам требованиях) Очевидно, что в последнем случае, если существуют сомнения в «чистоте эксперимента», не следует придавать получаемым статистическим выводам чрезмерно строгий смысл. В то же время эти выводы, как правило, оказываются полезными для практической деятельности и прогнозирования. Так, например, статистическая проверка гипо- II
тез основывается на предположении о существовании нормального распределения соответствующих переменных. На практике же мы в лучшем случае сталкиваемся с асимптотически нормальными распределениями (т. е. с распределениями, стремящимися к нормальным с ростом объема выборки). Вместе с тем проверка гипотез и в этих обстоятельствах дает практически приемлемые результаты, исключая разве такие ситуации, когда значения, скажем, ^-статистики Стьюдента близки к критическому (/а). В последнем случае вывод, естественно, нельзя признать надежным. Далеко не всегда статистические методы прогнозирования применяются самостоятельно, так сказать, в чистом виде. Часто их включают в виде важных элементов в комплексные методики,, предусматривающие сочетание статистических методов с другими методами прогнозирования, например с экспертными оценками, различного рода экономико-математическими моделями и т. д. Такой комплексный подход к прогнозированию представляется наиболее плодотворным.'Из сказанного выше вытекает, что статистические методы занимают важное место в системе методов прогнозирования, однако они ни в коей мере не должны рассматриваться как некий универсальный метод, как «золотой ключик», открывающий любую дверь) В ряде случаев собственно статистическая обработка экономической информации непосредственно не приводит к получению прогнозов, однако является важным звеном в общей системе их разработки. Такая обработка данных наблюдения, нацеленная на вскрытие различного рода конкретных статистических закономерностей, представляет собой, по сути дела, первый шаг на пути осмысливания информации и построения более сложных моделей, отображающих взаимодействие множества факторов. В связи с этим необходимо подчеркнуть важную роль статистической методологии в рамках построения имитационных моделей, которые все больше привлекают внимание экономистов. Потенциальные- возможности имитационных моделей в отношении прогнозирования поведения изучаемых (моделируемых)- систем еще далеки от полного раскрытияДИо уже сейчас очевидно, что успешность прогнозов, получаемых на основе имитационных моделей, существенно будет зависеть от качества статистического анализа эмпирического материала, от того, насколько такой анализ сможет выявить и обобщить закономерности развития изучаемые объектов во времени.) Несколько слов о применении электронно-вычислительных машин (ЭВМ). В настоящее время нельзя серьезно говорить о прогнозировании, исключая разве самые простые методы сбора и обработки экспертных оценок1, не предполагая интенсивное использование электронно-вычислительных машин. Дело прежде всего 1 Что касается систем экспертных прогностических оценок, применяемых к. сложным иерархическим структурам, то обработка и обобщение таких оценок также немыслимы без использования ЭВМ. 12
в том, что если применение ЭВМ не предусматривается, то тем самым резко ограничивается набор возможных инструментов анализа и сужается круг применяемых для прогноза подходов — исследователь должен будет исключать методики, предполагающие осуществление трудоемких расчетов или расчеты, которые вообще не могут быть выполнены ручным способом или на счетно-вычислительных машинах. В результате этого прогноз разрабатывают на основе самых простых приемов расчета и моделей, весьма грубо описывающих изучаемое явление. Таким образом,(быстродействие ЭВМ, возможность с их помощью охватить большой объем информации, выполнить сложные и трудоемкие расчеты и тем самым повысить реалистичность описания исследуемых процессов и явлений представляет собой главную причину, определяющую необходимость применения ЭВМ при прогнозировании^ Очень важное преимущество заключается в расширении возможности проведения с помощью ЭВМ разнообразных расчетных экспериментов. Как инструмент экспериментирования ЭВМ позволяет оценить и повысить адекватность разработанной прогностической модели реальным условиям в прошлом (путем улучшения выбора форм взаимосвязи, выбора независимых переменных модели и т. д.), выявить в ходе испытаний ее прогностические свойства и на основе соответствующих коррективов улучшать эти свойства. Достаточно сказать, что при построении прогностической регрессионной модели приходится разрабатывать по крайней мере десятки ее вариантов, прежде чем будет найден приемлемый результат. .[Однако главное заключается в том, что с помощью ЭВМ имеется возможность испытать широкий диапазон альтернативных допущений, принимаемых при разработке тех или иных вариантов прогноза, проверить влияние начальных условий (обычно значения исходных данных, относящиеся -к моменту разработки прогноза, точно не известны), оценить влияние различных гипотез о возможном характере развития и т. д.") Настоящая работа не претендует на роль исчерпывающего руководства в области прогнозирования, осуществляемого на базе статистических методов. Основная задача — ознакомить читателя с рядом методов, которые уже применяются или могут применяться в этой области. Упор при этом делается на методы долгосрочного и среднесрочного прогнозирования. Целый ряд методов, связанных с краткосрочным прогнозированием, не нашел сколь-нибудь полного отражения в книге. В частности, это относится к различным схемам авторегрессиониого анализа. Последняя тема, как нам представляется, нуждается в самостоятельном детальном рассмотрении. Учитывая практическую направленность работы, внимание уделяется больше, так сказать, инструментальной стороне проблемы прогнозирования, чем содержательной. Этим определяются структура и стиль книги и большое число прилагаемых таблиц, 1*
использование которых поможет существенно сократить трудоемкость ряда расчетов: Предполагается, что читатель знаком с простейшими методами статистического анализа и основными статистическими показате-. л*ши, характеризующими ряд распределения. Поэтому соответствующие понятия приводятся в книге без пояснений. Азвтор выражает признательность Е. 3. Демиденко за ценные критические замечания к первому изданию настоящей книги, позволившие внести ряд исправлений при подготовке второго издания.
1 ТЕНДЕНЦИИ РАЗВИТИЯ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ Хоть это безумие, но в нем чувствуется метод. Шекспир. Гамлет Статистическое описание движения во времени экономических явлений осуществляется, как известно, с помощью динамических (временных) рядов. Уровни таких рядов формируются под совокупным влиянием множества длительно и кратковременно действующих факторов и в том числе различного рода случайностей. Изменение условий развития явления приводит к более или менее интенсивной смене самих факторов, к изменению силы и результативности их воздействия и в конечном счете к вариации уровня изучаемого явления во временйлЪПишь в очень редких случаях в экономике~встречаются чисто "Стационарные ряды, т. е. ряды, динамика уровней которых такова, что средние характеристики не изменяются во времени. В таких случаях вариацию можно приписать действию только случайных причин и изучать ее с помощью террии стационарных случайных процессов. : В западной статистической литературе уровень динамического ряйа, характеризующего развитие экономического явления, традиционно рассматривается как сумма четырех компонент, которые непосредственно не могут быть измерены (ненаблюдаемые компоненты): вековой уровень {secular trend), или тренд, циклическая составляющая, сезонная составляющая и случайные колебания. Расчленение на вековой уровень и циклическую составляющую можно рассматривать лишь как технический прием при изучении циклов, если требуется измерить продолжительность отдельных этапов цикла. Надо сказать, что расчленение уровня динамического рлда на непосредственно не наблюдаемые компоненты вызывает возражение и западных статистиков1. Несмотря на условность по- 1 Crether D., Nerlove Al Some properties of optimal seasonal adjustment. — «Econometrica», vol 38, Ш 5, Sept., 1970. 15
добного расчленения уровней динамического ряда, этот прием можно применить для различного рода практических расчетов, главным образом для выделения тенденции развития, определения закономерности движения того или иного уровня во времени. Понятие тенденции развития не имеет достаточно четкого определения. В статистической литературе под тенденцией развития понимают некоторое общее направление развития, долговременную эволюцию. Обычно тенденцию стремятся представить в виде более или менее гладкой траектории. Предполагается, что такая траектория, которую можно охарактеризовать в виде некоторой функции времени, назовем ее трендом, характеризует основную закономерность движения во времени и в некоторой мере (но не полностью) свободна от случайных воздействий. Тренд описывает фактическую усредненную для периода наблюдения тенденцию изучаемого процесса во времени, его внешнее проявление. Результат при этом связывается исключительно с ходом времени. Предполагается, что через время можно выразить влияние всех основных факторов. Механизм их влияния в явном виде не учитывается. По существу, линия тренда выполняет ту же функцию для последовательных во времени наблюдений, что и средняя величина в ряду распределения. Часто под трендом понимают регрессию на время *. Иногда чгренд представляют как детерминированную компоненту переменной (причем не обязательно изменение этой компоненты связывают со временем)2. Каждое из подобных определений, скорее, указывает на частный прием отыскания тренда, а не на его сущность. Обычно предполагают, что отклонение от тренда есть некоторая случайная составляющая е*. Такой подход, действительно, весьма удобен на практике; однако вряд ли он имеет под собой надежную базу при описании экономических характеристик. Здесь речь идет, скорее, о соглашении, в силу которого обычно считают, что тренд определяется влиянием постоянно действующих факторов, а отклонения от него — влиянием случайных факторов. В самом деле, сравнительно часто к одним и-тем же рядам наблюдений можно достаточно хорошо подобрать функции различных видов. В этом случае весьма спорным или во всяком случае весьма относительными является практическое разделение уровня на детерминированную и случайную составляющую исходя из полученного тренда. В силу сказанного мы будем придерживаться более общего понимания термина тренд, не связывая его с конкретными формальными определениями. 1 См.: В ан-дер-В ар ден Б. Л. Математическая статистика (Мер. с нем.). М., Изд-во иностр. лит., 1960, с. 179. 2 См.: Ту ту бал ин 13. П. Статистическая обработка рядов наблюдений. М., «Знание», 1973, с. 9, 10. 16
Количественное описание наблюдавшейся тенденции в изменении уровней отдельно рассматриваемого динамического ряда (выделение тренда) лежит в основе ряда простых статистических методов прогнозирования. Ниже мы рассмотрим некоторые из них. § 1. ПРОВЕРКА ГИПОТЕЗЫ О СУЩЕСТВОВАНИИ ТЕНДЕНЦИЙ Выше уже было отмечено, что стационарные ряды в экономике пстречаются сравнительно редко, и все же при незначительной тенденции развития во времени и существенной колеблемости уровней динамического ряда можно «подозревать» наличие стационарности. В этих условиях, прежде чем перейти к выделению тренда, следует, по-видимому, проверить гипотезу о том, существует ли он иообще. Рассмотрим два подхода к решению данной задачи, основанных на статистической проверке гипотез 1. ПРОВЕРКА РАЗНОСТИ СРЕДНИХ УРОВНЕЙ На первый взгЛяд самый естественный и достаточно простой подход заключается в разбиении анализируемого ряда на две примерно равные по числу членов части, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность данных. Испытание разности средних, исчисленных для каждой из этих совокупностей, покажет, существенно ли различаются между собой средние или это расхождение можно приписать действию случайности и, таким образом, заключить, что тренд отсутствует. Такой метод был предложен еще земской страховой статистикой2. Поскольку число членов ряда, как правило, довольно незначительно, то воспользуемся методом проверки, разработанным для малых выборок (предполагается, что они имеют нормальное распределение). Итак,(ряд разбивается на две части. Уровни каждой из них рассматриваются как две выборки. Первая имеет среднюю уи вторая — */2. Необходимо проверить гипотезу о существенности разности у\ —1/2. Проверка данной гипотезы опирается на f-стати- стику Стьюдента. В самом простом случае — при равенстве или несущественном различии дисперсий двух исследуемых совокупностей {в\ ^ о>2) — /-статистика исчисляется, как известно, с помощью выражения 1 Теория статистической проверки гипотез и, в частности, гипотез о случайном характере расхождений двух средних рассматривается в общих курсах математической статистики, поэтому на ней мы специально останавливаться не будем. 2 См.: Материалы по статистике и организации земского перестрахования. М.; 1916. 17
где у\ и tj2 — средние для первой и второй совокупности наблюдений (в нашем случае — для первой и второй половины ряда); П\ и Пг — числа наблюдений в этих группах; s — среднее квадратическое отклонение разности средних. При t ^ ta гипотеза об отсутствии тренда (нулевая гипотеза) отвергается, при t<ta эта гипотеза принимается. Здесь t — расчетное значение /-статистики, U — табличное ее значение при вероятности ошибки, равной а1. Значение ta берется с числом степеней свободы, равным Пх-\-п2 — 2. Необходимое значение 5 можно определить на основе средней взвешенной величины дисперсий отдельных совокупностей; _ ^fin-lfst + ini-lfsl л[ 1 1 S — У ni + th — 2 " V ~^7 + "^Г# Заметим, что при оценивании дисперсий для первой и второй совокупности, si и s2, берется число степеней свободы, равное п\ — 1 и п2 — 1 соответственно. Выше было отмечено, что при применении формулы (1.1) предполагается, что дисперсии двух совокупностей незначительно различаются между собой. Проверка однородности дисперсий реализуется с помощью ^-критерия Фишера, который основан на сравнении расчетного отношения F = 4 (где*?>4) (1-2)- с табличным. Если расчетное значение F меньше, чем табличное, при заданном уровне вероятности, то можно принять гипотезу о равенстве дисперсий. Если же F больше, чем табличное значение,, то гипотеза о равенстве дисперсий отклоняется и, следовательно, формула (1.1) для испытания разности средних не может быть применена2. Рассмотренный выше метод в ряде случаев дает вполне приемлемые результаты. Однако следует отметить, что ему свойственны весьма существенные дефекты. Прежде всего он применим только для рядов с монатошшй тенденцией. Если же ряд меняет общее 1 Табличные значения ta приводятся в курсах математической статистики и различных публикациях, посвященных статистической проверке гипотез. См., например, Дружинин Н. К. Логика оценки статистических гипотез. М., «Статистика», 1973. 2 Упрощенный, но приемлемый в практической работе подход к проблеме оценки разности средних при щ Фщ и неоднородных дисперсиях используется в работе: Снедекор Дж. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии (Пер. с англ.). М., Сельхозгиз, 1961, с. 107—108. Табличные значения F приводятся в курсах математической статистики и различных публикациях, посвященных статистической проверке гипотез. 18
направление развития, то точка поворота тенденции может оказаться близкой к середине ряда, в силу этого средние двух отрезков ряда будут близки и проверка может не показать наличие тренда. Вместе с тем можно выдвинуть и более серьезное возражение, основанное на том, что величина среднего квадратического отклонения, с которой сравнивается разность средних в (1.1), зависит в динамическом ряду не только от колеблемости уровней, но и от самого тренда. Иначе говоря, существование тренда сказывается на показателе среднего квадратического отклонения. Сама же разность средних в значительной мере будет определяться тем, какой угол наклона имеет тренд. Пр.идедем следующий пример. Пусть динамический ряд состоит из натуральных чисел 1, 2, ..., 10. Тогда средняя для первой половины ряда равна 3, а для второй — 8. Воспользуемся ^-статистикой Стьюдента. Для случая, когда ni = ri2=n, формулу (1.1) легко преобразовать и представить в виде t^{-yi-y2)Yn-^, (1.'3) где 2d2 — сумма квадратов отклонений от общей средней. По данным нашего примера Ed2 = 82,5. Следовательно, '=(8-3) VWb-2'4- Табличное значение ta при вероятности 0,95 равно 2,306. Таким образом, t^>ta и гипотеза об отсутствии тренда в средних отвергается. Теперь рассмотрим второй вариант примера. Пусть абсолютный прирост будет в 10 раз меньше, т. е. 0,1. Тогда ряд состоит из следующих уровней: 1,1; 1,2; ...; 2,0. Соответственно средние равны 1,3 и 1,8, сумма квадратов отклонений составит 34,85. Откуда *=(1,8 —1,3) YS ^°'38* Таким образом, гипотеза об отсутствии тенденции при том же уровне вероятности подтверждается. Однако повышательная тенденция здесь была нами заложена уже при конструировании ряда. Следовательно, метод оказывается «нечувствительным» к небольшому (относительно значений уровней) тренду. МЕТОД ФОСТЕРА—СТЮАРТА Проверка разности средних, на которой мы только что остановились, не является единственным способом проверки гипотез о наличии тренда средней динамического ряда. Для этого предложен ряд достаточно простых критериев, основанных на различных подходах— использовании поворотных точек, корреляции рангов п др.( Рассмотрим один из самых простых методов, дающий, как нам представляется, практически более надежные результаты, чем 19
остальные. Этот метод позволяет также обнаружить тренд в значении дисперсии уровней, что, как будет показано далее, немаловажно для прогностического анализа. Метод разработан Ф. Фосте- ром и А. Стюартом 1, которые предложили по данным исследуемого ряда определять величины щ и lt. Значения щ и k находятся путем последовательного сравнения уровней. Если какой-либо уровень ряда превышает по своей величине каждый из предыдущих уровней, то величине щ присваивается значение 1, в остальных случаях она равна 0. Таким образом, _| 1, если у,>у*-ь У/.2, -.., У и t \ 0 в остальных случаях. Наоборот, если уровень меньше всех предыдущих, то U присваивается значение 1. Таким образом, |1, если yt<yt-u Ун. •■•» У и * '" [О в остальных случаях. После того как щ и U найдены, легко определить две простые характеристики S и d: S=2Sit (1.4) d = %dh (1.5) St = ut + lt9 (1.6) dt = ut—lie (1.7) Суммирование в формулах (1.4) и (1.5) производится по всем членам ряда. Нетрудно найти, что St принимает значения 0 и 1: St^O в случае, если ух не является ни наибольшим, ни наименьшим уровнем среди всех предшествующих уровней, в противном случае St = L Легко определить, что 5 может находиться в пределах 0 ^ S ^ ^/г— 1. (Здесь, как и выше, п означает число членов ряда.) Если все уровни равны (нулевая дисперсия), то S = 0, если же они монотонно растут, или.падают, или колебания их чередуются, систематически увеличиваясь или падая, то 5 = п —1 . В свою очередь величина di принимает значения 0; 1 и —L Найдем теперь пределы для d: нижний предел равен —(п—1), верхний составляет п—1. Нижний предел соответствует монотонно убывающему, а верхний — монотонно растущему ряду. (Авторы данных характеристик не рассматривают условий, когда значение d равно 0. Между тем именно здесь, как нам представляется, и кроется известная слабость рассматриваемого метода] В самом деле, если все уровни равны, то Ъщ = 0, 2"/* = 0 и d = 0. 1 Foster F., Stuart A. Distribution-free Tests in Time Series Based on the Breaking of Records. — «Journal of the Royal Statistical Society», Ser. B. L., vol. XVI, № 1, 1954. 20
Кроме того, d = 0 и тогда, когда 2^ = 2/*. Что касается первой ситуации, то она соответствует полному отсутствию тренда. Вторая же может наблюдаться и тогда, когда ряд охватывает два периода с противоположными тенденциями. Кроме того, d = О и в4 случае, когда подъемы и падения уровней чередуются. Если уровни симметрично располагаются вокруг горизонтальной линии, то величина d = 0 действительно соответствует отсутствию тренда в средней. Однако при определении d не принимаются во внимание величины отклонений от горизонтальной линии. Поэтому мыслима такая ситуация, при которой отклонения с одним знаком будут систематически выше отклонений с другим знаком. В этом случае тенденция средней к росту (падению) не отразится на величине d. По-видимому, в чистом виде такое расположение уровней будет встречаться в практике крайне редко, но надо иметь в виду, что все же оно возможно. Показатели 5 и d асимптотически нормальны и имеют независимые распределения. Они существенно зависят от порядка расположения уровней во времени.-Показатель 5 применяется для обнаруживания тенденций изменения дисперсии, d — для обнаруживания тенденций в средней. (После того как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности d—0 и S — ^Гипотезы можно проверить, применяя ^-критерий Стьюдента, т. е. / = -^, (1.8) ' = -^-, (1.9> где \х— математическое ожидание величины S, определенное для случайного расположения уровней во времени; ai — средняя квадратическая ошибка величины 5; аг — средняя квадратическая ошибка величины d. Необходимые для такой проверки средние квадратические ошибки равны l: ~ и 02=1/ 22т^/21п,г~0'8456- Значения fx, G\ и 0*2 табулированы. .' Вывод выражений для Ои о*2 и ц приведен в упомянутой выше работе Фос- тера и Стюарта. •21
Таблица 1.1 ЗНАЧЕНИЯ СРЕДНЕЙ {* И СТАНДАРТНЫХ ОШИБОК alf <7о ДЛЯ П ОТ 10 ДО *©0* п 10 15 * 20 25 30 35 40 45 ■ 50 55 60 65 70 75 80 85 90 95 100 у- 3,858 4,636. 5,195 5,632 5,990 6,294 6,557 6,790 -6,998 7,187 7,360 7,519 7,666 7,803 7,931 8,051 8,165 8,273 8,375 *А 1,288 1,521 1,677 1,791 1,882 1,956 2,019 2,072 2,121 2,163 2,201 2,236 2,268 2,297 2,324 .2,349 2,373 2,395 2,416 *а 1,964~ 2,153 2,279 2,373 2,447 2,509 2,561 2(,606 2,645 2,681 2,713 2,742 2,769 '' 2,793 2,816 2,837 2,857 2,876 2,894 * Journal of the Royal Statistical Society. Ser В., v. XVI, № 1, 1954, p. 7. Рассмотрим следующий пример. Возьмем данные об урожайности озимой пшеницы (ц/га) в Центрально-Черноземном районе РСФСР с 1954 по 1969 г.1 и определим соответствующие значения УРОЖАЙНОСТЬ ОЗИМОЙ ПШЕНИЦЫ В ЦЕНТРАЛЬНО ЧЕРНОЗЕМНОМ РАЙОНЕ РСФСР. ОПРЕДЕЛЕНИЕ nf И /, Год 1954 1955 1956 1957 1958 \ 959 1960 1961 У/ 10,3 14,3 7,7 15,8 14,4 16,7 15,3 20,2 ut 0 1 0 1 0 1 0 1 h I 0 о 1 о 0 0 1 о о 1 Год 1962 1963 1964 1965 1966 1967 1968 1969 yt 17,1 7,7 15,3 16,3 19,9 14,4 18,7 20,7 ut 0 0 . 0 0 0 0 0 1, '/ 0 0 0 0 0 0 0 0 На основе приведенных данных гюлучим S = 5 + l=6, d= = 5—1=4. Значения \i9 ox и о2 найдем по табл. 1.1. Поскольку 1 См.: Динамика урожайности сельскохозяйственных культур в РСФСР. М., «Статистика», 1972, с. 101—102. 22
в ней нет искомых значений для п = 16 (ближайшие табличные значения параметров соответствуют п =-15 и п = 20), то необходимые нам данные находим приближенно с помощью интерполирования. Получим [х=4,749, С\ = 1,552, 02=2,178. Отсюда при проверке d t = =4:2,178^1,84, *= (6—4,749) : 1,552 s* 0,81 при проверке S. Ближайшее табличное значение U при уровне существенности 0,10 выше 1,7. Таким образом, гипотеза об отсутствии тенденции в средней отклоняется *. Что же касается гипотезы об отсутствии тенденции в дисперсии, то она не отклоняется. Вернемся теперь к условному примеру, рассмотренному на с. 19. Для обоих рядов этого примера получим одинаковые характеристики: d = 9, S = 9. Опять находим необходимые для получения /-критерия показатели: ^ — 3,858, а, = 1,288, а5 = 1,964. Проверка d дает t = 9 : 1,964 = 4,58, при проверке S получаем t = (9 — 3,858): 1,288 = 3,99. Оба результата выш& табличных значений U при уровне существенности 0,01. Следовательно гипотеза о наличии тенденций в средних и дисперсиях указанных рядов не отклоняется. Таким образом, метод, основанный на d-критерии, оказывается более работоспособным при выявлении тренда, чем классическая проверка гипотезы о случайном характере расхождения средних. К тому же он весьма прост и легко может применяться в практических разработках. Следует, однако, иметь в виду, что и первый и второй из рассмотренных методов достаточно точны и строги только в том случае, если распределения величии нормальные^ § 2. ПРОСТЫЕ ПРИЕМЫ АНАЛИЗА ТЕНДЕНЦИИ РАЗВИТИЯ СРЕДНИЙ ТЕМП РОСТА Пожалуй, ни один вид статистических показателей, исключая разве что средние, не используется так часто в экономическом анализе, как средний темп роста. Известны многочисленные случаи его применения и в экономическом прогнозировании. Это вынуждает нас охарактеризовать эту важнейшую обобщающую характеристику динамики более подробно. (Средний темп роста можно получить как геометрическую среднюю из ряда последовательных (цепных) темпов роста. Цепной темп роста характеризует отношение какого-либо уровня динамического ряда к предыдущему уровню и выражается в процентах или в долях единицы. В последнем случае его называют крзффи- 1 Если к этим же данным применить метод, основанный на сравнении средних двух половин ряда, то получим результат, не отвергающий гипотезу об отсутствии тренда. 2Э
циеитом роста) (мы будем применять только термин темп роста вне зависимости от того, выражено ли это отношение в долях единицы или в процентах, поскольку это несущественно для анализа). Если ряд состоит из уровней уи Уь • • •> Уи то цепные хшпы роста (%t) будут равны: Ух У2 _ yt ' }ft-i Соответственно цепные темпы прироста, выраженные в долях единицы, будут равны: 1. тпр, t ~ xt УЕсли тенденция развития в известном временном интервале охарактеризована с помощью некоторого постоянного темпа роста, то в качестве последнего принимается средний темп за соответствующий период. Средний темп роста обычно определяют как Т= j/VT8 "'■" У Ух * (1.10) Нетрудно показать, что средний темп роста при дискретных показателях времени представляет собой знаменатель геометрической прогрессии, а средний темп прироста соответствует норме процента в формуле сложных процентов: Сп— Co(l,+ Too) у Рис. 1.1. Экспоненты с t>l и х<1 ших лет; р где Сп, Со — суммы на конец и начало периода; п = t — 1 — число истек- норма процента. Заменив в формуле сложных процентов Сп и Со на yt и у\ соответственно, а 1+Щ) рый постоянный темп роста т, получим: на некото- (lid Величина т*"-1 соответствует показательной функции. Допустим теперь, что изменение ряда происходит непрерывно, тогда формула (1.11) будет характеризовать развитие по показательной или экспоненциальной кривой. Если исследуемый ряд непрерывен (такой ряд можно представить себе как результат наблюдений при бесконечном дроблении интервалов времени) и задан в виде дифференцируемой функции yt = ft, то мгновенный темп прироста определяется как <р = 7- 0.12) 24
где ft — производная функции fu Возьмем теперь экспоненциальную функцию где е — основание натуральных логарифмов, а\ и а2 — параметры. Производная этой функции составит: а исчисленный в соответствии с (1.12) темп прироста равен: —т- -^"2 — тпр = const. Таким образом, (экспоненциально зависящая от времени функция имеет постоянный темп прироста, равный значению ее параметра а2.) Напишем теперь выражение для экспоненциальной функции в виде ft = aex*p£ (1.13) У экспоненциальной кривой ст>1 ординаты растут с постоянным относительным приростом. Поскольку база для расчета прироста не остается постоянной, а растет с увеличением t, то абсолютный прирост ускоренно возрастает. При х < 1 получаем убывающий ряд, у которого отрицательные темпы прироста постоянны,, а абсолютные значения отрицательных приростов уменьшаются (см. рис. 1.1). Когда т= 1, график представляет собой прямую, параллельную оси t. * Рассмотрим теперь ряд вопросов, связанных с одновременным анализом нескольких динамических ря^ов, и прежде всего проблему соотношения темпов роста частей и целого. Пусть анализируется т динамических рядов, /==1, ..., /гс, причем сумма этих рядов дает новый ряд: т Г, = ЕуА. (1.14). Пусть динамика каждого ряда характеризуется цепными темпами роста Xjt. Соответственно цепной темп роста суммарного ряда ра1- вен р*. Уровни, этих рядов на период t можно представить как уровни предшествующего периода, умноженные на соответствующие темпы роста: т Yt — У*.1 • Pt ~ Sj У/. *-iV Откуда Таким ^образом, цепной темп роста суммарного ряда на момент / равен взвешенной средней арифметической из цепных темпов част- 25-
ных рядов, исчисленных для того же момента времени. Если принять, что каждый частный ряд имеет постоянный темп роста, т. е. ЧТО Xjt = Tj, ТО т .2 У j, t-W р<= у<_ • (1Л6) Весами здесь, как и в предыдущей формуле, служат уровни предшествующих периодов. Заметим, что веса изменяются вместе с изменением t, причем удельный вес уровней рядов с большими темпами растет, а с меньшими падает. Следовательно, £темп роста суммарного ряда не может быть постоянным даже при условии, что темпы роста составляющих рядов не изменяются. Такая проблема, естественно, не возникает в тривиальном случае, когда темпы роста всех т рядов одинаковы. В этом случае темп суммарного ряда равен темпу частных рядов. Рассмотрим следующий пример. Пусть имеются два ряда с постоянными темпами роста %\ = 1,01, Тг = 1,08. Начальные уровни равны: ух; \ = 100, у2;\ = 500. Соответственно (1.16) цепные темпы роста суммарного ряда будут равны: р2 = 1,067, рз = 1,07, р4 = 1,072 и т. д. Перейдем теперь к определению среднего темпа роста суммарного ряда в случае, когда имеется т рядов с разными темпами роста. Для того чтобы ответить на этот вопрос, вернемся к выражению (1.14). Определим в нем уровни соответствующих рядов на момент t через начальные уровни рядов и темпы роста. Обозначим средний темп суммарного ряда для некоторого периода времени как р/ , тогда r/=sy1.p<<-,) = EyyiI^. (1.17) / = 1 Отсюда следует, что ^V^rf^- <U8> Таким образом/средний темп роста суммарного ряда равен взвешенной степенней средней из темпов роста частных рядов.^В качестве весов здесь выступают начальные уровни каждого ряда. С увеличением продолжительности ряда степень средней, а следовательно, и средний темп роста при всех прочих равных условиях также растут. Допустим, имеется шесть динамических рядов с постоянными для каждого ряда темпами роста Xj и начальными уровнями у^\\ Ряд 1 2 3 4 5 6 УМ 1000 200 400 800 500 700 V 1,02 1.Н 1,07 1,2 1,01 1,15 26
Для суммарного ряда средний темп роста согласно (1.18) составит: для первых трех лет—1,097, первых четырех лет — 1,099, пяти лет— 1,102 и т. д. Как известно, средняя применяется в качестве обобщающей характеристики, сводного признака, в котором взаимно погашаются индивидуальные особенности. Порядок или последовательность» соответственно которой индивидуальные значения признака выступают в действительности, не имеет значения. Иное дело, когда усреднение относится к динамическим рядам. Закономерность изменения темпов является сутью динамики и, во всяком случае, представляет собой очень важный аспект исследования динамического ряда.-Средний темп скрывает эту закономерность. В статистической литературе неоднократно высказывались сомнения относительно ценности среднего темпа для экономического анализа 1. К недостаткам среднего темпа как обобщающего локазателя, исчисляемого в виде (1.10;, следует отнести следующее: 1. Средний темп полностью определяется двумя крайними уровнями ряда, при этом выбор периода для расчета среднего темпа существенным образом определяет его значение. Сдвиг периода даже на 1 шаг может привести к значительному изменению величины темпа. К сказанному следует добавить, что при достаточной протяженности ряда имеется возможность для подсчета большого набора значений среднего темпа (на все вкусы!). В самом деле, если принять, что средний темп может быть определен за период не менее чем / лет, то при протяженности всего ряда, равной п годам, можно определить k различных вариантов среднего темпа: k == Ся-н-2. Так, ряд протяженностью в 15 лет дает возможность определить 78 различных средних темпов роста (при / = 4). Таким образом, значение среднего темпа будет в известном смысле случайным. Особенно наглядно неустойчивость показателя среднего темпа проявляется в том случае, когда ряд имеет чередующиеся повышения и понижения. Возьмем в качестве иллюстрации ряд (затраты предприятия на механизацию и автоматизацию производственных процессов, тыс. руб.), который характеризуется явной тенденцией к росту и имеет умеренную колеблемость: Год yt Год yt 1963 1964 1965 1966 196? 1968 87,7 97,7 108,5 107,9 111,0 122,7 1969 1970 1971 1972 1973 1974 135,4 143,5 132,5 133,7 134,2 143,4 1 См., например, Писарев И. Ю. Геометрическая средняя и ее место в статистике. — В сб.: К теории средних. М., МФИ, 1959; Маслов П. П. Исследование динамического ряда. — «Учен. зап. по статистике». Т. 8. М., «Наука», 1964. 27
Для этих данных можно получить следующие средние темпы роста: за период 1963—1974 гг. т= 1,046, за 1963—1970 гг. т= 1,073 (максимальное значение), наконец, величину t = 1,027 получим за период 1965—1973 гг. (минимальное значение). 2. Применение среднего темпа роста предполагает, что траектория развития приближается к экспоненциальной кривой, т. е. процесс в общем следует геометрической прогрессии. Если это не так и ряду свойственна иная закономерность развития, то описание динамики с помощью среднего темпа будет иметь очень условный характер. В связи со сказанным рассмотрим один частный вопрос, который тем не менее делает более полным наше представление о свойствах темпа роста, особенно в связи с его использованием для прогнозирования. Поставим перед собой такую задачу — определить, каково поведение самого темпа роста по мере увеличения динамического ряда в случае, если ряд фактических данных совпадает с кривой, описываемой какой-либо математической функцией, отличной от экспоненты. Для простоты положим, что зависимость уровня от времени линейна, т. е. у = а0 + а^, где а0 и а\ — положительные параметры. Тогда цепной темп прироста можно записать как ^г, __ *1_ Полученное выражение является уравнением гиперболы, отсюда по мере увеличения t темп прироста будет падать. Иными словами, если зависимость линейная (с положительным приростом), то цепной темп, исчисленный для двух уровней в начале ряда, будет высоким, а чем дальше они находятся от начала, тем темп ниже. Нетрудно показать, что средний темп роста на всем интервале времени, 'если его определить по формуле (1.10), будет равен: f~lr?±±Jht (1.20) *о + ai ■-Т- при условии, что отсчет времени ведется от 1 до /. Как видно из формулы (1.20), средний темп роста уменьшается по мере увеличения длины ряда, так как подкоренное выражение растет линейно, но при этом соответственно увеличивается степень корня. Легко понять, что расчет среднего темпа в рассматриваемом случае приведет к различным результатам, даже если продолжительность отрезка времени одинакова, но взяты различные участки ряда. Здесь можно было бы привести цепные и средние темпы роста, полученные и для более сложных кривых. Однако в этом, по-видимому, нет смысла, поскольку очевидно, что' за исключением экспоненты цепные темпы роста будут систематически изменяться, следуя тому или иному закону. Соответственно будут изменяться и средние темпы. 3. Средний темп скрывает характер динамики исследуемого периода, поскольку не принимает во внимание промежуточные члены ряда, отсюда теряется существенная для анализа информация, 28
Именно эти опущенные при расчете среднего темпа члены определяют форму тенденции развития. Отсюда, чем продолжительнее период, для которого исчисляется средний темп, тем больше теряется информации, тем меньше он играет роль обобщающего признака. Очевидно, что точность его определения не увеличивается при увеличении числа наблюдений, т. е. увеличении длины ряда. Из сказанного выше следует, что средний темп как обобщающий показатель динамики имеет весьма ограниченную ценность. При всех своих недостатках средний темп по традиции, в связи с легкостью его получения, наконец, отсутствием- другой простой обобщающей характеристики развития широко применяется в практическом анализе динамики развития. Особенно он удобен при сопоставлении показателей динамики за ряд отрезков времени или при сравнении темпов развития ряда стран, при сопоставлении рядов с разной закономерностью развития и т. д. Здесь, по-видимому, он незаменим. К тому же сами средние темпы в основном используются как конечные характеристики, которые не участвуют в дальнейших расчетах, а выступают лишь как соответствующие индикаторы динамики. К сказанному следует добавить, что отмеченные выше недостатки среднего темпа обычно мало проявляют себя при анализе рядов укрупненных показателей, для которых характерна малая колеблемость. Недостатки среднего темпа как обобщающей характеристики в общем-то давно осознаны экономистами. Поэтому время от времени предпринимаются попытки «модернизации» приемов оценки этого показателя. В частности, в практике иногда пытаются уменьшить погрешность, связанную с расчетом темпа по двум точкам. Средний темп исчисляют, например, беря за основу две средние величины, одна из которых исчислена для отрезка, взятого в начале ряда, другая — для отрезка в конце его. Действительно, если ряд следует экспоненциальной тенденции развития и имеет высокую колеблемость, то такой прием несколько снизит опасность выбора нерепрезентативных уровней, и как следствие этого средний темп будет более надежным (расчет среднего темпа роста урожайности). Однако такой прием далеко не обязательно дает хорошие результаты. Достаточно сказать, что при некоторых конфигурациях тенденции развития он приведет к дополнительным смещениям в величине среднего темпа. Следует отметить, что имеется и более основательная возможность для устранения ряда недостатков среднего темпа, исчисляемого по формуле (1.10). Прежде всего рассмотрим методику определения среднего темпа, соответственно которой з расчете участвуют все члены ряда и, таким образом, используется вся информация, содержащаяся в ряду динамики. Расчет среднего темпа по этому методу1 базируется на предпосылке о том, что 1 См.: Кандиларов Г., Димитров А. Таблици за изравняване на статистически редове и за изчисляване темпове на прироста. София, 1963. Аналогичную методику расчета среднего темпа предлагает Д. Козлов. («Расчет средних темпов по суммарным показателям»). См.: «Плановое хозяйство», 1965, № 3. 29
сумма фактических уровней динамического ряда (суммарный рост за период) должна быть равна сумме уровней, полученных расчетным путем исходя из начального уровня ряда и среднего темпа роста. Соответственно этому условию для ряда значений yt(t = 1, ..., п) можно записать: Е У; = Vi4 + У Л + • • • + У^Г1 = У1 {ч + 4 + ... + хГ1), (1.21) где xk — средний кумулятивный темп роста. Пусть Ч + "4i + . . . + 4 = /?. Тогда п 2 у* Определив по формуле (1.23) значение /? и используя то, что R = f(xk), можно найти значение xk. Непосредственный расчет х k no R затруднителен; в самом деле, ' Я = ^ + 4 + ...Ч-Г = ^^. (1.24) Поэтому для определения т& лучше воспользоваться соответствующими таблицами или номограммами 1. Найдем средний темп прироста для ряда, приведенного в примере на с. 27. Для этих данных получим: п 2 yt= 1370,5, откуда /? = 1370,5:87,7= 15,63. t-2 Анализируемый ряд состоит из 12 членов, поэтому число уровней от #2 до уп (число истекших лет) равно п— 1 = 11. В приложении 2 находим ближайшие к 15,63 значения R для п—1= = 11 ;Л5,6742 и 15,5772. Средние темпы прироста, соответствующие этим значениям R, равны 5,8 и 5,7%. Интерполируя, находим, что значению R= 15,63 соответствует темп прироста 5,76%. Напомним, что средний темп прироста, найденный по двум крайним точкам, для этого примера равен 4,6%: Расхождение значительное. Заметим, что рассчитанная по (1.24) величина %и зависит от значения базисного уровня (у\), отсюда колебания этого уровня будут существенным образом влиять на величину среднего темпа. Иными словами, недостатки расчета по формуле (1.10) устранены здесь не полностью. 1 В приложении 2 приведены значения среднего кумулятивного темпа прироста для рядов с числом членов от 5 до 15 и темпом прироста от 2,1 до 8. Данная таблица извлечена из более полной таблицы, подсчитанной для п — I от 2 до 23 и темпом прироста от — 9,9 до 15% (см. упомянутую выше работу Г. Каидилзрова и А. Димитрова). (1.22) (1.23) 30
Точное значение среднего темпа роста можно получить, прибегну» к аналитическому выравниванию соответствующего ряда по жсноненте. При подобном подходе к определению темпа устраняются отмеченные выше недостатки. Методы выравнивания, в том числе и по экспоненте, будут рассмотрены в главе 3. СКОЛЬЗЯЩИЕ СРЕДНИЕ Наиболее распространенным и простым путем выявления тенденции развития является сглаживание или механическое выравнивание динамического ряда. Суть различных приемов, с помощью которых осуществляется сглаживание и выравнивание, сводится к замене фактических уровней динамического ряда расчетными, имеющими значительно меньшую колеблемость, чем исходные данные. Уменьшение колеблемости позволяет тенденции развития проявить себя более наглядно! В ряде случаев сглаживание ряда может рассматриваться как важное вспомогательное средство, облегчающее применение других методов ^, в частности, более строгих методов выделения тенденции, о которых речь будет идти в следующей главе. Один из наиболее простых приемов сглаживания заключается в расчете скользящих, или, как иногда их называют, подвижных средних. Применение последних позволяет сгладить периодические и случайные колебания и тем самым выявить имеющуюся тенденцию в развитии. (Пусть динамический ряд состоит из уровней yt, £= 1, ..., п. Для каждых т последовательных уровней этого ряда (т < п) можно подсчитать среднюю величину. Вычислив значение средней для первых т уровней, переходят к расчету средней для уровней #2, ..., Ут+и затем #3, ..., Ут+2 и т. д. Таким образом, интервал сглаживания, т. е. интервал, для которого подсчитывается средняя, как бы скользит по динамическому ряду с шагом, равным единице. Если т нечетное число, а предпочтительнее брать нечетное число уровней, поскольку в этом случае расчетное значение уровня окажется в центре интервала сглаживания и их легко заменить фактическое значение, то для определения скользящей средней можно записать следующую формулу: t ip t+p у<=Щт=^-> (I-25) где yt — значение скользящей средней для момента t(t=l, ..., п), yi — фактическое значение уровня в момент i\ здесь i— порядковый номер уровня в интервале сглаживания. Величина р легко определяется из продолжительности интервала сглаживания: поскольку m = 2/7 -f- 1 при нечетном т, то т— 1 31
Расчет скользящей средней при большом числе уровней можно несколько упростить, применив ряд приемов. Так, последовательные значения скользящей средней можно определить рекурсивно: У* = Ум- 2р+\ (1.26) или путем последовательного расчета накопленных сумм уровней. Обозначим кумулятивную сумму уровней от начала ряда до уровня / включительно как Uf, Ui=yu U2=Ui+y2; (/3=^2+^/3 и т. д. Тогда числитель формулы (1.25) можно записать как Ut+p — Ut-p-i, соответственно У* ~ 2/7+1 (1.27) Для иллюстрации воспользуемся данными об урожайности озимой пшеницы за 1960—1969 гг. (см. табл. 1.2). Расчет произведен двумя способами — по формулам (1.26) и (1.27). Пусть применяется трехлетняя скользящая средняя, тогда т = 2р-\- 1 = 3 и р = 1.При расчете по формуле (1.26) следует прежде всего определить среднюю для t = 2; у2 = (15,3 + 20,2+ 17,1): 3 = 17,53. Затем последовательно рассчитываем значения yt+\ — yt-2 и (i/M-i — f/f_2): 3 для t = 3, ..., 9. Например, для t = 3 разность будет равна 7,7 — 15,3= = —7,6. Отсюда величина (yt+\ — Уг-ъ): 3 для этого же периода равна —2,53 (см. гр. 4 табл. 1.3). Соответственно скользящая средняя для U составит 17,53+ (—2,53) = 15,0. Таблица'1.3 СГЛАЖИВАНИЕ ПОКАЗАТЕЛЕЙ УРОЖАЙНОСТИ С ПОМОЩЬЮ ТРЕХЛЕТНЕЙ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ (расчет по формулам (1.26) и (L27)) Год 1 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 t 2 1 2 3 4 5 6 7 8 9 10 yt (Д/га) 3 15,3' 20.2 • 17,Й 7,7:- 15,3 16,3 19,9 14,4 18,7 20,7 У«-1-У*-а 3 4 — —2,53 —1,63 —0.27 4,07 -0.30 0,80 0,27 — */ 5 17,53 15.00- 13.37 13,10 17,17 16,87 17,67 17,94 __- и) 6 15,3 35,5 52,6 60,3 75.6 91,9 111.8 126,2 144,9 165,6 UM~Ut-* 7 52,6 45,0 40,1 49,3 51,5 50,6 53,0 53,8 - уш"им yt 3 8 17,53 15,00 ' 13,37 13,10 17,17 16.87 17.67 17,94 — По формуле (1.27) найдем значения Uj (см. гр. 6 табл. 1.3) и вычислим £/*-и — Ut-2 и #*•_ Например, для t = 2 получим Ut+i — Ut-2 = 52,6 — 0 « 52,6, yt = 52,6 : 3 = 17,53 и т. д. Чем продолжительнее интервал сглаживания,, тем сильнее усреднение и в большей мере взаимопогащаются колебания, поэтому выделяе- 32
м;ш тенденция развития получается более плавной. В практике сглаживания чаще всего производятся по трех-, пяти- и Семилетней скользящей средней: чем выше колеблемость, тем шире должен быть интервал сглаживания. Если ряд имеет периодические колебания с жесткой продолжительностью цикла, то они полностью устраняются при сглаживании с помощью скользящей средней при интервале сглаживания, равном или кратном циклу. ... St (Фа) • i i i I i 1 i i i i i \ i i i 11 /954 то Ю65 №9 Рис. 1.2. Сглаживание ряда трех-и семилетней скользящей средней (урожайность озимой пшеницы) Для иллюстрации приведем пример расчета трех-, пяти- и семилетних скользящих средних для показателей урожайности (см. табл. 1.4). Графическое сравнение результатов приведено на рис. 1.2. Таблица 1.4 СГЛАЖИВАНИЕ ПОКАЗАТЕЛЕЙ УРОЖАЙНОСТИ С ПОМОЩЬЮ ТРЕХ-, ПЯТИ- И СЕМИЛЕТНЕЙ СКОЛЬЗЯЩИХ СРЕДНИХ Год 1954 1 1955 1956 1957 1958 .1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 yt 10,3 1 14,3 7,7 15,8 14,4 16,7 15,3 20,2 17,1 ! 7,7 15,3 16,3 19,9 14,4 18,7 20,7 Скользящие средние т-3 10,8 12,6 12,6 15,6 15,5 17,4 17,5 15,0 , 13,4 13,1 17,2 16,9 17,7 17,9 ~~~" /72=5 1 12,5 13,8 14.0 16,5 16,7 15,4 15,1 15,3 15,3 1 14,7 16,9 -18,0 — — /72=7 13,5 14,9 15,3 15,3 15,2 15,5 16,0 15,8 15,6 1 16,1 — — :— 33
ВЗВЕШЕННЫЕ СКОЛЬЗЯЩИЕ СРЕДНИЕ Простые скользящие средние — весьма грубый статистический прием выявления тенденции. В ряде случаев сглаживание с помощью простой скользящей средней оказывается настолько сильным, что тенденция развития проявляется лишь в самом общем виде, а отдельные важные для экономического анализа детали исчезают, так как в результате сглаживания могут исчезнуть относительно мелкие волны или изгибы в тренде. Кроме того, часто после сглаживания мелкие волны меняют свой знак, т. е. вместо выпуклого участка на кривой получают вогнутый, и наоборот. Более тонкий прием, базирующийся на той же самой идее, что и простые скользящие средние, заключается в применении взвешенных скользящих средних. .Если при применении простой t скользящей средней все уровни ряда признаются равноценными, то при исчислении взвешенной средней каждому уровню в пределах интервала сглаживания приписывается вес, зависящий от расстояния, измеряемого от данного уровня до середины интервала сглаживания. Система весов определяется исходя из следующих соображений.(Пусть для т последовательных уровней ряда со сдвигом во времени на один шаг подбирают полиномы вида yi = a+bi+ci2+... (здесь i — порядковый номер уровня в пределах интервала сглаживания)*. Ниже мы более подробно остановимся -на подборе кривых для аналитического выравнивания ряда. Сейчас же только отметим, что параметры таких кривых обычно определяют исходя из условия, согласно которому сумма квадратов отклонений фактических уровней от расчетных, следующих уравнению кривой, должна быть минимальной. Итак, допустим, для каждого интервала сглаживания подбирается парабола второй степени (рис. 1.3). Центральная ордината этой параболы принимается за сглаженное значение соответствующего уровня фактического ряда данных. Поскольку отсчет времени в пределах интервала сглаживания производится от его середины, т. е. i=.., —2, —1, 0, 1, 2, ..., то сглаженное значение уровня равно параметру а подобранной параболы1. Поэтому для сглаживания нет необходимости прибегать к утомительной Рис. 1.3. Сглаживание динамического ряда (т = 3): а — расчетное значение уровня, полученное на основе простой скользящей средней (выравнивание по прямой); а' —расчетное значение уровня, полученное на основе взвешенной скользящей средней (выравнивание по параболе). 1 Нетрудно убедиться, что сглаживание по скользящей средней является частным и самым простым случаем сглаживания с помощью подбора многочленов. Так, если мы в качестве сглаживающего многочлена возьмем уравнение прямой, то параметр а этой прямой, равный центральному члену ряда в интервале сглаживания, соответствует простой средней арифметической. 34
процедуре подбора системы парабол, так как соответствующие этим параболам параметры а получают как взвешенные сред-4 ние из последовательных т. уровней со сдвигом на один шаг. Расчет взвешенных (полиномиальных) скользящих средних осуществляется по следующим формулам (приводим только формулы для случаев, когда т — нечетное число, а полиномы имеют вторую или третью степень)4. У/ = gg (~3ум + 12ум + 17у, + 12уж - Зу,+2); (1.28) т = 7 "21 у, = i (-2ум + Зу,_2 + 6ум + 7у, + 6уw + Зу,+2 -2у,+3); (1.29) ~~"23Т У* = 55Т (-21У;-4 + 14У*-з + 39у,_2 + 54ум + 59у, + 54ут + + 39у«+ 14у«-21уж). (1.30) Как видно из приведенных формул, веса симметричны относительно центрального уровня (yt), и их сумма с учетом общего множителя, вынесенного за скобки, равна единице. Заметим также, что в системе весов кроме положительных величин содержатся и отрицательные. Это обстоятельство приводит к тому, что сглажен- 1 Приведенные для расчета yt формулы легко получить следующим образом. Для этого, забегая несколько вперед, обратимся к системе нормальных уравнений (4.20), в которой для того, чтобы избежать путаницы, заменим символ tf характеризующий время, на i\ i = — р, ..., —2, — 1, 0, 1, 2, ..., р. Для опреде- р р ления а необходимо найти значения 212 и 2*4- Примем, что интервал сглаживания -р -р р р равен 5, тогда S2 = 10 и 2 *4 = 34. —р —р Нормальные уравнения, определяющие а и с, в Этом случае записываются как 2 yi = а-Ъ + с-10; 2 ytP = а-10 + с-34. —р -р Решение этой системы относительно а может быть представлено следующим образом: 2 У-34 — 10 2 У? 17 2 У — 5 2 У*2 а~ 5-34—Ю2 35 = gg (—Зум + 12y*-i + 17у, + 12уж - Зут). I.imim образом, получено уравнение (1.28). Аналогичным путем могут быть получены выражения и для других интервалов ПЛЛЖПНЛИИЯ. '!' 35
ная кривая в значительной мере сохраняет различные изгибы кривой тренда. По данным рассмотренного выше примера с урожайностью получим следующие значения взвешенных скользящих средних для т = 5и/п = 7 (см. гр. 4 и 5 табл. 1.5). Таблица 1.5 СГЛАЖИВАНИЕ ПОКАЗАТЕЛЕЙ УРОЖАЙНОСТИ С ПОМОЩЬЮ ПРОСТЫХ И ВЗВЕШЕННЫХ СКОЛЬЗЯЩИХ СРЕДНИХ Год 1 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 Простые скользящие средние т=5 . 2 12,5 13,8 14,0 -16,5 16,7 15,4 15,1 15,3 15,3 14,7 v 16,9 18,0 т=7 3 13,5 14,9 15,3 15,3 15.2 15,5 16,0 15,8 15,6 16,1 — Взвешенные скользящие средние т=5 4 П.9 12,6 16,2 15,2 17,4 18,8 15,2 11,7 12,5 18,1 17,3 17,1 т=7 5 ш 13,6 14,1 16,8 17,9 16,6 14,9 13,7 13,0 15,2 17,6 — Как видно из таблицы, скользящая средняя заменяет центральный член каждых т уровней, поэтому для р начальных и конечных уровней она не може^ быть подсчитана. Следовательно, при сглаживании по простой или взвешенной трехлетней скользящей средней теряются первый и последний уровень, по пятилетней средней — два первых и два последних и 1\_д. Если полученные расчетные значения t/t все еще обладают значительной колеблемостью, то можно повторить процесс усреднения, т. е. произвести повторное сглаживание, и получить скользящую среднюю второго, третьего порядка. ' - Расчет скользящей средней представляется как простая и безопасная операция, имеющая вполне ясное содержание. Однако эта операция трансформирует динамический ряд в большей мере, чем это кажется на первый взгляд.(Гак, если до сглаживания уровни ряда были независимыми, то после данного преобразования последовательные расчетные уровни (в пределах интервала сглаживания) находятся в некоторой зависимости между собой.)В самом деле, каждый уровень сглаженного ряда имеет общую часть с несколькими предыдущими и последующими членами. В свою очередь взаимосвязь уровней может при сглаживании значительных случайных колебаний привести к нежелательным эффектам (эффект Слуцкого). Полученный при этом тренд характеризуется пе- 36
риодичностью (незначительной по сравнению с исходными случайными колебаниями цикличностью развития), в то время как ее в действительности не было1. В последнее время в связи с усилением внимания к технике прогнозирования область применения . скользящей средней расширилась, а сама средняя получила несколько иное толкование. Новое заключается в том, что полученная с помощью усреднения "величина заменяет не центральный член интервала усреднения, а его последний член. Соответственно этому вместо формулы (1.26) мы можем записать M^M^ + ^tst. (1.31) Здесь скользящая средняя, относимая к концу интервала, обозначена новым символом Mi для того, чтобы отличить ее от средней, относимой к середине интервала усреднения уи i — номер уровня ряда. Теперь для того, чтобы отличить один вид скользящих средних от другого, будем называть величину Ми адаптивной скользящей средней. По ^существу, Mi равно у и сдвинутому на р шагов вправо, т. е. М^уи где i=t+p. Из формулы (1.31) следует, что адаптивная скользящая средняя на момент / равна адаптивной средней на предыдущий момент плюс некоторая поправка, определяемая разностью yi—#*-m с весом—. С увеличением интервала сглаживания m значение поправки при всех прочих равных условиях падает. Если первый член суммы в формуле (1.31) несёт на себе «груз прошлого» и характеризует инерцию развития, то второй член играет роль элемента, адаптирующего среднюю к новым условиям. Таким об^аздм, средняя с каждым шагом как бы обновляется, впитывая в себя новуд) информацию о фактически, реализуемом процессе. Степень обновления определяется весом, равным 1/т, который приписан поправке. г СРЕДНИЕ ПРИРОСТЫ Иногда при анализе динамики возникает необходимость в определении не самого тренда£а средней скорости его изменения—среднего прироста. Например, такая задача возникает при выборе вида функции для аналитического выравнивания динамического ряда (на этой проблеме мы остановимся в следующей главе). Однако скорости изменения тренда, вообще говоря, находят на основе уже выявленного 1 См.: Слуцкий Е. Е. Сложение случайных причин как источник циклических процессов. Избранные труды. М., Изд-во АН СССР, 1960, В качестве примера Слуцкий приводит ряд, полученный путем сглаживания случайных чисел с помощью десятилетней средней, и ряд экономических индексов Англии за 50 лет. При сравнении этих двух рядов обнаруживается большое сходство. 37
тренда. Для того чтобы выйти из этого порочного круга, можно приближенно оценить скорость изменения тренда, воспользовавшись каким-либо приемом, не связанным с выравниванием динамического ряда по функции. Так,! для определения средней скорости изменения тренда можно воспользоваться методом, примененным при исчислении скользящей средней. В самом деле, пусть для первых т уровней ряда, включенных в интервал сглаживания, подобрана прямая yt^a + bt (см. сноску 1 на с. 35). Если отсчет времени ведется от середины интервала 1, ..., т9 то параметр а этой прямой представляет собой среднюю арифметическую из т уровней ряда, в то же время параметр Ь характеризует прирост тренда, представляемого данной прямой (см. рис. 1.4). Эту величину в известном смысле можно рассматривать как специфическим образом усредненный для интервала сглаживания прирост, поскольку он определяется значением всех уровней (а следовательно, и приростов), охваченных данным интервалом времени. Поэтому условно назовем его средрим приростом. Определив средний прирост для первых т уровней и сдвинув интервал сглаживания вперед во времени на один шаг, можно определить следующий средний прирост и т. д. Для того чтобы определить средние приросты (ut), не обязательно выравнивать каждые т уровней исходного ряда. Нетрудно найти формулы для непосредственного расчета щ в зависимости от того, какой длины интервал берется для определения параметров выравнивающей прямой1. Ниже приводятся эти формулы: Рис. 1.4. Средний прирост при выравнивании по прямой ТП и, ___ — У/-1 + УЖ (1.32) ш- и,= —fof-2 — yt-\ + Ут + 2у/+2, 10 (1.33) пг 7, _ — Зу*-з — 2у,-2 — yt-! + yt+i + 2yM + Зу/+3 и 28 (1.34) 1 Как будет показано в гл. 4, параметр b прямой при условии, что начало- отсчета времени находится в центре ряда, для которого подбирается прямая, р можно определить по формуле b = —yj-. Подставив вместо t соответствующие —р значения, получим формулы (1.32) — (1.34), 38
Г.чк, для ряда показателей урожайности (см. табл. 1.4) средний прирост при т = 5 для t = 3 составит: иь = (-2-10,3—14,3 + 15,8 + 2-14,4): 10 = 0,97. Диалогичным путем получим «4=1,15, «5=1,61, ..., «14 = 0,76. Расчет средних скользящих приростов не обязательно вести по формулам (1.32) — (1.34). Найдя средний прирост для первого члена выравненного ряда и определив уи можно последовательно рассчитать средние приросты для остальных членов ряда по общей формуле К ^ = ut-i + p(p+\)(2p+\)[(p+l)yt+p + pyt_p_i — (2p+l)yt]. (1.35) Подставив в эту формулу вместо р соответствующие значения (напомним, что при т = 3 р=1, при т = 5 р=2 и при т = 7 р = 3); получим следующие рекурсивные выражения для расчета среднего скользящего прироста при использовании трех-, пяти- и семилетней средней: т = Ъ lif= V, + i- (2уж + yt_2 - 3yi); (1.36) т = 5 ut= им + ^ (Зу^2 + 2у,_3 — 5yt); (1.37) ю = 7 и,= ^1 + ^(4^3 + 3^4 — 7^). (1.38) Использование приведенных формул несколько снижает трудоемкость определения средних приростов. ЭКСПОНЕНЦИАЛЬНЫЕ СРЕДНИЕ Выше при расчете адаптивной скользящей средней усредняемым уровням динамического ряда придавались равные веса. К определению адаптивных скользящих средних можно подойти и несколько иначе, учитывая с помощью взвешивания степень «устаревания» данных. При этом предполагается, что адаптивная средняя зависит в большей мере от текущего уровня, несколько слабее — от предшествующего уровня и т. д/Короче, чем «старше» наблюдение, тем меньше оно должно оказывать влияние на величину адаптивной скользящей средней. - Таким образом, влияние * G г е g g J. V., H о s s e 11 С. H., R i с h a r d s о n Y. T. Mathematical Trend Curves: an Aid to Forecasting. Edinburg, 1964. 39
прошлых наблюдений должно затухать по мере удаления от момента, для которого определяется средняя. Поставленная задача может быть решена с помощью применения специальной системы весов, а именно информации приписывается вес, соответствующий степени ее новизны. Один из простейших приемов сглаживания ряда с учетом «устаревания» данных заключается в расчете специальных показателей, получивших название экспоненциальных средних, которые начал*: применяться в краткосрочном прогнозировании. Основная идея метода— использование в качестве прогноза линейной комбинации прошлых и текущих наблюдений — была высказала еще Н. Винером1. Экспоненциальная средняя имеет вид Q* = «y<+"0-«)QM. 0-39) где Qt — экспоненциальная* средняя (сглаженное значение уровня ряда) на момент t; а —коэффициент, характериз!ующий вес текущего наблюдения при расчете экспоненциальной средней (параметр сглаживания), причем 0<а^1. Соответственно этому выражению средний уровень ряда на момент t равен линейной комбинации двух величин: фактического уровня для этого же момента и среднего уровня, рассчитанного для предыдущего периода. Таким образомдсред^няя здесь формируется под влиянием всех предшествующих уровней ряда от его начала и до момента t включительно. Следовательно, средняя для момента / представляет собой линейную комбинацию значений всех наблюдений от г/1 до у%. В самом деле, формула (1.39) является рекуррентной. Последовательно раскрыв в ней содержание Qt-w получим Qt = *yt + (1 —a) QM = ay,+ (1 —а) [аум + (1 —a) QM] = = <*у,+ а (1 — a) yt_x + (1 — *)2 [аум + 0 — a) QM] = = ау, + а(1— а)ум + а(1— а)2у^-Ь .. + а(1 — а)*ум + + ...„+ (1-«)V О-40) Здесь уо является величиной, характеризующей некоторые начальные условия. Суммируем все члены, содержащие в качестве множителя коэффициент а, и находим, что Q. = a|o(l-aVy^+(l-a)^0, (1.41) где / означает число периодов отставания от текущего момента t Выражения (1.40) и (1.41) объясняют, почему средняя Qt названа экспоненциальной: относительный вес отдельного наблюдения, равный а(1—а)* убывает по мере удаления наблюдения в прошлое соответственно экспоненциальной функции. Иначе г Wiener N. The Extrapolation, Interpolation and Smoothing of Stationary Time Series with Engineering Applications. N. Y., 1949. 40
говоря, рассматриваемая средняя имеет экспоненциально распределенные веса. Так, если а = 0,1, то веса, придаваемые данным, составят: ОД —для текущего наблюдения, 0,1 (1 — 0,1) = 0,09 —для предыдущего (т. е. для i—1), для члена t — 2 получим вес 0,1 (1 — ОД)2 — 0,081 и т. д. Если же принять а « ОД то веса соответственно составят: 0,3; 0,21; ОД 47; 0,1029 и т. д. ; Выше мы говорили о том, что Qt является линейной комбинацией всех уровней от у\ до уи Однако вес, с которым участвует каждый член ряда в определении Qtt как это только что было показано, зависит от величины параметра сглаживания а. При достаточно большом удалении в прошлое от момента / вес будет настолько мал, что' соответствующий уровень ряда практически не окажет сколь-нибудь заметного влияния на значение Q*.'Таким образом, экспоненциальная средняя фактически также определяется для некоторого интервала сглаживания. Последний же зависит от зйачения а.. Экспоненциальная средняя обладает одним ценным для прогнозирования свойством. Она легко адаптируется к новым условиям (при движении во времени). Особенно наглядно это видно из следующей формы ее записи, которую можно получить из (1.39), перегруппировав ее члены, а именно Q*=Q« + «(y*—Qm>. (Ь+2) В этом виде она выступает как некоторое обобщение адаптивной скользящей средней (1.31).^Экспоненциальная средняя на момент i здесь выражена как экспоненциальная средняя предшествующего момента плюс поправка. Последняя представляет собой долю от, разности текущего наблюдения и экспоненциальной средней прошлого момента. Если Q*_i рассматривать в качестве прогноза на один шаг вперед, то разность yt — Q<_i есть погрешность этого прогноза. Следовательно, прогноз для времени t + 1 (равный Qt) учитывает наблюдавшуюся в момент t ошибку В чисто иллюстративных целях обратимся опять к ряду показателей урожайности, к которому мы неоднократно прибегали выше. Прежде чем приступить к определению экспоненциальных средних, •сделаем одно замечание. Дело в том, что для расчета Qi по формуле (1.39)' требуется величина Qo, относящаяся к периоду, предшествующему имеющемуся ряду динамики. Иначе говоря, возникает проблема определения начальных условий. Если есть соответствующие данные, то в качестве Q0 можно принять среднее значение уровней, относящихся к прошлому. Если же этой величины нет, то в качестве начального можно практически принять первый уровень ряда, т. е. Q\ — у{. Вес, приписываемый этому уровню, быстро уменьшается по мере отдаления от первого члена ряда, вместе •с этим быстро уменьшается его влияние на размер экспоненциальной средней, ^рднако не следует забывать, что это влияние будет значительным'для тех значений экспоненциальной средней, которые расположены в начале ряда. Отсюда применение данного вида 41
скользящей средней может быть успешным только тогда, когда ряд имеет достаточно большое число уровней?} Итак, возьмем в качестве начального значения экспоненциальной средней величину у\. Тогда, приняв, что коэффициент а равен, допустим, 0,1, получим для нашего примера с урожайностью Q1 = y1 = 10f3; Q2=-0,M4,3+ (1 — 0,1)10,3^10,7; Q8 = 0,Ь7,7+ (1—0,1) 10,7s 10/4 и т. д. Результаты расчета для трех вариантов коэффициента а представлены в табл. 1.6. Таблица 1.6 ЭКСПОНЕНЦИАЛЬНЫЕ СРЕДНИЕ, РАССЧИТАННЫЕ ДЛЯ ПОКАЗАТЕЛЕЙ УРОЖАЙНОСТИ Год 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 >* 10,3 14,3 7,7 15,8 14;4 16,7 15,3 20,2 17,1 7.7 15,3 16,3 19,9 14,4 18,7 20,7 а «0,1 10,3 10,7 10,4 10,9 11,3 11,8 12,2 13,0 13,4 12,8 13,1 13,4 14,0 14,1 14,5 15,2 а = 0,2 10,3 11J 10,4 11,5 12,1 13,0 13,5 14.8 15,3 13,8 14,1 14,5 15,6 15,4 16,0 17,0 а «0,3 10,3 11,5 10,4 12,0 12,7 13,9 14,3 16,1 16,4 13,8 14,2 14,9 16,4 1 15,8 16,7 ! 17,9 Можно показать, что математические ожидания величин Qt n yt совпадают, т. е. что Е (Qt) =E (у*)1- Кроме того, известно, что дисперсия экспоненциальных средних меньше, чем. дисперсия исходных наблюдений2. D(Ql)=T^-aD(yt), (1.43> где D (yt) = а2 — дисперсия значений yt. Как видно из (1.43), при высоком значении а дисперсия экспоненциальных средних незначительно отличается от дисперсии наблюдений. Чем меньше а, тем больше этот коэффициент играет роль «фильтра», поглощающего» колебания. 1 В г о w п R. G. Smoothing Forecasting and Prediction of Discret Time Series. NJt 1963, p. 101. 2 Там же, р. 110. 42
Ранее уже отмечалось, что а может находиться в пределах 0; 1. Однако эксперименты показывают, что практически диапазон значений а ограничивается величинами 0,1; 0,3. В большинстве случаев хорошие результаты дает а = 0,1. При выборе значения для а необходимо учитывать, что для повышения скорости реакции на изменение процесса развития необходимо повысить значение а (тем •самым увеличивается вес текущих наблюдений), однако при этом уменьшаются «фильтрационные» возможности экспоненциальной средней. Выше были приведены формулы, определяющие экспоненциальные средние первого порядка, т. е. средние, получаемые непосредственно при сглаживании данных наблюдения (первичное сглаживание). Иногда при разработке статистических моделей полезно прибегнуть к расчету экспоненциальных средних более высоких порядков, т. е. средних, получаемых путем многократного экспоненциального сглаживания. Общая запись экспоненциальной средней порядка k имеет вид Qi*} = «£ (l-aj'Qfr". (1.44) Но Эту формулу можно преобразовать в следующую формулу: Q^'^aQr^ + d-^Qi-'i. (1.45) На основе этой формулы для экспоненциальной средней первого, второго и третьего порядка получены выражения1: Qp = ay/+(l_a)Q£V, QP»=aQ{1> + (l_a)Qii>1; д[3> = адРЧ(1-а)аа. (1-46) Рассмотренные в данной главе элементарные приемы статистического анализа динамических рядов дают возможность осуществить первый шаг в исследовании тенденций развития изучаемого объекта, поскольку на их основе можно определить некоторые обобщенные характеристики движения во времени, проверить наличие тенденции, наконец, выявить в общем виде тенденцию развития в прошлом. Соответствующие результаты имеют самостоятельное значение в рамках прогностического анализа. Однако, по-видимому, для нас здесь важнее то, что эти же результаты могут быть использованы в качестве вспомогательных средств при более обобщенной характеристике динамики с помощью формализованного описания тенденций развития, что и будет рассмотрено в следующих главах. 1 Доказательство, полученное Брауном и Майером, см. в статье: Клеаядро в Д. И., Френкель А. А. Прогнозирование экономических показателей с помощью метода простого экспоненциального сглаживания. — В сб.: Статистический анализ экономических временных рядов и прогнозирование. М., «Наука», 1973.
2 КРИВЫЕ РОСТА Чеширский Кот, —начала она довольно несмело. — Скажите, пожалуйста, каким путем я выберусь отсюда? — Это* во многом зависит от того, куда ты хочешь прийти, — ответил Кот. Л. Кэррол. Алиса в.стране чудес Кривые роста, описывающие закономерности развития явлений во времени, получают путем аналитического выравнивания дина- мических рядов. Выравнивание ряда с помощью тех или иных: функций (т.е. их подгонка к данным) в большинстве случаев оказывается удобным средством описания эмпирических данных, характеризующих развитие во времени исследуемого явления. Это средство при соблюдении ряда условий (на них мы остановимся в последней главе книги) можно применить и для прогнозирования., •Процесс выравнивания состоит из двух основных этапов: выбора типов.кривой, форма которой соответствует характеру изменения динамического ряда; определения численных значений (оценивание) параметров кривой. Найденная функция позволяет* получить выравненные, или, как: их иногда не вполне правомерно называют, теоретические значения уровней динамического ряда, т. е.' те уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой; Эта же функция с некоторой корректировкой или без нее, применяется и для экстраполяции.) Вопрос о выборе типа кривой Является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров. К выбору типа кривой можно- подойти различными путями. Однако какой бы путь (или их сочетание) ни был принят, он обязательно предполагает знакомство- с основными их свойствами, главным образом с характером из- 44
менения приростов и некоторыми их преобразованиями. Поэтому в первом параграфе главы мы остановимся на характеристике отдельных типов кривых, затем перейдем к методам выбора кривых для выравнивания. Метод оценки параметров кривых рассматривается в следующих главах. § 1. ЗАКОНЫ РОСТА ФУНКЦИЙ, ПРИМЕНЯЕМЫХ ПРИ ВЫРАВНИВАНИИ ДИНАМИЧЕСКИХ РЯДОВ Для выравнивания динамических рядов наиболее часто применяются такие относительно простые функции, как многочлены (полиномы), различного рода экспоненты и логистические кривые. Ниже приводятся краткие характеристики законов роста названных кривых. Причем при описании кривых нас главным образом будут интересовать такие преобразования их приростов, которые можно представить в виде линейной функции. Как показано ниже, подобные характеристики оказывают существенную помощь при выборе типа кривой для выравнивания эмпирических данных. МНОГОЧЛЕНЫ Многочлены имеют следующий вид: первой степени yt = ^Jra\t\ (2-1) второй степени yt = &<> + а>\*+ а2*2%, (2.2) третьей степени У[ = а0 + а^ + а^Р + ав&\ .(2.3) Х-й степени yt = а0 + axt + а2Р + ... + я>Д (2.4) Здесь а0, й\> Я2> Яз .. - — параметры мно- Уь гочленов, t — независимая переменная (время). Параметры многочленов невысоких степеней могут получить конкретную интерпретацию, зависящую от содержания динамического ряда. Например, их можно трактовать как скорость роста (параметр aj)t ускорение о роста (параметр, аг), изменение ускорения (параметр а3), уровень ряда при *=0 (параметр а0). \ Многочлен первой степени (2.1)—на графике ему соответствует прямая — предполагает постоянство приростов ординат и поэтому применяется для описания процессов, равномерно развивающихся во времени, . - - Парабола второй степени (2.2) описывает движение с равномерным изменением приростов, причем приросты (щ) положительны для одной ветви параболы и отрицательны для другой (рис. 2.1). Легко показать, что приросты (первые конечные разности Ч Рис. 2.1. График'квадратичной параболы и ее приростов 45
ординат параболы) могут быть охарактеризованы уравнением прямой Ь = У* — Ум = а\ + 2a2t— а.г = (ах—а2) + 2a2t (вторые р; иМ —ut — ut_l = 2a2. Соответственно приросты второго порядка (вторые разности) постоянны: Таким образом/ парабола второй степени применима для описания процессов, характерной особенностью которых является равноускоренный рост или равноускоренное снижение уровня. Если параметр а2>0, то ветви ее направлены вверх — парабола имеет минимальное значение, если же а2<0, то ветви направлены вниз — парабола имеет максимум. Параметры а0 и ах параболы не влияют на форму кривой, они лишь определяют ее положение в пространстве'^ У параболы третьей степени (2.3) знак прироста ординат может изменяться один или два раза (рис. 2.2). Первые же разности ординат при нанесении на график представляют собой ординаты параболы второго порядка, т. е. . ut = (ai ~а2 + аь) + (2^2 — За3) t -f За/. Соответственно вторые разности изменяются линейно: ир> = (2а2 — 6а8) + 6<V. Постоянными здесь являются третьего порядка: щ^ = 6а3. разности Рис. 2.2. График параболы третьей степени и ее приростов ЭКСПОНЕНТЫ у Для рассмотренных выше кривых, представленных многочленами, характерно то, что приросты ординат в явном виде не связаны со значениями ординат(:В отличие от них экспоненциальные кривые предполагают, что прирост зависит от величины самой функции.") Рассмотрим ряд таких кривых. Самая простая экспоненциальная (показательная) кривая имеет следующий вид: / Этот вид кривых мы уже затрагивали выше при рассмотрении среднего темпа роста. Отметим еще раз, что данная кривая характеризуется постоянными темпами роста и прироста, иначе говоря, b — 1 = тпр = щ\ у^х = const. -16
Если Ь>1, то кривая растет вместе с ростом t7 и, наоборот, падает, если Ь<1. - Прологарифмировав выражение (2.5), получим простой многочлен logyt = loga + tlogb, (2.6) или, приняв а = log а и р = log*, перепишем (2.6) в виде logy, = * + P*. (2.7) Таким образом, логарифм ординаты линейно зависит от t. Соответственно на полулогарифмической диаграмме изображается прямая (рис. 2.3). Более усложненным вариантом экспоненциальной кривой является кривая, функция которой имеет вид yt = ab*c*. (2.8) Эта кривая получила название логарифмической параболы, В самом деле, прологарифмировав выражение (2.8), получим параболу log yt = log a + t log b + fi log с (2.9) На полулогарифмической диаграмме эта кривая изображается в виде параболы второй степени. Найдем теперь выражение для темпа прироста этой кривой в виде отношения первой производной к ординате. Производная в этом случае равна: y't — abb* lnb + 2ft Vf In с. Откуда темп прироста (см. 1.12) составит: = In ft+ 2f In с. *°9Уь пр Рис. 2.3. Экспоненциальная кривая (ординаты, логарифмы ординат и темпы прироста) Таким образом, темп линейно зависит от времени. Все рассмотренные выше кривые, соответствующие многочленам, не имеют асимптот, их рост ничем не ограничен. Теоретически ордината может принимать любое значение. В свою очередь экспоненциальная кривая и логарифмическая парабола имеют асимптоты. Например, у экспоненциальной кривой yt стремится кнулюпри*->— оо, если ft>l, и yt-+0 при *-*оо, если 6<1. В ряде случаев, а именно тогда, когда процесс характеризуется насыщением, его описание имеет смысл лишь при помощи кривой, имеющей асимптоту, отличающуюся от нуля. Наиболее простым
представителем семейства таких кривых является кривая, получившая в статистике название модифицированной экспоненты. Ее уравнение отличается от простой экспоненты (2.5) лишь тем, что в нем содержится дополнительное слагаемое k: yt = k-{- аЬК (2.10) Эта функция имеет горизонтальную асимптоту y=k, ее график стремится к асимптоте либо при *->оо, либо при *->-—оо, но никогда ее не пересекает. Параметр а равен разности между ординатой кривой (при f=0) и асимптотой. Если параметр а отрицателен, то асимптота находится выше кривой, если а положителен, то асимптота проходит ниже ее (рис. 2.4). Параметр Ь равен отношению последовательных приростов. На рис. 2.4 показаны четыре варианта кривой. Из них чаще всего экономист сталкивается с вариантом, при котором рост уровня происходит с замедлением, и уровень стремится к некоторому пределу (вариант 1). В этом случае а<0 и6<1. (^Отличительная особенность модифицированной экспоненты заключается в том, что отношения последовательных приростов при равномерном распределении ординат по оси времени постоянны^ т. е. щ Щ-1 г=Ь = const. Рис. 2.4. Модифицированная экспонента (четыре варианта) Рис. 2.5. Ординаты модифицированной экспоненты и логарифмы ее. приростов Логарифмы приростов ординат этой кривой линейно зависят от переменной t (рис. 2.5). В самом деле, ut = yt — yt_i=k + abt — k — abt'1 = abt^(b—\)' Откуда log w,= log a + log (b— 1) + (t— 1) log b. 48
КРИВАЯ ГОМПЕРЦЛ И ЛОГИСТИЧЕСКАЯ КРИВАЯ В страховых и некоторых демографических расчетах нашла себе применение S-образная кривая, получившая название кривой Гомперца. Уравнение этой кривой имеет следующий вид: yt = kabt. (2.11) На рис. 2.6 показаны четыре варианта этой кривой. Как видно из рисунка, кривая не симметрична. Если логарифм параметра а отрицателен, то верхний предел для ординаты равен к, нижний равен 0; если он положителен, то асимптота проходит ниже кривой. Наибольший интерес для экономиста, естественно, представляет кривая Гомперца, у которой log а < 0 и Ь < 1 (вариант а на рис. 2.6). Рассматривая кривую Гомперца, можно выделить четыре этапа в развитии уровня, границы между которыми более или менее условны. Если коэффициент Ь меньше единицы (при отрицательном log а), то обнаруживается, что на первом этапе прирост незначителен, причем он медленно увеличивается по мере роста t, на следующем этапе прирост увеличивается быстрее, затем, после перегиба, приросты начинают уменьшаться. Вблизи от линии асимптоты приросты опять незначительны. Рассматриваемая кривая имеет следующую характерную особенность:'отношение последовательных приростов ординат в логарифмах (ординаты равноудалены друг от друга во времени) постоянно. Так получим: log Уж - »ogV_'og g-(*/+1 - bf) _ b _ const logy/ —log ум log a-(&'-1-У"1) Прологарифмируем выражение (2.11), получим: logy, = logA + *'loga. (2.12) Как видно из (2.12), \ogyt представляет собой модифицированную экспоненту. Найдем теперь для этой кривой такое преобразование характеристик приростов и уровней, которое было бы линейным относительно L Для этого определим с помощью производной темп прироста: Рис. 2.6. Кривая Гомперца: а) log a<0, Ь<\; б) log a<0, b>\; в) log a>0, b<\; г) log a>0, *>1 np *fl*Vlnaln6 ka*' = 6'In a In 6. 49
Прологарифмируем полученный результат, получим искомое линейное выражение: In %*пр = In (In a) + In (In b) + t-lnb. Если в модифицированной экспоненте (2.10) вместо у% ввести обратную величину, т. е.—, то получим второй тип S-образной кривой — логистическую кривую (рис. 2.7): — = k + ab*, yt (2.13) которую иногда называют кривой Перла—Рида. Логистическую кривую чаще записывают в следующем виде: у, = *_ (2.14) где е — основание натуральных логарифмов, / (t) — некоторая функция от t. Обычно f (t) = —at Тогда yt = —,. (2.15) Ji 1 + be~at v r Если b = l, а вместо основания натуральных логарифмов взять основание десятичных логарифмов и принять, что f(t)—a + bU то получим один из часто встречающихся видов логистической кривой: Vt = —т>* (2.16) 1 + 10*+*' Логистическая кривая центрально симметрична относительно точки перегиба. При t-*—оо ордината стремится к нулю, а при t-+oo ордината стремится к асимптоте. Если взять вторую производную от yi по времени (например, для варианта функции (2.15)) и приравнять ее нулю, то находим местоположение точки перегиба кривой t=lnb : а, в этой точке yt=k : 2. Как и для всех рассмотренных выше типов кривых, найдем такое преобразование приростов и ординат кривой, которое линейно относительно t. Для этого вычислим производную функции (2.15): kbe-at(—a) Рис. 2.7. Логистическая кривая (ор- ut \ динаты к log -g-J (1 +be~atf ' 50
Полученное выражение можно привести к линейному относительно t виду, разделив его на tjt2 и прологарифмировав полученный результат. Тогда yt ln^r = Ina-# — at. у] Логистическая кривая схожа с кривой Гомперца. Обе кривые характеризуют рост с изменяющимся отношением прироста к орди- нате.мЭтличие заключается в том, что у кривой Гомперца постоянны отношения первых разностей логарифмов последовательных равноотстоящих друг от друга ординат, а у логистической кривой неизменны отношения первых разностей обратных их значений! Распределение во времени первых разностей ординат кривой Гомперца асимметрично, в то время как у логистической кривой распределение этих величин симметрично и напоминает нормальное распределение. Разумеется, список кривых, применяемых при выравнивании динамических рядов, можно было бы значительно расширить. Однако, по-видимому, в этом нет настоятельной необходимости, так как основные и чаще всего встречающиеся случаи нами рассмотрены. В заключение параграфа приведем несколько дополнительных замечаний о характере процессов, описываемых теми или иными типами кривых. Так, экспоненциальные кривые роста хорошо описывают процессы, имеющие так сказать «лавинообразный» характер, а именно когда прирост зависит в основном от уже достигнутого уровня; при этом различного рода ограничения для роста не оказывают сколь-нибудь заметного влияния. Если же ограничивающий фактор все время воздействует, причем эффективность его влияния растет вместе с ростом достигнутого уровня, то хорошее описание этого процесса можно получить с помощью модифицированной экспоненты. Наконец, если ограничивающий фактор начинает влиять только после некоторого момента (точка перегиба), до которого процесс развивался, следуя близко к некоторому экспоненциальному закону, то наилучшее приближение дают S-образ- ные кривые. В сущности S-образные кривые описывают два последовательных лавинообразных процесса: один с ускорением развития, другой — с замедлением. Модифицированная экспонента, кривая Гомперца и логистическая кривая при определенных значениях своих параметров имеют асимптоты, проходящие выше этих кривых. Отсюда такие типы кривых пригодны для описания различного вида процессов «с насыщением». В частности, S-образные кривые находят себе применение не только в различного рода работах, связанных с развитием популяций, в демографических и страховых расчетах, они оказались весьма полезными при решении отдельных задач прогнозирования научно-технического прогресса. Так, такие кривые хорошо описывают развитие во времени функциональных характеристик различных технических устройств (скорость самолетов, эффектив- 51
ность потребления угля на электростанциях и т. д.). В отдельных случаях они могут применяться и для описания процессов распространения новшеств и изобретений *. § 2. ВЫБОР ФОРМЫ КРИВОЙ Как уже отмечалось, проблема^ьЙора формы кривой — одна из основных проблем, с которой сталкиваются при выравнивании ряда динамикиУРешение этой проблемы во многом определяет результаты экстраполяции тренда. Вероятно, самым обоснованным подходом к решению проблемы был бы подход, при котором форма кривой определялась бы путем анализа изучаемого процесса развития по существу, анализа, охватывающего его внутреннюю логику, специфику и взаимосвязь с другими процессами и окружающими условиями. Однако, как правило, такой анализ в лучшем случае может вскрыть характер динамики лишь в самых общих чертах (например, движение равномерное, равноускоренное, с затуханием роста и т. д.). Чаще всего исследователь не имеет какой- либо основы для того, чтобы сформулировать общую характеристику динамики процесса о той степенью детализации, которая нужна для выбора кривой, не прибегая к анализу самих данных наблюдения. Хотя содержательный анализ и не является практическим инструментом при выборе формы кривой, он тем не менее обязательно предшествует и сопутствует эмпирическому подходу. Во всяком случае при оценке степени пригодности той или иной кривой для описания тренда последнее слово остается за ним. Существует несколько практических подходов, которые позволяют более или менее удовлетворительно выбрать адекватную действительной динамике форму кривой. (Наиболее простой путь — визуальный (глазомерный)—выбор формы на основе графического изображения ряда динамики. Риск субъективного и произвольного выбора здесь очень велик. Разные исследователи на основе одного и того же графика могут прийти к разным выводам относительно адекватной формы кривой. К тому же результат выбора в значительной мере зависит от принятого масштаба графического изображения. Вместе с тем при относительно простой конфигурации тенденций развития визуальный подход дает вполне приемлемые результаты^' (^Второй путь, на который обычно указывают в статистической литературе, заключается в применении метода последовательных разностей. Этот метод основывается, во-первых, на предположении о том, что уровень ряда может быть представлен как сумма двух компонент: y, = y, + e/f (2.17) 1 См.: Мэнсфилд Э. Экономика научно-технического прогресса (Пер. с англ.). М., «Прогресс», 1970, с. 142—146. 52
где yt — структурная (систематическая), а е* — случайная компоненты. Второй постулат этого метода сводится к тому, что последовательные разйости величин yt стремятся к некоторому пределу. Предполагается, что на некотором этапе расчета мы получили разности, которые будут представлять собой независимые случайные величины с одинаковой дисперсией. Сказанное можно проиллюстрировать следующим. Пусть тренд строго следует графику полинома Агй степени. Разности ординат Я-го порядка тогда равны друг другу, а разности (X + 1)-го порядка равны нулю. Отсюда примерное равенство последовательных разностей уровней ряда рассматривается как симптом того, что yt следует в своем развитии, полиному соответствующей степени. Соответственно этому методу рекомендуется исчислять первые, вторые и т. д. разности уровней ряда,- т. е.: «J2) = «,— ut-u (2.18> й(3) = в(»)_в(2)1 и т. д. Расчет ведется до тех пор, пока разности не будут примерно равными друг другу. Порядок разностей принимается за степень выравнивающего полинома. Так, если примерно близкими оказываются первые разности, то для выравнивания берется полином первой степени, если примерно одну и ту же величину имеют вторые разности, то берется полином второй степени и т. д. Однако такой подход далеко не универсален, он возможен при подборе только кривых, описываемых многочленами. К тому же его предпосылки могут и не быть адекватными рассматриваемому реальному процессу. '.,аК выбору формы кривой можно подойти и иначе. Например,, часто его осуществляют исходя из значения принятого критерия. Обычно в качестве критерия принимают сумму квадратов отклонений фактических значений уровня от расчетных, полученных выравниванием. Из совокупности кривых выбирается та кривая, которой соответствует минимальное значение критерия. При этом оказывается, что чем меньше значение критерия, тем ближе примыкают к кривой данные наблюдений и кривая по предположению лучше описывает тенденцию развития. Однако в этом случае фактически нет обоснований того, что именно этот критерий дает наилучшее решение при выравнивании экономических динамических рядов. Такой подход к решению проблемы существует скорее в силу традиции, и молчаливой договоренности, чем в связи с его научной обоснованностью. По-видимому, для этих же целей можно применить и иные критерий^ Следует также добавить, что, ориентируясь лишь на тот или иной критерий, трудно выбрать кривую, которая бы более или менее адекватно отражала тенденцию изменения. В самом деле, возьмем 53\
в качестве примера многочлены. Вообще говоря, к ряду, состоящему из т точек, можно так подобрать по крайней мере один многочлен (степени т—1), что соответствующая кривая будет проходить через все т точек. Кроме того, существует множество многочленов с более высокими степенями, которые также проходят через эти точки. В любом из случаев, когда кривая проходит через все точки, сумма квадратов отклонений будет, естественно, равна нулю. Таким образом, формально это будет «наилучшая» кривая, и она, действительно, наиболее точно описывает фактическую динамику развития явления в прошлом. Однако вряд ли правомерно говорить в этом случае о выделении тенденции и тем более о применении ее .для прогнозирования. (Применение критерия для выбора формы кривой, по-видимому, даст практически пригодные результаты в том случае, если отбор будет проходить в два этапа. На первом этапе отбираются зависимости, пригодные с позиции содержательного подхода к задаче, в результате чего происходит ограничение круга потенциально приемлемых функций. На втором .этапе для этих функций подсчи- тываются значения критерия и выбирается та из кривых, которой соответствует минимальное .его значение?, ^Нам представляется, что в большинстве случаев практически приемлемым является метод, который основывается на сравнении характеристик изменения приростов исследуемого динамического ряда с соответствующими характеристиками кривых роста. Для выравнивания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения фактических данных. Поскольку основным при исследовании ряда динамики является изменение приростов, то метод, основанный на выявлении и анализе изменений приростов и различных показателей, полученных на их основе, можно считать наиболее содержательным) Рассмотрим более подробно технику подбора кривых по этому методу, который назовем методом характеристик прироста. Процедура выбора формьГ включает предварительную статистическую обработку ряда и сам выбор формы. Предварительная •обработка состоит из трех этапов: 1) сглаживания ряда по скользящей средней; 2) определения средних приростов; 3) определения ряда производных характеристик прироста. Сглаживание ряда скользящей средней дает возможность грубо :наметить тенденцию изменения ряда — тренд (см. (1.25) — (1.27)). Получив «черновой» тренд, можно легко определить средние приросты щ (см. формулы (1.32) — (1.38)) К Выше, при рассмотрении свойств кривых роста, были найдены различные преобразования приростов (щ): Причем для каждой формы кривой было найдено такое преобразование щ, которое характеризуется линейным уравнением относительно t. Аналогичные характеристики приростов можно определить и для эмпирических 1 Вообще говоря, средние приросты могут быть. определены и иными приближенными методами. .54
рЯДОв^В этом случае вместо прироста щ надо взять средний прирост ut. Если какая-либо из найденных по наблюдениям характеристик показывает близкое к линейному развитие во времени, то^ {Последнее служит симптомом того, что тенденция развития может доть описана с помощью соответствующей кривой. В качестве та- j0X характеристик приростов приняты: 7, ,7<2> ut щ ии и) \ -J-, log ut, log yt yt yt Таблица 2.1: ХАРАКТЕР ИЗМЕНЕНИЯ ПОКАЗАТЕЛЕЙ, ОСНОВАННЫХ НА СРЕДНИХ ПРИРОСТАХ, ДЛЯ РАЗЛИЧНЫХ ВИДОВ КРИВЫХ Показатель «if ut -(2) L yt JiL \0gllt log A J* logzr yt Характер изменения показателей * во времени Примерно одинаковые Линейно изменяются То же Примерно одинаковые Линейно изменяются То же » » Вид кривой Прямая (2.1) Парабола второй степени (2.2) Парабола третьей степени (2.3) Экспонента (2.5) Логарифмическая парабола (2.8) Модифицированная экспонента: (2.10) Кривая Гомперца (2.11) Логистическая кривая (2.13)— (2.15) В. табл. 2.1 приводится перечень наиболее употребительных при а1^лизе экономических рядов видов кривых и указываются соответствующие симптомы, по которым можно определить, какой вид. кр#вых подходит для выравнивания. v Иногда последние три характеристики таблицы: log щ, - - — —2 j a {titl У г) и log {utjyt)y не могут быть получены для некоторых ^ поскольку значения щ оказываются отрицательными. Соответ- ' ^енно ряд характеристик прироста прерывается. С такими слу- л#ми сталкиваются тогда, когда величины отдельных наблюдений существенно отличаются от остальных данных, «выпадают» из об- Jefo хода развития. Для того чтобы уменьшить возникающий в- 7103И с этим разрыв ряда характеристик прироста и выявить «чер- 00ую» тенденцию, можно воспользоваться одним из следующих. Р^емов: 1) увеличить интервал усреднения, принятый для скользящи средней; 2) заменить «анормальные» данные расчетными ве- 55>
.личинами, например средними из уровней, предшествующих yt i ♦следующих за ним (обычно достаточно взять по два уровня дс и после момента t). Если анализу с помощью средних приростов подвергается ряд имеющий понижающуюся тенденцию, то средние прироста, естественно, в основном будут отрицательными, отсюда невозможно найти логарифмические характеристики приростов. В этих случаях можно прибегнуть к расчету щ в обратном порядке, т, е. начинать "С конца ряда. Можно указать на ряд других признаков, которые могут помочь при выборе формы кривой. Так, если: - первые разности имеют тендейцию уменьшаться с постоянным темпом, то следует остановиться на модифицированной экспоненте, если же они образуют кривую, напоминающую асимметричное •одновершинное распределение численности (с вершиной, сдвинутой влево), то следует обратиться к кривой Гомперца, наконец, если распределение первых разностей по форме близко к нормальному, то выбирается логистическая кривая; *- • средние уровни, - нанесенные на полулогарифмическую бумагу, •близки к прямой линии, то предпочтительна простая экспонента, 'если же эти уровни образуют кривую, близкую к модифицированной экспоненте, то следует выбрать кривую Гомперца; первые разности логарифмов уровней примерно постоянны, то ..выравнивание лучше вести по экспоненциальной кривой, а если 'Они изменяются с постоянным темпом, то по кривой Гомперца; первые разности обратных значений средних уровней изменяются на один и тот же процент, то предпочтительнее остановиться на логистической кривой. Один из вопросов, который решается при выравнивании динамического ряда для последующей экстраполяции, заключается в выборе периода. Здесь не может^ быть применен какой-либо чисто ^формальный подход. Однако ясно, что если период слишком мал, то тенденцию в развитии просто нельзя обнаружить. Поэтому если йет каких-либо соображений, качественного порядка, то следует стремиться взять возможно больший интервал. С другой стороны, •очень большой временной интервал может охватить периоды с различными тенденциями. Поэтому описание такого ряда с помощью одной кривой не даст приемлемых результатов: тренд будет смещен и мало пригоден для экстраполяции. В таких случаях, по- видимому, лучше сократить интервал выравнивания, отбросив •наиболее ранние уровни, которые, по суждению исследователя, •относятся к периоду с иной тенденцией развития. Если развитие обнаруживает циклический характер, то для обнаруживания тренда .лучше взять период' от середины первого цикла до середины последнего. Можно полагать, что чем выше колеблемость уровней .ряда, тем продолжительнее должен быть временной интервал, охваченный наблюдением. Следует, также отметить, что чем больше параметров содержит уравнение тренда, тем больше должно £6
быть наблюдений при одной и той же степени надежности оценивания. На этой проблеме мы остановимся в следующих главах. (При выборе формы кривой надо иметь в виду еще одно обстоятельство. Рост сложности кривой в целом ряде случаев может действительно увеличить точность описания тренда в прошлом, однако в связи с тем, что более сложные кривые содержат большее число параметров и более высокие степени независимой переменной, их доверительные интервалы будут в общем, существенна- шир'е,'чем у более простых кривых при одном и том же периоде упреждения. Более подробно этот вопрос мы рассмотрим в гл. 5.. Прежде чем мы приступим к разбору конкретных примеров,, сделаем еще одно замечание, касающееся решения о выборе кривой. Это замечание относится к тому случаю, когда ряд динамики может быть хорошо выравнен с помощью экспоненциальной кривой. Здесь, по-видимому, нельзя безоговорочно принять гипотезу об экспоненциальной тенденции^азвития"даже в случае, если к исследуемому ряду естественно подобрать соответствующую кривую./ Дело в том, что первая половина логистической кривой (до перегиба) близка к экспоненциальной кривой. Таким образом, на основе только эмпирического ряда нельзя дать однозначный ответ. Выход можно найти, получив ответ на вопрос о том, может или. н.ет по" своему существу явление «затухать» в будущем, возможно или нет «насыщение» при данной совокупности условий, имеется или нет некоторое ограничение для процесса (законодательное, ограниченность материальных ресурсов или производственных мощностей и т. д.). Если ответ на этот вопрос положителен, то» экспоненциальный тренд в прошлом скорее следует рассматривать как часть выходящей за рамки наблюдения логистической кривой,., чем самостоятельную кривую. Рассмотрим теперь ряд примеррв_.выбора.типа кривой. , П|р им ер П Мощность электростанций в-СССР, млн. кВт*:: t yt щ t yt щ 1960 66,7 — ' 1966 123,0 8,0 1961 74,1 7,4 1967 131,7 8,7 1962 , 82,5 7,4 1968 142,S 10,8 1963 К 93,0 10,5 1969 153,8 11,3 1964 103,4 10,6 1970 166,2 12,4 1965 115,0 11,4 1971 175,4 9,2 * Народное хозяйство СССР, 1922—1972 гг. JVL, «Статистика", 1972, с. 158. Рассматриваемый ряд отличается устойчивым ростом. В целом* для него характерен линейный тренд (первые разности, и%> в общем варьируют сравнительно мало). Следует, однако, заметить, что- если отбросить первые пять, шесть начальных уровней, то у оставшейся части ряда средние скользящие приросты щ будут характеризоваться некоторым линейным ростом, что является симптомом параболического тренда. В самом деле, величины щ для f = 1966 и далее составят: 9,7; 9,5; 9,7; 10,8; 11,1. 57'
Пример 2. Производство радиоприемников на предприятии •с 1960 по 1973 г., тыс. шт.*: yt Уг 1960 1961 1962 1963 1964 1965 1966 * Данные условные. 3,6 4.9 10,3 12,8 13,7 14,5 17.1 1967 • 1968 1969 1970 1971 1972 1973 24,4 22,9 25,3 28,2 30,2 34,1 32,5 При рассмотрении графического изображения данного ряда (рис. 2.8) легко сделать вывод о том, 'что тенденция приближается 'К линейной. Если подсчитать характеристики приростов (табл. 2.2.) и построить соответствующие графики, то визуально можно установить, что наибольшее приближение к линейному изменению характерно для щ9 log-=- и log ■зг У v Среди этих трех показателей, по-видимому, наименьший разброс вокруг прямой имеют две последние из трех указанных величин (точное сопоставление невозможно в связи с тем, что у каждого графика свой масштаб). Таблица 2.2 ХАРАКТЕРИСТИКИ ПРИРОСТОВ (пример 2) t 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ( V 2 3.6 л е\ 4,9 10,3 12,8 13,7 14,5 17,1 24,4 22,9 25,3 28,2 30,2 34,1 32,5 V 3 — 9,60 11,24 13,68 16,50 18,52 20,84 23,58 26,20 28.14 30,06 — — ; К 4 — 2,86 2,26 1,53 2.66 2,83 2,74 2,31 1,69 2.73 2,03 — — i Ф 1 5 — 0 —0,55 —0,73 1,13 0,17 —0,09 —0,43 —0,62 1,04 —0,70 — — *Ф( 6 — 0,31 0.20 0,11 0,16 0.15 0.13 0,10 0,06 1,10 0,07 — — log ut 7 — 0,45 0,35 0,18 0.42 0,45 0,44 0,36 0,23 0.44 0.31 — — 1 log (atlytY 1 8 — -0.51 —0,70 * —0.95 —0,79 —0,82 —0.88 —1.01 -1,19 -1.01 —1.17 — — log(/7,/y,) 9 — —1,46 —1,75 —2,09 —2,01 —2,08 —2,20 —2,38 —2,61 —2,46 —2.65 — — * Пятилетняя скользящая средняя. 58
1960 1961 1962 1963 im 1965 1966 1967 1966 1969 1970 1971 1972 1973 1974. г а + ir6 о -1 -/ -2h 1962 1962 1962 1971 1971 1971 Рис. 2.8. Характеристики приростов динамического ряда (пример 2):: а)^л б)"гр>, в) -S-, г) log ии д) log (iJLj , е) log (pf)
Пример 3. Добыча каменного угля в Англии за период с Я957 по 1970 г.*, млн. т.: t 1957 1958 1959 1960 1961 1962 1963 yt 227 219 209 197 193 200 199 t 1964 1965 1966 1967 1968 1969 1970 yt 197 191 177 175 167 153 144 * Statistical Jearbook. N. Y. 1969, 1970. , T а б л и ц а 2.3 ХАРАКТЕРИСТИКИ ПРИРОСТОВ (пример 3) / 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 yf 2 144 153 167 175 177 191 197 199 200 193 197 209 219 227 V* 3 163 173 181 188 193 196 197 200 204 209 ut 4 8,8 8.6 7.6 6,8 5,4 0,7 -0,6 1,7 5,4 90 -(2) 5 0 -0,2 —1,0 -0,8 -1,4 —4,7 —1,3 2,3 3.7 3.6 utht б 0,054 0,050 ■ 0,042 0.036 0.028 0,004 —0.003 0.008 0,003 0.043 log ut 7 0,94 0,93 0,88 0,83 0,73 —0,16 0 0,23 0.73 0,95 log Ц/уД 8 —1,27 —1,30 —1,38 —1,44 —1,55 —2,45 0 —2,07 —1,58 —1,37 yog(a(lyt) 9 —3.48 —3,54 —3,64 —3,71 —3,84 —4,74 0 —4,37 —3,88 —3,69 * Уровни расположены в обратном порядке. ** Пятилетняя скользящая средняя. Ряд имеет явно выраженную понижающуюся тенденцию. Графическое изображение ряда вызывает впечатление о наличии линейного тренда (см. рис. 5.6). Определим теперь характеристики приростов. Для того чтобы получить положительные значения щ (а это необходимо для вычисления логарифмических функций щ и соответствующих преобразований), расчет осуществим в обратном порядке — от конца ряда к его началу. Результаты представлены в табл. 2.3. В наибольшей мере^приближаются к линейному развитию такие характеристики, как щ/уи log Щ% вторая половина ряда) и log (ut/y). Иначе говоря, имеются признаки того, что ряд ближе к модифицированной экспоненте, логарифмической параболе (во второй половине ряда) и к логистической кривой в вариантах, характеризующих падение уровня, чем к другим типам -60
кривых. В качестве самого грубого варианта можно остановиться и на прямой. ^Окончательный выбор формы кривой — дело содержательного анализа конкретной проблемы, который должен охватывать не только исследование тенденций, наблюдавшихся в прошлом, но и решение вопроса о том, следует или нет ожидать сохранения этих тенденций) (Условия применения кривых для экстраполяции рассматриваются более подробно в гл. 5.) Из сказанного выше, по-видимому, можно сделать вызод о том, что выбор формы кривой для выравнивания представляет собой задачу, которая не решается однозначно, а сводится к получению ряда альтернатив. Окончательный выбор не может лежать в области формального анализа, тем более если предполагается с помощью выравнивания не только статистически описать закономерность поведения уровня в прошлом, но и экстраполировать найденную закономерность в будущее. Вместе с тем различные статистические приемы обработки данных наблюдения, как было показано выше, могут принести существенную пользу; в самом крайнем случае с их помощью можно отвергнуть заведомо непригодные варианты и тем самым существенно ограничить поле выбора. В значительном же числе случаев приведенные выше приемы обработки рядов дают исследователю материал для достаточно оправданного выбора формы кривой, описывающей тенденцию развития. После того как форма кривой выбрана, возникает задача оценки параметров. Эта задача решается с помощью методов, заимствованных из регрессионного анализа, которым посвящена следующая глава.
3 РЕГРЕССИОННЫЙ АНАЛИЗ И ПРОГНОЗИРОВАНИЕ Почему же невозможно предугадать действительность? Потому что никто не может быть так отважен, как она сама. С. Лем. Молот Во введении мы уже говорили о том, что инерционность экономических процессов проявляется двояко: как сохранение в основных чертах взаимосвязей прогнозируемого явления с другими явлениями, объектами и процессами и как сохранение общей тенденции развития явления во времени. (Инерционность второго рода — сохранение общей тенденции развития во времени — можно, по-видимому, рассматривать как частный случай более общего проявления инерции.) 'Прогнозирование, базирующееся на, инерционности второго рода, можно свести к подбору аналитических выражений (моделей трендов) типа y=f(t) по данным за прошлое и экстраполяции полученных трендов. Что касается инерции во взаимосвязях, то для прогнозирования она может быть использована, если соответствующую взаимосвязь удается представить в виде аналитического выражения (например, регрессионного уравнения), которое связывает изменение одного экономического показателя (зависимая переменная) с влиянием ряда фактор-аргументов, т. е. к данным наблюдения подбирается уравнение типа y=f(*i, x2, . ..)• Прогноз получают путем подстановки в регрессионное уравнение с численно оцененными параметрами значений независимых переменных. Результат представляет собой оценку среднего значения зависимой переменной при данных уровнях фактор-аргументов. Для уравнения регрессии обычно определяют доверительные интервалы, которые также можно использовать в прогнозировании. Расчет доверительных интервалов позволяет определить область, в которой следует ожидать значение прогнозируемой величины. Выход этой 62
величины за границы интервала в силу случайных колебаний имеет незначительную вероятность — меньше, чем дополнение до единицы доверительной вероятности, т. е. меньше уровня существенности. Если в ходе качественного анализа выявлена и обоснована зависимость одного явления от других, то в этом случае на долю регрессионного уравнения, или регрессии, падает задача измерения этой зависимости, в которой причинно-следственный механизм выступает, так сказать, в наглядной форме. Прогноз в этом случае лучше поддается содержательной интерпретации, чем простая экстраполяция тенденции. Во всяком случае при применении регрессий (а точнее, при их получении) становится более ясным воздействие отдельных факторов и прогнозист лучше понимает природу исследуемого явления. Кроме того, регрессии создают базу для расчетного экспериментирования с- целью получения ответов на вопросы типа «Что будет, если.. .?>>. Можно привести множество примеров из различных областей экономической деятельности, когда регрессионные уравнения оказались хорошими измерителями взаимосвязи явлений. Например, известен целый ряд работ, посвященных измерению зависимости производительности труда в различных отраслях производства и на отдельных предприятиях от соответствующих факторов субъективного и объективного характера (стаж, квалификация рабочего, электровооруженность труда и т. д.). Часто с помощью регрессионного анализа оценивают взаимосвязи результатов хозяйственной деятельности с различного рода факторами (размерами капитальных вложений, возрастом оборудования и т. д.). Известны удачные примеры применения регрессий для характеристики стоимости создания какого-либо изделия, например самолета, в зависимости от его технико-эксплуатационных параметров (высоты и дальности полета, максимальной скорости и т. д.). На основе соответствующих регрессий прогнозировались затраты на ремонт отдельных узлов самолетов в зависимости от такцх факторов, как число летных часов и число неполадок в прошлом.^Именно способность регрессионного уравнения отобразить взаимосвязь между явлениями нашла себе практическое применение в прогностическом анализе. К регрессиям прибегают и как к вспомогательному средству в комплексной методике прогнозирования (например, в рамках разработки прогностической межотраслевой модели производства и распределения продукции регрессии используются для оценивания отдельных компонентов конечного продукта) \ и как к самостоятельному инструменту прогноза!) (Регрессионный анализ предполагает решение двух задач. Первая заключается в выборе независимых переменных, существенно влияющих на зависимую величину, и определении формы уравнения регрессии (обычно этот этап в разработке регрессии называют 1 В частности, к такому приему прибегли при разработке межрегиональной межотраслевой модели экономики США (U. S. Department of Commerce. Multire- Sional Input-Output Model of USA Economy, 1970). 63
спецификацией). Данная задача решается путем анализа изучаемой взаимосвязи по существу. Формальные средства могут служить здесь лишь некоторыми ориентирами. Вторая задача — оценивание параметров — решается с помощью того или иного статистического метода обработки данных наблюдения. В сущности, эта проблема и занимает центральное место в данной главе. Материал главы будет нами использован в дальнейшем в качестве отправной базы при рассмотрении ряда проблем, связанных со статистическими методами прогнозирования. В частности, техника оценивания параметров, разработанная для регрессионного анализа, используется с некоторыми упрощениями и при статистическом оценивании параметров различных кривых, характеризующих тренды. Методы получения параметров таких кривых рассматриваются в следующей главе. [Наиболее часто оценивание параметров регрессий достигается с помощью метода наименьших квадратов (МНК).* Метод наименьших квадратов, создание которого восходит к Гауссу и Лапласу, первоначально имел довольно узкую сферу применения, главным образом при обработке результатов наблюдений в астрономических и геодезических расчетах. Этот метод получил новую и широкую область приложения в экономико-статистических расчетах после создания теории корреляции и регрессии. Сущность МНК известна широкому кругу экономистов; имеется богатый выбор литературы по данному вопросу1. Поэтому на общей характеристике метода можно было бы не останавливаться. Однако мы все же вынуждены начать с краткой характеристики МНК, поскольку без этого теряется последовательность в изложении проблемы оценивания параметров. МНК рассматривается здесь вначале применительно к оцениванию параметров парной и множественной регрессии. Значительное место при этом уделено предположениям, положенным в основу МНК, и статистическим свойствам получаемых оценок, так как и то и другое в значительной мере определяет возможность применения регрессий для прогнозирования. § 1. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ ОСНОВНЫЕ ДОПУЩЕНИЯ И СВОЙСТВА ОЦЕНОК Рассмотрим самый простой случай. Пусть нам необходимо описать в виде некоторой функции взаимосвязь двух переменных 1 Отметим лишь две специальные работы: Линии к Ю. В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. М., Физматгиз, 1962; Перегудов В. Н. Метод наименьших квадратов и его применение в исследованиях. М., «Статистика», 1965, а также недавно вышедшую книгу: Маленво Э. Статистические методы t эконометрии (Пер. с франц.). Вып. 1. М., «Статистика», 1975. Метод наименьших квадратов с большей или меньшей детализацией рассматривается также в многочисленных курсах математической статистики и общей теории статистики. 64
величин у и х. Предполагается, что между этими величинами теоретически существует простейшая линейная зависимость: У = * + Зх, (3.1) где а и р — постоянные неизвестные коэффициенты (параметры) „ х — независимая, у — зависимая переменная. Практически, однако, между у и х обычно существует не столь жесткая зависимость. Даже если она может быть представлена, допустим, в виде линейной функции, то отдельные наблюдения у будут в большей или меньшей мере отклоняться от линейной взаимосвязи в силу воздействия различных неучтенных факторов,, а также случайных причин, влияния возмущений, помех и т. д. Отклонения от теоретической выбранной взаимосвязи, естественно* могут возникнуть и в силу неправильной спецификации уравнения,, т. е. неправильного выбора формы самого уравнения, описывающего эту взаимосвязь. В дальнейшем, однако, будем полагать, чта спецификация выполнена правильно. Учитывая возможные отклонения, уравнение взаимосвязи двух переменных (парную регрессию) можно представить в виде у = а + р* + е, (3.2) где s — случайная переменная, характеризующая отклонение от теоретической линии. Для краткости будет называть эту переменную возмущением. гТаким образом, в уравнении (3.2) значение у представляется как сумма двух частей — систематической (а + $х) и случайной (е). Уравнение (3.1) характеризует некоторое среднее значение у для данного значения х, в свою очередь уравнение (3.2) показывает индивидуальные значения у с учетом возможных отклонений от средних.; Относительно возмущения s сделаем следующие предположения *: 1. Возмущение е является случайной переменной. 2. Математическое ожидание 8 равно нулю. 3. Дисперсия возмущений постоянна. 4. Последовательные значения s не зависят друг от друга. Таким образом, при построении регрессии (в данном случае линейной парной регрессии) принимается гипотеза о том, что для каждого наблюдения i справедлива следующая взаимосвязь: у, = а + (Ъс£ + е,. 1 Подробное обоснование некоторых приводимых гипотез о свойствах возмущений см. в работе: А м и р о в И. Оценка параметров линейных эконометри- чеекпх моделей.— В сб.: Математические методы в экономике и международных отиомкчгпих Вып. 1. («Проблемы эконометрического моделирования»). М., ИМЭМО, 1972. 3 Е. М. Четыркин 65
Математическое ожидание, дисперсия и ковариации возмущения 8г- имеют следующие значения: ' £(в,) = 0; £,(eie,) = < . где t, / = 1, ..., n — номер наблюдения; символ Е указывает на операцию определения математического ожидания, отсюда Е (бг8г) — дисперсия возмущения, Е (ei8i) — ковариация. Итак, в результате статистического наблюдения мы имеем ряд характеристик независимой переменной х\ и соответствующие значения зависимой переменной у\. Задача, следовательно, заключается в определении параметров а и р.( Однако истинные значения этих параметров получить нельзя, так как мы опираемся на ограниченный объем информации — на выборку ограниченного объема, поэтому получаемые расчетные значения параметров являются статистическими оценками истинных параметров аир. Обозначим соответствующие (выборочные) оценки как а и Ь. Таким образом, уравнение парной регрессии у = а + Ьх есть оценка взаимосвязи у=а + fix/ Приняв некоторую гипотезу о форме кривой, описывающей взаимосвязь переменных у и х (например, допустим, это будет простая линейная взаимосвязь), нам тем не менее не удается однозначно подобрать параметры уравнения, так как через область, в которой расположены точки, соответствующие отдельным наблюдениям, можно провести множество прямых (например, соединить первую и последнюю точку и т. д.). Необходим некоторый критерий. В качестве такого критерия, естественно, принять требование о соотношении значений наблюдений и расчетных данных, поскольку существует стремление провести прямую в целом наиболее близко к данным наблюдения. Различные методы оценивания параметров опираются на различные критерии, измеряющие степень близости расчетных и фактических данных, и, разумеется, дают разные значения оценок параметров для одной и той же совокупности наблюдений. При этом оказывается, что получаемые оценки обладают различными статистическими свойствами1. Наиболее распространенным в силу своей простоты и сравнительно широкой области приложения является метод наименьших квадратов, МНК. Немаловажно и то, что получаемые МНК оценки при условии, что сделанные выше предположения относительно s справедливы, обладают рядом ценных для последующего применения регрессий в прогнозировании свойств2, а именно: 1 Краткий сравнительный анализ подходов к определению коэффициентов регрессии, отличных от метода наименьших квадратов, приведен в работе: Л и з е р С. Эконометрические методы и задачи (Пер. с англ.). М., «Статистика», 1971, с. 15—21. 2 Доказательство свойств оценок мы здесь не приводим. Доказательство несмещенности оценок для более общего случая (для множественной линейной регрессии) рассмотрено в § 2. 66
1) оценки параметров являются несмещенными, т. е. математи- ■u-ское ожидание оценок параметров равно истинному значению параметров, в частности для парной регрессии Е(а) — а и£(6)=р. Данное свойство является логическим следствием второго предположения ,о характере возмущения г. иНесмещенноеть означает, что выборочные оценки параметров концентрируются вокруг неизвестных истинных параметров;^ 2) оценки состоятельны, иначе говоря, дисперсия оценки параметра стремится к нулю с возрастанием я. Для парной регрессии это свойство можно записать так: 11т о* = О и limo2 = 0; /2 ~> оо П-уоо 3) оценки являются эффективными в том смысле, что они имеют минимальную дисперсию по сравнению с любыми другими оценками этого параметра. Если предположение 3 или 4 нарушено, то свойство несмещенности и состоятельности оценок сохраняется, однако оценки оказываются менее эффективными,, чем в случае, когда эти допущения соблюдаются. Совершенно очевидно, что для прогнозирования не безразлично, какими свойствами обладает оценка. Что касается свойства несмещенности, то оно является необходимым. \В самом деле, смещенные оценки априори дают неверное положение кривой в пространстве независимых переменных. Свойство состоятельности означает, что при увеличении объема наблюдения оценки параметров становятся более надежными в вероятностном смысле, т. е. с ростом п оценки, все плотнее концентрируются вокруг истинных неизвестных значений параметров. Свойство эффективности в общем является наиболее важным, поскольку оно определяет степень возможной ошибки прогноза.) § 2. ПАРНАЯ РЕГРЕССИЙ ОЦЕНИВАНИЕ ПАРАМЕТРОВ Рассмотрим график (рис. 3.1), на котором показаны результаты наблюдений значений переменных у я х. Пусть для большей конкретности последние характеризуют, скажем, производительность труда и фондовооруженность на однородных предприятиях какой- либо отрасли. Через область, занимаемую точками на графике,, проведена прямая у — а+Ьх. Отклонение (возмущение) какой- либо точки с координатами xif yi составит величину е%: *i = Vi—lti = У« - (а + bxi)> (3.3> кпк и выше, здесь у%— фактическое, а yi — расчетное значение зависимой переменной у. 3* 67
Как видно из (3.3), величина е* (ее часто называют остаточным членом) есть функция параметров а и Ь. Точно так же функцией этих параметров является обобщенный показатель рассеяния точек вокруг прямой, а именно Ъе] =f (a> Ь)( Стремление найти прямую, которая наилучшим образом описывала бы расположение точек в пространстве переменных у и х, или, иначе говоря, прямую, к которой в целом наиболее тесно примыкали бы отдельные точки, трансформируется в методе наименьших квадратов в критерий, согласно которому параметры а и Ъ должны быть подобраны так, чтобы сумма квадратов величин ei была минимальной, т. е. Ее? = min V v Как известно, необходимым условием существования минимума функции в точках а и Ь является равенство нулю частных производных по неизвестным параметрам а и Ь. Итак, найдем для функции Q^Z/i^Ziyt-yf Y)(yt — a—Ьхь)~ 1 = 1 (3.4) частные производные и приравняем их нулю: -*Г=-2Е (У<-а-Л*,)=0; w 1 = 1 4£-=-2 Е (*-«-*■*,)*,=(>. (Преобразовав систему (3.4), получим стандартную, форму нормальных уравнений2: T1yl = na + byEixi; IjE-^y^аЕ■*, + *£*?- ■ Таким образом, определив по наблюдениям суммы 2#г, 2х*#/ и 2х? и решив систему (3.5) относительно неизвестных а и fe, получим оценки а и Ь, отвечающие условию (3.4) и обладающие свойствами несмещенности, состоятельности и эффективности, если выполняются гипотезы 1—4 и независимая переменная не содержит ошибок. Разделим первое уравнение системы (3.5) на п, получим у = а + Ьх. (3.6) Рис. 3.1. Линейное уравнение регрессии 1 Если бы мы вместо 2ej взяли другой критерий, например сумму абсолютных значений eit т. е. 2 |е<|, то мы также смогли бы получить оценки а и 6, однако они не обладали бы всеми теми свойствами, о которых было сказано выше. 2 Здесь и далее предполагается, что суммирование производится с»«1 по i = пч 68
Таким образом, метод наименьших квадратов дает такие оценки а и б, при которых найденная прямая проходит через точку i1 координатами х, у> т. е. точку, соответствующую средним обеих переменных. Значения переменных Хг и у± могут быть измерены в отклонениях от средней, т. е. как хг— х и у% — у. Обозначим эти разности как х\ и у\ соответственно. Начало координат при этом переместится в точку х, у, а система нормальных уравнений упростится, так как Ъу\ и Ъх\у естественно, равны нулю. В этом случае решение второго уравнения системы (3.5) относительно Ь дает а из уравнения (3.6) получим а = у — ftx. (3.8) Необходимые для расчета Ъ суммы отклонений могут быть получены по исходным данным следующим путем 1: , ^(xtf^^xf-nx2: (3.9) 2 х[ - y'L = S д:^ — ял-у. (3.10) Рассмотрим условный пример. Пусть годовая производительность труда (в расчете на одного рабочего) и энерговооруженность на 14 предприятиях одной отрасли характеризуется следующими данными: Предприятие 1 2 3 4 5 6 7 8 9 10 11 12 13 14 труда, тыс. руб. на 1 рабочего 6,7 6,9 7,2 7,3 8,4 8,8 9,1 9,8 10,6 10,7 11,1 11,8 12,1 12,4 Энерговооруженность кВт на 1 рабочего 2,8 2.8 3,0 2.9 3.4 3.9 4.0 4,8 4.9 5.2 5,4 5,5 6.2 7,0 1 Так, JjxWi ж £ С**—*) (л — у) = Е хм—Е *У1—Е y*i + L *>' "-= -^^1У1 — пх-^—пу^ + пху = £ */И — 2/^у + /2*7 = Е **У* —л*у. Если_в только что выведенное выражение вместо уь yi и у подставить *;, х\ и *, то получим S xi x't e Е ***' — пхх, £ (л:))2 = 2*?— п* •
На основе приведенных данных получим необходимые для расчета уравнения регрессии величины: - = ^^ = 9,4928; х=,^=Ц^- = 4,4143; • S W)2= S^c?-^2 = 296,8 —14-4,41432 = 23,9973; . Е *i .yl = S **У* - ^У = 622,81 —14-4,4143-9,4928 = 34,7516. Откуда S^i _ 34,7616 =M1S1. v~ V (*|)8_ 23,9973 1,та|' a = у - bx = 9,4928 — 1,4481 -4,4143 = 3,1003, и уравнение регрессии с оцененными параметрами имеет вид: у. = 3,1003+ 1,4481л,; КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ^равнение регрессии характеризует взаимосвязь между пере- менными х я у в том смысле, что показывает, как изменяется величина у в зависимости от изменения величины х. Однако в самом уравнении регрессии с оцененными параметрами нет указания на то, как близко находятся фактические наблюдения от расчетных (полученных по регрессии), иначе говоря, нет указания на степень тесноты связи между переменными.уПоэтощ оценка параметров регрессии обычно сопровождается расчетом такой дополнительной характеристики, как коэффициент корреляции, который представляет собой эмпирическую меру линейной зависимости между х и у. Коэффициент корреляции для некоторой выборки значений х и у определяется по формуле S*jyj (3 1П Величина г лежит между—1 и 1. Чем выше значение г, тем теснее связь между переменными и тем с большим основанием найденная взаимосвязь может быть использована для прогнрзи- рованияДКоэффициент корреляции также может рассматриваться как один из критериев качества подбора функции. При этом ов адекватен критерию, лежащему в основе МНКХ 70
Для того чтобы определить г по формуле (3.11), по данным нашего примера необходимо найти величину Ъ(у\)2. Остальные, входящие в это выражение величины уже исчислены при оценивании параметров регрессии. По аналогии с (3.9) находим: ЕЫ)2=£у?—л7 = 1313,95 —14-9,49282 = 52,35. Коэффициент корреляции равен: r= / 34'7516 = 0,98. /23,9973-52,35 Полученное значение коэффициента корреляции указывает на весьма сильную взаимосвязь соответствующих признаков. 'После получения г можно продолжить статистический анализ, исследовав вопрос, в какой мере полученный коэффициент корреляции существен; (т. е. существенно ли г отличается от нуля или его отличие от нуля можно приписать влиянию случайности, связанной с выборкой). Для""эж>го дополнительно к предположениям 1—4 (с. 65) примем следующее: возмущения имеют нормальный закон распределения. Для проверки существенности при небольшом числе наблюдений применяют формулу (3.12) Величина t здесь следует ^-распределению Стыодента, поэтому найденное по формуле (3.12) значение t можно сопоставить с табличным значением U при п — 2 степенях свободы. В нашем примере ^0 981^2 j/1-0,982 в то же время ^=2,179 при а5=0,95. Следовательно, данный коэффициент существенно отличается от нуля, чего, впрочем, и. следовало .ожидать, так как при значениях г, близких к± 1, эта характеристика обычно существенна. ОШИБКИ ПАРАМЕТРОВ И УРАВНЕНИЯ РЕГРЕССИИ Итак, мы оценили параметры а и Ь и получили регрессию, на основе которой можно предсказывать значения у в зависимости от значений я. Естественно полагать, что действительные значения зависимой переменной не будут совпадать с расчетными (прогнозными), так как сама линия регрессии -описывает взаимосвязь лишь в среднем; в общем. Отдельные наблюдения рассеяны вокруг нее. Таким образом/ первым и наиболее очевидным факто- 71
ром, во многом определяющим надежность получаемых по уравнению регрессии прогностических оценок, является рассеяние наблюдений вокруг линии регрессии:! В качестве меры рассеяния примем такую общераспространенную характеристику, как дисперсия. Для ее определения найдем сумму квадратов отклонений фактических наблюдений от линии регрессии с параметрами а и Ь> т. е. ЗеД Величина е% рассчитана выше с помощью выражения (3.3). Из рис. 3.1 легко установить, что ее можно найти как ei = y\ — bxi, где t/i и xi — отклонения от соответствующих средних. Отсюда Последний член этого выражения можно переписать, используя соотношение (3.7), следующим образом: Ъ \xi) Теперь Hei2 можно вычислить, минуя определение et: S4=S(yi)2—ftE^Iyl-- (3.14) Значение величины Ее*2 дает возможность определить оценку дисперсии отклонений от регрессии. Эта оценка, как известно, равна сумме квадратов отклонений, деленной на число степеней свободы. В данном случае она составит1: TV *2=~^Г- (3.15) Величина s2 является выборочной оценкой дисперсии случайных членов 8г, содержащихся в теоретической модели (см. 3.2). Рассмотрим теперь метод определения доверительных границ %ля значения у, т. е. тех границ, в пределах которых с заданной доверительной вероятностью будет находиться значение у. Итак^ в силу того, что оценивание параметров осуществляется по выборочным данным, оценки а и Ь содержат некоторую погрешность. Причем погрешность в значении а приводит к вертикальному сдвигу линии регрессии. В свою очередь колеблемость оценки Ь9 связанная с ее выборочным происхождением, приводит к «покачиванию» линии регрессии. При одной и той же оценке а линия регрессии будет поворачиваться вокруг оси с координатами х9 у. Таким образом, дисперсия значения зависимой переменной,. определяемой по уравнению парной регрессии (напомним, что это среднее значение у для данного значения х) будет складываться 1 Знаменатель здесь равен п — 2 в связи с тем, что две степени свободы теряются при определении двух параметров уравнения прямой. 72
л.: диух компонент — дисперсии параметра а и дисперсии параметра Ъ. Удобнее, однако, определить дисперсию у как сумму дисперсий слагаемых уравнения y=y+bxf, откуда где АГр' — значение переменной х (выраженное в виде отклонения от средней), для которого определяется у. Из выражения (3.16) видно, что 5- имеет минимальное значение в точке хр= 0. В этом случае s| = s2/n. Зная дисперсию показателя у, легко определить доверительные границы для него. Так, для расчетного значения у доверительные границы равны - - У±'Д% (3.17) где J а—статистика Стьюдента. По данным рассмотренного выше примера с производительностью труда получим: 2 е2 = 52,35 — 1,4481,34,7516 ^ 2,024, 2 2,024 откуда 14^2 ^°>1687' „2 _г> i^o-rf ! _i_ \Хр) sy7 =0,1687 .и , 23,997 Пусть, например, нам необходимо определить среднее значение производительности труда, соответствующее энерговооруженности, равной 5,5 кВт. Тогда у = 3,1003 + 1,4481 -5,5 s 11,06 тыс. руб. и 2 ai^otM ! (5,5 — 4.4143)2] _ЛГкГ> * sf = 0,1687 [p+v 23>997—^-J^0,02 тыс. руб. T.'ikhm образом, среднее расчетное значение у при условии, что мы приняли 95%-ную доверительную вероятность (а этому при числе степеней свободы, равном 14—2=12, соответствует t* = 2,179) составит: 11,06 ± 2,1791^002 s 11,06 + 0,4. Пели нанести доверительные границы на график (рис. 3.2), то счш расположатся выше и ниже линии регрессии в виде ветвей гиперболы,- ограничивая доверительную область. Эта доверительная область определяет местоположение линии регрессии (т. е. средних величин у), но не отдельных возможных значений зави- 73
симой переменной, которые отклоняются от средней. Следовательно, если мы хотим определить доверительные интервалы для отдельных значений зависимой переменной, то при определений дисперсии необходимо учитывать еще один источник неопределенности— рассеяние вокруг линии регрессии, иначе говоря, в суммарную дисперсию следует еще включить величину s2. Таким образом, уравнению у г = а + Ьх% + е* соответствует дисперсия EW или t*SQ 1 + (*пУ S W)" (3.18) Рис. 3.2. Доверительные интервалы линейного уравнения регрессии Доверительные интервалы для прогнозов индивидуальных значений у% будут, следовательно, равны y±4v (3.19) Для нашего примера получим: s? = 0,1687 [l 1 , (5,5 — 4,4143)2 14 23,997 ]=0, 188, откуда У» = П,0б ± 2,1791/0,188 s 11,06 ± 0,94. Доверительный интервал в нашем примере оказался сравнительно небольшим. Однако если взять значение независимой переменной, которое в большей мере удалено от х, чем хр = 5,5, то доверительный интервал, естественно, увеличится. Так, для хр = 8 получим s 5^ 0,31, sp^0,88, и, следовательно, доверительные интервалы для уравнения и отдельного наблюдения будут соответственно равны при той же доверительной вероятности +2,179 • • 0,31 а'± 0,76 и +2,179 • 0,88^+1,19. § 3. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ ОЦЕНИВАНИЕ ПАРАМЕТРОВ МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ В парной регрессии значения'у зависят от значений одной независимой переменной х; в общем случае зависимая переменная может быть функцией нескольких переменных хи х%, ..., хм. В каждом наблюдении (обозначим номер наблюдения через г) получают совокупность значений независимых переменных хц9 Хы, ..., xim. и соответствующее значение зависимой переменной у*. Итак, допустим, У/ = *!•% + *Л2 + ... + amxim + е,. (3.20) 74
Введем теперь матричные обозначения. Пусть вектор неизвестных параметров <х = (а>7), / = 1, 2, ... г т, вектор зависимой переменной У= {уг)у i= 1, 2, ..., п, матрица независимых переменных X — (хгз)> размер которой определяется числом наблюдений (п) и числом переменных (т), вектор ошибок г—(&i). Перепишем линейную модель (3.20) в матричном виде *. Г = ^а + е. (3.21) Относительно ошибок г примем следующие предположения, которые ' в точности соответствуют предположениям (см. 1—4, с. 65), сделанным нами для парной регрессии. Введем_Щ1ед110ЛОжети^1.5 для уравнения с многими независимыми переменными. 5. Матрица X состоит из линейно-независимых вектор-столбцов, т. е. между векторами xt, Хг, ..., хш нет линейных зависимостей. Последнее обстоятельство эквивалентно тому, что ранг матрицы X равен пи, а это в свою очередь означает, что |Х'Х|=т^0, т. е. матрица Х'Х обратима (матрица X' является транспонированной матрицей X). Матрица X не содержит ошибок. Оценку выражения (3.20), полученную по выборочным данным, запишем в виде yt = atxn + a2xl2 + ... + amxim + et. (3.22) Сумму квадратов отклонений теперь можно определить как = Y'Y—a'X'Y— Y'Xa + a'X'Xa. Так как a'X'Y^Y'Xa, то Q = Y' Y—2a'X' Y + а'Х'Ха. (3.23) Продифференцируем Q по а, получим2: -^ = -2X'Y + 2 (Х'Х) а. 1 В качестве специального пособия по матричной алгебре для экономистов, в котором рассматривается регрессионный анализ в матричном изложении, можно указать на работу:'Сир л С, Г осман У. Матричная алгебра в экономике (Пер. с-англ.): М., «Статистика», 1974. 2 По определению Q{a) ~ min Q(a), здесь Q(a)—сумма квадратов отклонений для регрессии с параметрами аи а% ..., а Q(a)—сумма квадратов отклонений для регрессии с параметрами cti, a2, ... Найденный минимум будет абсолютным, так как вторая производная является положительно-определенной матрицей: 75
Приравняем данный результат нулю. После этого легко находим систему нормальных уравнений, которая в матричной форме записывается как X'Y=X'Xa, отсюда } a = (X'X)~i-X'Y. \ (3.24) Оценку а, найденную по формуле (3.24), будем называть оценкой метода наименьших квадратов, или оценкой МНК. Для определения вектора а нам необходимо по данным наблюдения найти матрицу, обратную к матрице Х'Х9 и вектор X'Y; |-V J* Х'Х = 2j xi\ 2j xliXi2 • • • 2j xi\xim i i i 2j Xi2Xil 2-1 xi1 • • • 2j xi2X\ iTT'im 2j ximXn 2-1 xlmx& • • • 2j xim (3.25) X'Y = "ЕУЛ1' 2j y^/2 Еул* (3.26) Обычно предполагается, что уравнение регрессии имеет свободный член, т. е. ао. Для того чтобы получить оценку этого параметра («о), расширим матрицу (3.25), введя в нее переменную Хм'=1. Тогда матрицу X в развернутом виде можно записать как 1 Х Ц Х\2 • • • Х' * х2\ "^22 • • • "^4 \м 2пг х=\ 1 Хп1 Хп2 • • • Хп 76
откуда Х'Х = п Jjxn • ■ • L ^/m • • • 2j xi\xim L 2j ^ш 2j Хцх1т • • • 2j -*i ,2 i/n (3.27) X'Y = Ey* 22 УЛ1 LSy^/mJ (3.28) Суммирование здесь, как и в (3.25) и (3.26), производится от t == = 1 до i — п, т. е. по всем наблюдениям. В частном случае, когда т = 2, Л"ЛГ = Л 2j •% _2j Xi2 2j -*и Zj-^a 2j XllXi2 2j ^2 2j xaxi2 2j ■*« (3.29) Возьмем следующий условный пример. Пусть у находится в не- ' которой зависимости от двух переменных хх и х?. Взаимосвязь должна быть оценена на основе следующих наблюдений: У1 хц Х12 1 2 3 4 5 6 7 8 9 10 Таким образом, Г= К ) 2 12 2 1Z 8 13 2 15 6 10 3 14 5 12 3 16 9 18 10 j "10- 12 17 16 _18_ • .* = "1 2 1 2 1 8 i '9 1 10 1 2 10 4 8 4 7 3 10 11 1~ 2 10 10 11 5 77
откуда Х'Х = 1 1 1. 2 2 8. 1 2 10. .. 1 1 .. 9 10 ..10 11 2 2 8 9 10 Г 2 10 10 11 10 50 60 50 336 398 60 398 480 X'Y= 1 2 1 1. 8. 10. 1 9 10 1 10 И "10" 12 17 16 _18_ в 137 1 756 _908 1 Матрицу Х'Х и вектор X'Y можно практически получить и по формулам (3.27) и (3.28), предварительно подсчитав необходимые суммы: Еу,= 137, .Е*й = 50, 5>/2 = 60, Цу?=1947\ Е*?! = 336, Е*?2 = 480, ИУЛ1 = 756, 2x^ = 398, Еу,хй = 908. Результат, естественно, будет одинаковым. Определив Пи X'Y, находим: 1 а = (Х'ХГХ'¥= 7Ш Таким образом, 2 876 -120 -260 -120 1200 -980 -260 -980 860 ("137" 756 11_908_ = "9,3871] 0,1285 0,6174J у = 9,3871 + 0,1285*! + 0,6174*2. Приведем рассчитанные по данному уравнению регрессии значения зависимой переменной (у*) и соответствующие ошибки (е*): У1 10 12 17 13 15 10 14 12 16 18 2 2 8 2 6 3 5 3 9 10 xi2 1 2 10 4 8 4 7 3 10 11 Уь et 10,2559 10,8676 16,5324 12,0910 15,0520 12,2195 14,3117 11,6078 16,6609 17,4012 -0,2559 1,1324 0,4676 0,9090 —0,0520 -2,2195 —0,3117 0,3922 -0,6609 0,5988 Итого 137 137,0 1 Эта величина понадобится далее при расчете коэффициента корреляции, для расчета же параметров она не нужна. 78
Как можно заключить из приведенного примера, наиболее трудоемкой операцией здесь является определение обратной матрицы1. В рассмотренном примере число независимых переменных равно 2. Уравнение (3.24) позволяет в принципе решить задачу оценивания для любого конечного числа независимых переменных. При расчете регрессий с достаточно большим числом переменных при большом объеме наблюдений необходимо применение ЭВМ. !" Поскольку задача с двумя независимыми переменными встречается довольно часто, то рассмотрим еще ^вариант _ее решения, минуя обращение матрицы Х'Х. Для этого выпишем соответствующую систему нормальных уравнений: Е Уь = naQ + a 2 хп + аг 2 ■%; 2] yixi = а0 2J хп + а>\ 2j хя + аг 2j xi\xv& 2j ytxi2 = a0 2j -^/2 + ai 2j ■* д-*ю + #2 2j -*й« Суммирование везде производится по всем наблюдениям, т. е. от i = 1 до i = п. Для нашего примера значения сумм были получены выше. Подставив их в данную систему, получим: 137 = 10а0Ч- 50^! + 60я2; 756 = 50а0 + 336^! + 398я2; 908 = 60а0 + 398at + 480я2. Решение системы относительно неизвестных параметров и дает, разумеется, тот же результат, что и матричное уравнение: ■ а0 = 9,3871, ау =0,1285, а2 = 0,6174. СВОЙСТВА ОЦЕНОК МНК Вернемся к формуле (3.24). Введем новую матрицу С. Пусть С=(Х'Х)-*Х\ тогда a=CY, где С —детерминированная (неслучайная) матрица размером тХ я. Отсюда вытекает, что оценка МНК будет линейной функцией по у, т. е. 0у = CtJyt + Cvy2 + ... + CnJyn, j= 1,2,..., т. . и является линейной комбинацией случайных величин уи у2> ..., уп~ Таким образом, а = (щ) также является случайной величиной. Как всякая случайная величина, оценка МНК а имеет свое математическое ожидание, дисперсию и т. д. Найдем математическое ожидание оценки МНК. Для этого определим математическое ожидание У, оно равно: E(Y)=E{XoL + e)=Xa + E (в). Так как Е (в) = 0, то Е (У) = Ха. Тогда Е (а) = Е [(Х'Х)"1 X' У] = {Х'Х)-' Х'Е (Г) = а. 1 В данном случае обратная матрица найдена как произведение обратного значения определителя на матрицу алгебраических дополнений. 79
Итак, математическое ожидание оценки МНК равно истинному значению вектора параметров. Таким образом, оценка а является несмещенной. Свойства состоятельности и эффективности для оценок МНК доказываются не так просто, как свойство несмещенности, поэтому мы не будем останавливаться на них1. Приведем лишь полученные результаты. Так, для любого параметра а$ limo2 = o. Л->оо Другими словами, дисперсия оценки каждой компоненты вектора а при неограниченном увеличении числа наблюдений стремится к нулю, следовательно, оценки параметров являются состоятельными. Перейдем теперь к свойству эффективности. Оценка а$ некоторого параметра а;- называется, эффективной, если она имеет минимальную дисперсию среди всех возможных оценок неизвестного параметра а$. В многомерном случае, т. е. при анализе зависимости от нескольких переменных, получают так называемую матрицу ковариаций, характеризующую дисперсии оценок и их ковариаций. Напомним, что под термином ковариация понимается математическое ожидание произведения отклонений двух случайных переменных от их математических ожиданий, т. е. для переменных Xi и yt cov (х, у) =E(Xi—E(x)) (yi — E(y)). Доказательство эффективности оценок заключается в обосновании того, что оценка МНК имеет минимальную матрицу ковариаций среди всех несмещенных оценок линейных по у, т. е. cov(a) <cov(a*), где cov(a)—матрица ковариаций оценок а, а*— некоторая оценка, линейная по у. Из этого неравенства, в частности, следует, что дисперсия каждой компоненты вектора а. будет не больше соответствующей компоненты вектора а*.2 Таким образом, оценка МНК множественной линейной регрессии является несмещенной, состоятельной и эффективной. ДИСПЕРСИЯ ОЦЕНОК ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ Как было показано выше, оценивание параметров линейной множественной регрессии осуществляется по данным наблюдения (т. е. на основе матрицы X и вектора У). Естественно, что эти оценки, как и в случае парной регрессии, будут отклоняться от истинных значений соответствующих параметров. Дисперсия урав- 1 Вариант доказательства этих свойств, в котором показана зависимость свойств от положенных в основу метода оценивания предположений, приводится в работе: Амиров И. Оценка параметров линейных эконометрических моделей.— В сб.: Проблемы эконометрического моделирования. Мм ИМЭМО, 1972. 2 Иначе говоря, матрица cov(a*) —-cov(a) является неотрицательно-определенной"! 80
нения регрессии будет функционально . зависеть от дисперсии оценки каждого параметра уравнения. Для того чтобы измерить дисперсии оценок параметров, найдем матрицу ковариаций для а. По определению имеем: cov (а) ^Е[(а — а) (а — а)']. Уже из этого выражения вытекает, что элементами главной диагонали матрицы ковариаций являются дисперсии параметров а;\ Поэтому рассмотрим ее более подробно. Прежде всего определим, чему равно выражение (а—.а) (а — а)'. Из (3.21) и (3.24) следует, что а = {Х'ХУ1 Х'У = (Х'Х)~* X' (Хк + е) ~ а + {Х'Х)7* Х% откуда а — *=(Х'Х)-1Х'*. Использовав найденное выражение для (а — а), получим: cov (а) = Е [{Х'ХУ1 Х'е.е'Х{Х'Х)-+\ == Е(ее'). {Х'Х)~\ (3.30) Полученное выражение содержит матрицу £(ее'): "*(•?) ^(eie2> -.. £(VJ" *(«2«i) E{4) ... Е(е2впу Е (м') = L^(Vi) *(Vi) в [A) J В данной матрице все элементы, не лежащие на главной диагонали, равны 0 (в силу того, что ошибки не коррелируют между собой, см. предположение 4, с. 65). Тогда £(.'.) = "£(•?) 0 .. 0 Я (4) . 0 0 0 *W). (3.31) Поскольку все ошибки имеют одинаковую дисперсию (см. предположение 3), то i?(es')=o2./, (3.32) где / — единичная матрица. Подставив найденное значение Е (ее') в (3.30), получим: -\ cov(a) = c*-(X'X)-\ (3.33) 81
Матрица ковариаций (3.33) не может быть определена точно, поскольку в нее помимо обратной матрицы (Х'Х)~1 входит в качестве множителя и дисперсия ошибок о2, величина которой нам неизвестна. В качестве статистической оценки а2 можно воспользоваться наблюденной дисперсией ошибок. Примем, что е = (ег) — = 7— У, тогда в качестве оценки а2 найдем: S2 - Q - е'В = ^*? п — т — 1 п — т — 1 п — т — 1 # Знаменатель этой формулы представляет собой число степеней свободы. Последнее равно числу наблюдений за вычетом числа оцениваемых параметров (напомним, что. число оцениваемых параметров, включая свободный член а0, равно т+1). Полученная таким образом оценка s2 будет обладать свойствами несмещенности и состоятельности. Теперь на основе (3.33) определим значения дисперсий оценок а$, взяв вместо а2 оценку этой величины s2, получим: $°j) = Mjj> (3-34> где bjj — диагональный элемент матрицы (Х'Х)-1. В нашем примере матрица, обратная к Х'Х, равна: WW = ттаг 2876 -120 -260 -120 1200 -980 -260 -980 860 8,3678 10 — 3 = 1,1954. 2 2 5<*.) 2876 1200 860 следовательно, диагональные ее элементы составят: ^т™; ~щ; ут^. По данным этого же примера находим: Ее2* = 8,3678, откуда ^*\~ 1,1954^-0,4802; 1,1954-у^-- 0,2004; 4,^ = 1,1954-^ = 0,1436. Средние квадратические ошибки в этом случае будут равны: 5(йо) = 0,6925; ${0t) = 0,4476 и sw = 0,3789. Полученные квадратические ошибки могут быть использованы для определения доверительных интервалов параметров и для проверки существенности отличия а,- от нуля. В нашем примере уже простое сопоставление оценки ах с ее квадратической ошиб- 82
кой (0,1285 и 0,4476) говорит о том> что этот параметр оказывается несущественным. Проверка параметра а<ь дает ga-.Q_0.6l74. Табличное значение /-статистики при 95%-ной доверительной вероятности равно 2,365, следовательно, параметр можно признать существенным. Обычно, если проверка параметров приводит к тому, что один или несколько параметров оказываются несущественными (несущественно отличаются от нуля), то они исключаются из регрессии, и оценивание параметров повторяется уже для нового набора независимых переменных. В частности, если в нашем примере исключить первую независимую переменную, то оценивание парной регрессии приведет к следующему результату: £ = 9,4+ 0,7166*,. КОЭФФИЦИЕНТ МНОЖЕСТВЕННОЙ КОРРЕЛЯЦИИ Взаимосвязь зависимой переменной у с рядом независимых переменных х измеряется в целом с помощью коэффициента множественной корреляции, который вычисляется следующим образом: Смысл данного коэффициента легко понять, рассмотрев подкоренное выражение (3.35).(Чем теснее данные примыкают к линии регрессии, тем больше эта величина:, Если линия регрессии полностью описывает зависимую переменную, то R = 1, к противном случае |/?|<1. По данным нашего примера сумма квадратов отклонений от средней для зависимой переменной составит: 2 (У| — у)2= £ У\ — пу2= 1947— 10-13,72 = 70,1.' Откуда R = V 1 - ^i = 1/0,8806 = 0,938. Для определения R можно воспользоваться другой формулой, соответственно которой нет необходимости подсчитывать е* и Ее2. В самом деле, поскольку %*t = e'e(Y—Xa)'(Y—Xa)=Y'Y—2a'XY + a'X'Xa = = Y'Y—a'X'Y (3.36) и 83
= Г Y— (Г Y — а'Л" Г) — яу2 = а'*' Г - яу2, (3.37) то /? = л[ *£!=£ = V**±=4. (3.38) ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ РЕГРЕССИИ. ОШИБКА ПРОГНОЗА Пусть прогнозируемое значение у определяется по уравнению регрессии с оцененными параметрами у = а0 + аухх + а2х2 + ... + атхт. (3.39) В силу того,~что aj — несмещенные оценки некоторых неизвестных параметров соответствующей взаимосвязи, у— одно из возможных значений прогнозируемой величины при заданных значениях ху точнее — это оценка среднего значения t/. "Поскольку щ случайная величина, то и оценка у также случайна и имеет дисперсию. Определим ее значение. Обозначим операцию определения дисперсии символом D, тогда D(y)=D (а0 + ахх, + а2х2 +... + атхт). Использовав известную теорему о дисперсии суммы зависимых величин1, получим: о) = D[y) = D (а0) + x\D (а{) + x\D (а2) + ... + J&D (am) + + 2*i cov (а0, а,) + 2-*,x>cov (аь а2) + ... + 2хт_ххтcov (am_u ат). Здесь символом cov (а*, а$) обозначена ковариация случайных переменных а* и а,; напомним, что cov (a*, aj) = Е (а*, а;). Поскольку выше мы уже пользовались матричной записью, то перепишем полученное выражение следующим компактным способом: 0[у) = Х'рсоу(а)Хр9 (3.40) где Хр = (1 xPv xVv ...»хРт) — вектор заданных значений независимых переменных, cov (a) — матрица ковариаций оценок а. Откуда, использовав выражение (3.33), получим: D[y)~o*Xp(X'X)-*Xp. 1 Согласно этой теореме т / D (*i + х2 + ... + хт) = S D (■*/) + 2cov (xit х>) + ... + 2cov (*m_lf *,„). 84
Поскольку значение а нам неизвестно, то введем в эту формулу ее оценку s2, откуда дисперсия у составит: %=МР{Х'ХГ*ХР. ^ (3.41) Таким образом, «истинное» среднее значение у лежит в пределах y±teVx'p{X'X)-*xp. Допустим, что в нашем сквозном примере прогноз осуществляется: по уравнению у = 9,3871 + 0,1285 *i + 0,6174 лг2, в котором, несмотря на то, что параметр а\ оказался несущественным, мы сохранили его- в уравнении (так,поступают, когда параметры уравнений в анализе не применяются и важно сохранить соответствующий член регрессии исходя из каких-либо содержательных предпосылок; допустим, в нашем примере следует сохранить член х{). Пусть теперь нам необходимо найти доверительные границы для значения у, соответствующего xPl= 10 и х^^Ю. Тогда вектор Х'р « =[1 10 10] и £/==16,946. Для определения s* нам прежде всего необходимо найти матрицу (XX)"1. По данным на с. 82 находим [0,4017 -0,0168 -0,0363] -0,0168 0,1675 -0,1369 . -0,0363 -0,1369 0,1201 J В соответствии с (3.41) [0,4017 -0,0168 -0,0363] Г l] —0,0168 0,1675 -0,1369 10 =0,8712.. -0,0363 -0,1369 0,1201 J Lioj Найдем теперь 95%-ные доверительные интервалы. Число степеней свободы здесь равно: п — т— 1 — 10—2—1 =7, ta =2,365. Откуда у + tasy= 16,946 ± 2,365Y0,8712 ^ 16,95 ± 2,21. Следовательно, с вероятностью 0,95 можно утверждать, что «истинное»- среднее значение*/при *i = 10 и л£= 10 лежит между 14,74 и 19,16. Тот факт, что диапазон для значения у оказался довольно широким, объясняется двумя причинами: малое число наблюдений привело к небольшому числу степеней свободы, а заданные значения Х\ и Хг находятся далеко от их средних значений. Доверительный интервал для у более точно можно трактовать следующим образом: в 95% случаев оценивания параметров одного уравнения (по выборкам с тем же числом данных из одной и той же совокупности) доверительные интервалы будут содержать «истинные» средние значения у для заданных Х\ и *2. Под прогностическим значением у можно понимать его математическое ожидание, т. е. Ха. Однако более естественно в реальное (прогностическое) значение у включить и отклонение; т. е. рас- 85
сматривать Ха + е. В этом случае к дисперсии у необходимо добавить и дисперсию е, т. е. s2. Таким образом, получим: sl = s2{\+X'p {Х'Х)^Хр}. (3.42) Соответственно доверительные интервалы для индивидуальной прогностической оценки у составят У ± tasp. (3.43) В нашем примере 4 = 1,1954 + 0,8712 = 2,0666, и, таким образом, интервальная прогностическая оценка составит: 16,946 ± 2,365 /2Д566 = 16,946 ± 3,394. АВТОКОРРЕЛЯЦИЯ ОСТАТКОВ. КРИТЕРИЙ ДАРВИНА—УОТСОНА При анализе и применении регрессий нельзя не забывать о таком явлении, как автокорреляция. Под автокорреляцией понимается корреляция между членами одного и того же динамического ряда; иначе говоря, автокорреляция — это корреляция ряда Хи х2, х3... с рядомяь + ь Хь + 2, *ь + з... Число L характеризует запаздывание (лаг). Корреляция между 'соседними членами ряда (L=l) называется автокорреляцией первого порядка. Степень автокоррелированнрсти ряда обычно измеряется с помощью коэффициента корреляции, который в этом случае называют коэффициентом автокорреляции. Автокорреляция часто наблюдается и между отклонениями от регрессий. Выше, при рассмотрении основных предположений, положенных в основу МНК, мы приняли, что ошибки 8г представляют собой случайные независимые (некоррелируемые) переменные со средней, равной 0. При работе с фактическими данными, особенно с динамическими рядами, такое допущение далеко не всегда имеет реальную почву. В самом деле, если вид функции (закон развития) выбран неудачно, то вряд ли можно говорить о том, что отклонения от регрессии являются независимыми. В этом случае обычно наблюдается заметная концентрация положительных и отрицательных отклонений от регрессии и можно сомневаться в их случайном характере. Если последовательные значения е$ коррелируют между •собой, то говорят, что имеет место автокорреляция ошибок. Метод наименьших квадратов и в случае автокорреляции дает несмещенные и состоятельные оценки. Однако получаемая при наличии высокой автокорреляции стандартная ошибка и соответственно доверительный интервал имеют мало смысла в силу своей ненадежности. Во всяком случае значительная автокорреляция говорит •о том, что спецификация регрессии неправильна. Здесь уместно по- $6
яснить термин «спецификация». Строго говоря, спецификация есть принятая при разработке модели система предположений о взаимосвязях явления. Так, если у связан с х квадратической зависимостью, а мы конструируем линейную модель, то можно сказать, что последняя неправильно специфицирована. Если определить соответствующую регрессию, то будет обнаружена высокая автокорреляция остатков. Дело, следовательно, заключается в определении — присутствует или нет автокорреляция в остаточных членах е\у особенно если исследуется динамический ряд. Существует ряд приемов обнаружения автокорреляции. Наиболее простым и достаточно обоснованным из них, по-видимому, является метод, предложенный Дарбином и Уотсоном, которые сконструировали критерий, связанный с гипотезой о существовании автокорреляции первого порядка, т. е. автокорреляции между соседними остаточными членами ряда. Соответствующая этому критерию статистика, обозначаемая обычно как d или иногда как DW, имеет вид 2 (et — et-rf d==,I^_ . (3.44> Здесь, для того чтобы подчеркнуть, что мы имеем дело с временными рядами, вместо i введем символ t, означающий номер члена п п в хронологическом порядке. Предполагая, что E*?»2rf-ii так t --2 /=2 как при высоком значении п эти две суммы мало отличаются друг от друга, получим *: П П / П v 2 2 *J-2 2 Vm / 2*A-i\ '- t=2 n l=2 = 21-4-1 (3.45> Вычитаемая из единицы дробь есть не что иное, как коэффициент* автокорреляции первого порядка Этот коэффициент равен 0, если автокорреляция отсутствует. Если: же наблюдается полная автокорреляция, то он равен 1 или —1. Отсюда следует, что при отсутствии автокорреляции (случайных отклонениях от регрессии) значение d примерно равно 2, а при. полной автокорреляции оно равно примерно 0 или 4. 1 Степень приближенности равенства (3.45) зависит от того, какова разность, между первым и последним остаточным членом. Если они равны, то вместо приближенного можно записать точное равенство. 87
Для d-статистики найдены критические границы, .позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Так; авторами критерия определены верхние (di) и нижние (du) траницы при 1; 2,5 и 5%-ном уровне существенности. Приведем некоторые значения этого критерия (табл. 3:1) *. Величины т означают число независимых переменных^ уравнении регрессии. Если эмпирическое значение d-статистики- находится в пределах of du до (Ay^du), то гипотеза об отсутствии- автокорреляций принимается; если эта статистика находится в пределах, от di до du или :между (4 — du) и (4 — di)> то нет статистических оснрваний ни .принять, ни отвергнуть эту гипотезу (области неопределенности); .наконец, если вычисленное значение d меньше di, то нет оснований лринять гипотезу о случайном характере отклонений (положительная автокорреляция), а если rf> (4—4г)> то наблюдается'отрицательная автокорреляция. " Таблица 3.1 ЗНАЧЕНИЯ КРИТЕРИЯ ДАРБИНА-УОТСОНА ПРИ УРОВНЕ СУЩЕСТВЕННОСТИ 5% } Число наблюдений п 15 20 30 50 100 - т = ] dl J,08 1,20 1,35 1.50' 1,65 **' 1,36 1,41 1,49 1,59 1,09 т = 2 \ 0,95 1,10 г,2а 1,46 1,63 du 1,54 1,54 1.57. 1 1,63 1.72 т «3 h 0,82' 1,00 1,21 1.42 1,61 ** 1,75 i.6a 1 1,65 1,67 1.74 т = 4 -л Q.69 0,90 1,14 1,38 1,59 1,97 1,83 1.74 1,72 1,76 т « 5 h 0,56 0,79 1,07 1,34- 1,57 du 2,21 1,99 1,83 1,47 1,7* Вероятно, в настоящее время -следует признать обязательным требование, согласно которому уравнение регрессии с численно оцененными параметрами -должно сопровождаться расчетным значением d-статистики. Если с помощью d-статистики обнаружена существенная автокорреляция отклонений от регрессии, то логично признать наличие ошибки в спецификации уравнения, Следовательно, надо вернуться к этой проблеме, пересмотреть набор включаемых в уравнение переменных и уточнить форму уравнения. В ряде случаев существенное уменьшение автокорреляции ^остатков дает включение в уравнение такой переменной, как время. Определим расчетное значение d-статЪстики по-данным нашего -сквозного примера с двумя независимыми переменными. Выше 1 Таблицы значений d\ и du для разного числа наблюдений и переменных, рассчитанные Дар бином и Уотсоном, приведены в работе: Лизер С. Эконо- ■метрические методы и задачи (Пёр. с англ.). М., «Статистика», 1971, Кроме того, они имеются в книгах: Химмельбл.ау Д. Анализ процессов статистическими методами (Пер. с англ.). М., «Мир», 1973; Браун М. Теория и измерение- технического прогресса (Пер.- с англ.). М., «Статистика», 1971. S8
было найдено, что 2е? * 8,3678. Сумма 2 (^—V,_i)2. составит ; для* этих же данны^величину 25,0169, откуда / ■ '' -. а~~ 8,3678; — 1,/у* Ближайшее табличное значение d определено для п = 15 (ф = 0,95;, du=^*l,54), поэтому прямое/сопоставление с табличными данными невозможно. Однако, учитывая - верхнюю критическую границу . (для п= 15) и тот факт, что расчетное значение оказалось близким 2, можно полагать, что наличие автокорреляции остатков н^ подтверждается. • . , . . ВКЛЮЧЕНИЕ ВРЕМЕНИ В РЕГРЕССИЮ' : «В уравнение регрессии можно в явном виде ввести в качестве- независимой переменной член, характеризующий время.. Обычно» время вводится в виде линейного члена, который иногда последовательно дополняется членами более высоких степеней этой переменной/ Уравнейие регрессии в этом случае будет иметь вид.г/^/ (Хи„ *ь ..., Хщу U t2> • • •) ■ Включение времени наряду с другими независимыми переменными позволяет выделить регрессию на не учтенные в явном виде факторы,- связанные со временем.- Очень часта в практических расчетах время в качестве независимой переменной включается в уравнение регрессии не наряду с другими переменными, а самостоятельно, т. е. регрессия теперь имеет вид у = / (/). • Аналитическое выражение в таком случае характеризует тренд раз^- вития изучаемого явления. Проблема,оценивания параметров трендов рассматривается в следующей, главе. При включении времени в уравнение регрессии в виде таких переменных, как ty /2, ...', методы оценивания параметров, которые* мы рассматривали выше, в принципе можно сохранить. В связи с включением времени в регрессию в качестве независимой переменной следует сделать о^но важное замечание, относящееся к корреляции динамических рядов. Регрессию между показателями, представленными динамическими рядами, можно получить, разными путями, например непосредственно между уровнями ис- - • следуемых рядов и между отклонениями от трендов соответствующих рядов. Естественно, что содержание таких регрессий и получаемые численные оценки и характеристики будут различными-. Более того, если.находить регрессию первым способом, то весьма: вероятно, что будет наблюдаться автокорреляция остатков '(о чемг было сказано выше). Второй подход в качестве предварительного этапа предполагает- осуществление таких операций, как нахождение трендов в каждом из рядов ^переменных и определение отклонений от. них. Однако^ совсем не обязательно выполнять указанные процедуры, если имеется "в виду только получение параметров соответствующей: ' "".-.' 89*
регрессии. В самом деле, возьмем три переменные у, х и z. Пусть развитие каждой из них можно описать линейным трендом, т. е. Vt = а\ + V; xt = а2 + b2t; г = аг + bzt. Тогда отклонения фактических уровней от трендов составят: Vt—Уь xt~ *fi '*t—*b Л Л А где уи *и Zt — фактические, а уи Хи Zt — расчетные значения соответствующих переменных. Найдем теперь уравнение регрессии отклонений зависимой переменной на отклонения независимых переменных: yt — yt = k0 + kx {xt — xt) + k2 [zt — zt) + ut, где ut — ошибка уравнения регрессии. Подставив в эту регрессию развернутые выражения отклонений, находим: Vt — а\ — М = *о + *i (xt — а2 — b2t) + k2(zt—аг — bzf) + #,= === ^0 I R-l-Xt ^1^2 R>\02t + ^Zt /^2^3 &2гЪг \ M't' Проведя ряд преобразований, получим: У^=(*о + Л1 — Ма — к2аъ) +ktxt+k2zt+ {bx — kj}2 — k2bb)t + ut. Многочлены, взятые в скобки, содержат комбинацию постоянных параметров и, следовательно, сами являются некоторыми параметрами. Обозначим их символами соответственно си§, тогда yt = с + k,xt + k2zt + gt + tit, т. е. получим линейную множественную регрессию на три переменные, включая время. Аналогично можно получить и регрессию отклонений yt — yt на Xi и zt: yt—yt=(k0—kia2 k2az)+klXt+k2Zt + ( —*A —*A) t+Uf Введя параметры сг и g\ получим: yt — yt = c' + ktxt + k2zt + g't + ut. Как видно из полученных выше выражений, коэффициенты регрессии при Xt и Zt оказались в точности равными коэффициентам регрессии при (xt — xt) и (zt — Zt). Таким образом, включение времени в регрессию yt на xt и г% оказалось равнозначным (в отношении коэффициентов ki и k2) определению регрессии отклонений от трендов. В то же время такие характеристики, как коэффициент корреляции и ошибки коэффициентов регрессии, будут, естественно, различаться для двух рассмотренных способов анализа взаимосвя- 90
зей. Включение времени в регрессию обычно существенно снижает автокорреляцию. Выше мы исследовали проблему при условии, что тренды имеют линейный характер. Наряду с этим рассмотренный подход оказывается приемлемым и в случаях, когда тренды представлены многочленами выше первой степени. Иногда предполагается, что коэффициент при независимой переменной устойчиво изменяется вместе с ходом времени. Если эта изменение равномерное, то соответствующий коэффициент регрессии можно представить в виде произведения а$, а сам член регрессии предстанет в виде a ft • х$. В этом случае оценивание можно осуществить опять-таки с помощью МНК, предварительно преобразовав значения переменной ху, иначе говоря, в матрицу Х'Х (см. 3.25) вместо хц теперь вводятся значения txij. НЕЛИНЕЙНАЯ РЕГРЕССИЯ Все, что выше было сказано о регрессиях и МНК, относилось к линейным моделям, т. е. к таким уравнениям, в которых переменные имели первую степень (модель, линейная по переменным),. а параметры выступали в виде коэффициентов при этих переменных (модель, линейная по параметрам). Именно такие регрессии используются наиболее широко в силу своей простоты, относительна малой трудоемкости их получения и, наконец, поскольку они изучены достаточно глубоко. В практике, однако, нельзя ограничиваться линейными моделями. Сравнительно часто линейная модель не адекватно отображает исследуемое явление. Иногда более реалистичный путь заключается'в разработке моделей, во-первых, нелинейных по переменным, во-вторых, нелинейных по параметрам; наконец, возможны случаи, когда наилучшее приближение дают модели, нелинейные и по переменным и по параметрам. Что касается моделей, нелинейных по переменным, то проблема оценивания их параметров обычно решается весьма просто. Независимые переменные, имеющие степень, отличающуюся от первой, заменяются другими независимыми переменными в первой степени и к новой системе переменных применяется обычный МНК. После того как получено уравнение с оцененными параметрами, введенные в него новые независимые переменные заменяются на первоначальные. Так, пусть нам необходимо оценить параметры уравнения у = o,q + a\Xi + а,\Х2 + а$х\ -f 0,4X2 + е. Введем переменные Z\ = xu z2 = х2> £з = *?, *4 = Л, Соответственно в уравнении (3.24) заменим матрицу (Х'Х)-1 на (Z'Z)-1 и вектор-X'Y на ZT, получим: a=(Z'Z)^Z'Y. Найденные оценки параметров и являются искомыми величинами. Для полученной регрессии, можно найти ошибки параметров и доверительные интервалы. 91
Значительно сложнее обстоит дело в случае, когда уравнение нелинейно по параметрам. Возьмем, например, такие функции, как - • ' /(«4, 02, а,) = ai .t и Т. Д. ' 1 + с^е _ Всё эти функции нелинейны . по параметрам; Непосредственное применение МНК для их оценивания невозможно. Правда, первое уравнение можно оценить, предварительно приведя его с помощью логарифмирования к линейному виду. Однако такое преобразование приводит к тому, что оценка параметров базируется не на минимизации суммы квадратов отклонений, а на * минимизации суммы квадратов отклойейий в логарифмах. Причём ' ■ - . - - ' \ У1 Следствием этого является некоторое' смещение оценок параметров, получаемых обычным (линейным) МНК1. Особенно наглядно смещение обнаруживается при оценивании экспоненциальных зависимостей, когда ряды данных характеризуются существенным трендом. • ч В,общем случае оценивание, нелинейных по параметрам уравнений достигается с помощью так называемого нелинейного метода наименьших квадратов (НМНК). Соответственно НМНК параметры уравнений подбираются так, чтобы максимально приблизить кривую / (а) к полученным из наблюдения значениям зависимой переменной у. Таким образом, здесь, .как и в линейном МНК, минимизируется сумма квадратов отклонений: В результате дифференцирования Q по параметрам а получают систему уравнений, которые, однако,, являются нелинейными. Решение этой системы в общем случае достаточно сложно. Во всяком случае оно обычно не проще непосредственной минимиза- -1. Можно показать, что минимизация суммы квадратов отклонений в лога- ' рифмах равнозначна минимизации суммы взвешенных квадратов отклонений. Так, если предположить, что отклонения от регрессии . незначительны, то " •? ! Q « 2—§". Здесь в качестве веса выступает величина -у. В этом случае, Уь yi если, допустим, ряд #< возрастающий, то ошибки е] начальных уровней окажут более заметное4 влияние на оценки параметров, чем ошибки последних уровней этого ряда. Э2
ции Q. Последняя достигается с помощью ряда, итеративных процедур, применяемых при минимизации ^функции многих переменных. Основными методами оценивания параметров, базирующихся на. таких процедурах, являются: метод линеаризации» (разложение функции в ряд Тейлора и использование МНК) и метод наискорейшего спуска (использование градиентов для итеративной минимизации функции). Поскольку каждый из этих методов обладает рядом недостатков, был создан компромиссный метод (метод Маквардта), сочетающий в себе положительные черты метода линеаризации и градиентного, метод а1. КРИВАЯ ОСВОЕНИЯ В качестве примера приведем нелинейную регрессию, которая применяется как в технико-экономическом ана'ли'зе для характеристики статистической взаимосвязи между трудоемкостью продукции й масштабами производства^ наблюдаемой в период освоения выпуска нового вида изделий, так и при описании зависимости технического , параметра, отражающего свойство какого- либо изделия, "от кумулятивного объема его выпуска. В первом случае она. обычно записывается в виде тле ух — трудоемкость х-й единицы ' продукции, х— суммарный объем производства, а и b — параметры функции. Смысл параметра q легко уяснить, приняв х — 1; тогда ух — а. Иначе говоря, а — трудоемкость первого осваиваемого изделия, Ь — оцениваемый пдр.аметр. Его значение, находится в диапазоне 0 ^ &^ 1. Параметр Ь уравнения регрессии оценивается по данным наблюдения. Если параметр а задан, то к модели log (-^) = —A log* можно применить обычный МНК и найти приближенную оценку.6. Более точно эта оценка может быть получена с помощью НМНК. Подобного рода взаимосвязи в практике технико-экономиче-. ского анализа называют кривыми освоения или обучения2. 1 Общая характеристика методов нелинейного оценивания параметров регрессий приводится в приложении 1 к данной работе. Детальное описание; этих . методов см.: Д р е й п е р Н., Смит Г. Прикладной регрессионный анализ (Пер. с англ.). М., «Статистика», 1973; Маленво Э. Статистические методы эконометрии (Пер. с франц.). Вып. КМ., «Статистика», 1975. Анализ этих методов, а также программа на языке Алгол приведены в работе: Демиденко Е. Оценки параметров в нелинейной регрессии. — В сб.: Проблемы экономического моделирования. М., ИМЭМО, 1972. Программа на языке Алмир опубликована- в работе: Демиденко Е. Линейная и нелинейная регрессия. М., ИМЭМО, 1974. "2фСтрого говоря, указанная взаимосвязь трудоемкости изделия'с масштабами производства охватывает две фазы. На первой из них, как показывает практика, действительно' наблюдается соответствующая закономерность. За некоторым пределом, специфическим для данного конкретного производства, закономерность перестает проявлять себя при условии, что, технология остается неизменной. 93
Обычно эти кривые применяются для характеристики процента падения трудоемкости продукции при удвоении масштабов производства. Например, кривая, которая показывает уменьшение трудоемкости на 20% при удвоении объема производства, называется 80%-ной кривой и т. д. Нетрудно найти значения параметра Ь,. соответствующие той или иной характеристике кривой освоения. Так, отношение показателей трудоемкости единицы изделия при удвоении выпуска составит: уйх_ а{2х)-ь _, Ух <*х-Ь = 2~ —\0%{у2х1Ух) _ -Л0Я(У2х1ух) u~ log 2 ~~ 0,301 Отсюда нетрудно найти значения 6, соответствующие заданным значениям У2х/Ух'. У2x1 Ух (%) Ь 60 65 70 75 80 85 90 0,737 0,622 0,515 0,415 0,322 0,268 ' 0,152 Функции, подобные тем, по которым строятся кривые освоения, нашли себе применение в прогнозировании научно-технического прогресса. Так, если можно принять гипотезу о том, что некоторый технический параметр зависит от новшеств в соответствующей области производства, причем новшества вводятся постепенно и являются функцией общего (кумулятивного) выпуска продукции, то соответствующую зависимость предлагается представить в виде1 Tt = aib, где Ti — значение технического параметра для i-го по порядку изделия с момента начала выпуска, i — кумулятивный объем выпуска,. я, Ь — параметры функции. Подобного рода зависимости подтвердились для таких параметров, как скорость самолетов, мощность автомобилей, производительность транспортных средств на* воздушной подушке, мощность осветительных ламп, потребление* топлива турбореактивными двигателями и т. д. АВТОРЕГРЕССИЯ При анализе динамических рядов в большинстве случаев приходится констатировать, что соседние члены ряда у находятся в; некоторой зависимости друг от друга, т. е. значение переменной у/ A Guide to Practical Technological Forecasting. N. Y., 1973. 94
в момент t является функцией от значений в предшествующие моменты yt=f(yt-u yt-2, ...)• В этом случае для характеристики взаимосвязи показателей можно прибегнуть к разработке авто- регрессионной модели. Приведём линейный ее вариант: yt = ccyt_{ + ayt_a + .. . + ^myt_tn + e„ (3.46) где et — несистематическая составляющая у и m — число членов, которое охватывается авторегрессией (порядок авторегрессии), E(st)=Q, о2 (е*) = а = const, наконец, е* и e*-i— независимы. Предположение о *гом, что ошибки ei нормально распределены, приводит нас к минимизации суммы квадратов отклонений в*. Это дает возможность оценивать параметры (3.46) с помощью МНК. Заметим, однако, что авторегрессия не входит в класс обычных линейных множественных регрессий, так как там предполагается, что переменные в правой части фиксированы и неслучайны, а в (3.46) yt~u yt-2, ... суть случайные величины. В ряде случаев переменная у характеризуется не только зависимостью от предшествующих значений этой переменной, но также испытывает влияние ряда факторов, которые могут быть представлены другими переменными х. В таких случаях регрессию можно представить в виде уравнения смешанной авторегрессии: Уг = вЧУм + а2У,-2 + • • • + ^тУь-ш + Mi + Рз*з + • • • + РЛ + е* = т z = S^H+SPA + e, (3.47) Здесь опять £(в*)=0," а2 (в*) = а2 = const, e* и вн-i — независимы. Оценки для а* и Рл находим МНК. § 4. РЕГРЕССИЯ И ПРОГНОЗИРОВАНИЕ Выше мы рассмотрели ряд различных подходов, применяемых в регрессионном анализе при описании взаимосвязи переменных. Различие этих подходов связано в основном с особенностью применяемых для оценивания регрессии данных и основных гипотез относительно свойств этих данных. В качестве исходных данных могут быть взяты выборочные наблюдения и динамические ряды. В .лервом случае при условии, что принятые предположения относительно свойств случайных ошибок е* оправданы, в качестве инструмента прогноза применяются регрессии на независимые переменные или средние величины. Исходной статистической базой для. прогноза значительно чаще, чем случайная выборка, являются динамические ряды. Тогда в качестве инструментов прогноза выступают тренды, авторегрессии, регрессии на независимые переменные (без включения в качестве независимой переменной времени и включая эту переменную), смешанные авторегрессии. Выбор адекватного подхода зависит от того, обнаружены экзогенные факторы, влияющие на значение зависимой переменной, или нет, влияют ли на зависимую 95
переменную предшествующие значения этой же переменной и т. д. В целом процесс выбора инструмента прогноза можно изобразить в виде следующей схемы (рис. 3,3). Как видно из данной схемы, регрессии в широком смысле слова (т. е. включая уравнения трендов) "'играют преобладающую роль в прогнозировании статистическими методами. Это обстоятельство подтверждается и опытом прогностических разработок. *•" Когда регрессия специфицирована и оценены ее параметры, . она может быть применена для прогнозирования. Оценка прогностических величин получается с помощью простой операции подстановки в регрессию значений независимых переменных. Таким образом, прогноз на основе уравнения регрессии является условным типа «если независимые переменные равны таким-то величинам, то зависимая переменная составит такую-то величину». Отсюда непосредственно следует, что применение регрессий для прогнозирования предполагает решение по крайней мере трех проблем. Первая из них связана с необходимостью определения значений независимых переменных на период упреждения. Следовательно, точность прогноза определяется не только точностью самого уравнения регрессии, но и тем, насколько надежно оценены будущие значения независимых переменных. В связи с этим может возникнуть впечатление, что задача прогнозирования не решается, а лишь отодвигается. Фактически это не совсем так. Действительно, значения независимых переменных определяются вне рамок прогностической модели на основе дополнительной информации. Например, прогноз потребления населением какой-либо группы товаров можно получить, используя в регрессии прогнозы численности населения и уровня его дохода. В качестве такой дополнительной информации выступают плановые показатели, варианты ожидаемых решений экономического или политического, социального или, наконец, юридического порядка. Часто значения независимых переменных — это показатели другого прогноза, получаемого в большинстве случаев на основе статистических методов— экстраполяции трендов и т. д. Иногда значения независимых переменных определяются экспертным путем. Вторая проблема заключается в трансформации точечных прогнозов (оценок значений зависимой переменной) в интервальные. Эта проблема решается с помощью построения доверительных интервалов. Если для линейных регрессий метод определения доверительных интервалов на основе ошибок параметров решен, то в случае нелинейной регрессии и нелинейного оценивания параметров приходится применять весьма приближенные приемы определения таких интервалов. Третья проблема, на которую следует обратить внимание, заключается в применимости уравнений регрессии для оценок значений зависимой переменной вне диапазона наблюдений зависимой и независимой переменных. В практических прогностических исследованиях чаще всего, приходится именно выходить за рамки 96
, ПРОГНОЗИРОВДНИЕ i Ур 1 Исходные данные Случайная дыборка Динамический ряд Исследование выборки Обнаружена ли зависимость от других переменных и есть< ли надежный прогноз их значений ? Нет Исследование ряда Обнаружена ли зависимость от других переменных и есть ли надежный прогноз их значений ?\ Инструмент прогноза Регрессия Нет Инструмент прогноза Средние Да Исследование ряда Имеет ли %t стохастическую природу только из-за несистематических колебаний ? Инструмент прогноза Скользящая и экспоненциальная средние, авторегрессии Инструмент прогноза Уравнение тренда Инструмент прогноза Смешанная авторегрессия Инструмент прогноза Регрессия Рис. 3.3. Схема выбора метода «прогнозирования наблюдений, т. е. прибегать к экстраполяции. Можно полагать, что и в таких случаях регрессионные уравнения окажутся практически полезным инструментом прогнозирования. Так, если выход за рамки диапазона наблюдений незначительный, то погрешность, связанная с этим (т. е. с тем, что вне диапазона наблюдений форма, а иногда и направление взаимосвязи, мож^т измениться), 4 Е. М. Четыркин 97
будет, как правило, незначительной и с лихвой охватывается доверительным интервалом. Чем дальше выходит прогноз за пределы наблюдении, тем, естественно, выше вероятность погрешности такого рода. Таким образом, риск получения ошибочной оценки возрастает. Короче говоря, получаемые оценки имеют ценность в той мере, в какой есть основание полагать, что принятая форма взаимосвязи может быть распространена на некоторую область за пределами наблюдений. Таким образом, применение регрессий требует в явном виде сформулированной гипотезы о сохранении формы взаимосвязи. Практика знает случаи, когда такая гипотеза в общем не являлась приемлемой и все же для прогнозирования были использованы регрессии, поскольку иной измеритель нельзя было получить, так как «лучше плохая мера, чем отсутствие какой- либо меры». Известны случаи, когда с помощью регрессий на ряд технических характеристик изделия (причем эти характеристики в практике еще не были достигнуты, например некоторая дальность беспосадочного полета новой модели самолета, его скорость, потолок полета и т. д.) оценивалась его себестоимость. Как правило, такие регрессии давали существенно заниженные результаты. И все же они оказались практически полезными с учетом полученного опыта о направлении и размерах итоговых погрешностей. § 5. ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ В практике редко наблюдаются случаи, когда в прогностических целях достаточно получить изолированную оценку. Обычно объект прогноза может быть более или менее удовлетворительно описан лишь с помощью целого ряда характеристик, часть которых или даже все являются взаимозависимыми. Раздельное прогнозирование подобных экономических показателей с помощью рассмотренных выше предикторов (трендов, уравнений регрессии) а почти неминуемо приводит к тому, что полученные оценки, естественно, не будут сбалансированными. Прогнозы, увязанные в единую логически непротиворечивую систему, получают с помощью прогностических экономико-математических моделей. Именно внутренняя согласованность модельных прогнозов, являющаяся следствием учета в модели различных существенно важных для объекта исследования взаимосвязей, является основным их достоинством. Очень важным является то, что при применении экономико- математических моделей зависимость результата от ряда сделанных предположений выступает в явном виде. Это обстоятельство существенно облегчает анализ получаемых прогностических оценок и дает возможность для целенаправленного генерирования новых вариантов прогноза, связанных с изменением первоначально принятых условий. Коль скоро исследуемая система адекватно отображается и воспроизводится моделью, то последняя как бы содержит в себе 98
множество вариантов поведения такой системы. Следовательно, в определенных рамках модель может замещать изучаемую систему в ходе проведения расчетных (или модельных) экспериментов, целью которых является выяснение возможной картины будущего развития и предсказание значений одних переменных в зависимости от изменения других. Инструментами прогнозирования, учитывающего требования системного подхода к получению прогностических показателей, могут являться различные виды экономико-математических моделей, среди которых наибольшее значение для системного прогностического анализа имеют эконометрические модели. Опыт показывает, что прогнозы, получаемые на основе эконометрических моделей, не обязательно точнее прогнозов, получаемых более простыми средствами, например, путем экстраполяции трендов или применения автокорреляционных уравнений4. Преимущество модельных прогнозов, как было показано выше, лежит в иной плоскости — в непротиворечивости системы прогностических оценок, в возможности получения вариантов прогноза, в прямом выражении связи прогностических оценок с различными внешними влияниями. СТРУКТУРНАЯ ФОРМА МОДЕЛИ Основу эконометрической модели составляет система регрессионных уравнений, каждое из которых отображает одну из зависимостей, закономерностей изменения, свойств изучаемого сложного объекта. Помимо регрессий в модель могут быть включены выражения, описывающие тренды развития отдельных явлений, и тождества, характеризующие балансовые увязки между переменными, или уравнения, увязывающие между собой отдельные характеристики модели во времени (динамический вариант модели). Эконометрическая модель содержит так называемые эндоген- 1 В литературе имеется немало примеров сравнения результатов прогнозов, получаемых различными методами. В частности, С. Л и з е р («Эконометрические методы и модели» (Пер. с англ.). М., «Статистика», 1971) отмечает, что при краткосрочном прогнозировании эконометрические модели оказались в среднем лучше экстраполяции трендов; однако полученные погрешности были не ниже, чем при применении авторегрессиоиных моделей. Д. Стеклер (Stecler H. Economic Forecasting, 1958), приняв в качестве меры точности прогнозов коэффициент расхождения Г. Тейла (см. гл. 5, § 3), обнаружил, что при среднесрочном прогнозировании точность прогнозов, опирающихся на эконометрические модели во всех анализируемых им случаях, была несколько (но немного) выше, чем различного рода экстраполяции. Любопытное сопоставление точности экспертных и модельных прогнозов квартальных показателей валового национального продукта, его компонентов и уровня инфляции для 1970—1973 гг. было предпринято в США. Группа экспертов состояла из 24 ведущих экономистов США. Модельные прогнозы были получены на основе трех наиболее известных в США краткосрочных эконометрических моделей. Прогнозы сравнивались с обобщенной экспертной оценкой по каждому отдельному показателю. В результате экспертные оценки оказались менее точными, чем две лучшие модельные оценки и точнее, чем наихудшая (в отношении точности) оценка, полученная по модели («Fortune», Mar., 1975). 4* 99
ные и экзогенные переменнее. Эндогенными являются те переменные, которые в силу принятых концепций определяются внутренней структурой изучаемого явления, иначе говоря, их значения выясняются на основе модели. В свою очередь экзогенные переменные по определению независимы от структуры явления и их значения (в том числе прогностические) устанавливаются вне модели. Модель содержит также различного рода параметры (коэффициенты), которые определяются в ходе статистического оценивания путем обработки имеющейся информации. Кратко, по-видимому, можно сказать, что эконометрическая модель представляет собой результат статистического оценивания (измерения) параметров системы математических выражений, которые характеризуют некоторую экономическую концепцию о взаимосвязи явлений. При рассмотрении методологических вопросов прогнозирования мы остановились на роли общетеоретического анализа в процессе прогнозирования. Все, что было сказано там, имеет непосредственное отношение и к прогнозированию на основе моделей, в том числе и эконометрических. Поэтому мы здесь не будем подчеркивать значение политэкономического изучения соответствующей проблемы 1. Итак, пусть эконометрическая модель представляет собой систему линейных регрессионных уравнений (остальные элементы модели, о которых упоминалось выше, мы далее во внимание принимать не будем, поскольку они не влияют на ход дальнейших рассуждений). Эта система линейна как относительно переменных, так и содержащихся в ней коэффициентов. Хотя линейная форма зависимости представляет собой наиболее грубое приближение к реальности, там, где измерения данных не отличаются большой точностью, линейное приближение может оказаться вполне достаточным. В ряде случаев ряд нелинейных соотношений, если таковые содержатся в модели, можно несложными преобразованиями свести к линейным. Однако выигрыш от использования линейного представления связей может быть не иллюзорным лишь до определенного предела. На первый взгляд представляется, что переход от одного уравнения регрессии к их системе не может вызвать никаких дополнительных проблем — достаточно оценить параметры каждой отдельной регрессии. В ряде случаев так и поступали. Однако такой подход к решению проблем (оценивание каждого уравнения в отдельности) не содержит принципиальной ошибки только в двух частных случаях. Во-первых, когда в системе зависимые перемен- 1 Заметим, что критика эконометрических моделей, разрабатываемых и применяемых буржуазными авторами, должна быть нацелена главным образом на вскрытие политэкономического содержания соответствующих моделей и устанавливаемых ими соотношений, т. е. она должна содержать .интерпретацию моделей, включая исходные предпосылки, и получаемые на их основе результаты. Сами по себе математические выражения (не наполненные экономическим содержанием) не несут социальной нагрузки и поэтому не могут быть объектом социально-экономического анализа. 100
ные одних уравнений не выступают в качестве независимых переменных других уравнений, т. е. система уже разрешена относительно эндогенных переменных: У\ = а1Л + • • • + *1тхт + *1> (3.48) Уп = аЛ1*1 + • ■ ■ + *птхт + ея- Здесь и далее у г— эндогенные переменные, Xj— экзогенные переменные, a.ij — неизвестные параметры при экзогенных переменных, 8i — случайные возмущения, t=l, ..., пу /=1, ..., т. Естественно, что далеко не в каждом из этих уравнений должен присутствовать полный набор независимых переменных. Во-вторых, когда система рекурсивна, т. е. зависимая переменная предшествующего уравнения выступает в качестве независимой переменной следующих уравнений: Уг = аП*1 + • • • + Чтхт + Ч\ Уп = Т»1 Уг + • ■ ■ + Тл. п-Х Уп-1 + ---+ *nlxl + ' • ■ + аптХт + е/г ' При оценивании коэффициентов систем регрессионных уравнений (3.48) и (3.49) никаких проблем, помимо обычных проблем регрессионного анализа, не возникает. Поэтому, совсем не обязательно, чтобы в этих системах уравнения были линейными — они могут быть и нелинейными (важно, чтобы каждое из них можно было оценить тем или иным методом). Что касается системы (3.49), то здесь применяют следующий прием — сначала оценивается первое уравнение, затем оценивается второе, при условии, что значения у в нем определены на основе уже оцененного первого уравнения и т. д. Возьмем теперь более общий случай, когда одни и те же переменные в одних уравнениях системы входят в левую часть, а в других — в правую. Такие системы регрессионных уравнений получили название взаимозависимых моделей. Взаимозависимые модели более или менее изучены только для варианта, когда они содержат лишь линейные уравнения. В общем случае линейная взаимозависимая модель, содержащая п эндогенных и т экзогенных переменных, может быть записана следующим образом: Ух = ТиУ2 + • • ■ + ЬпУп + «11*1 + • • ■ + ЧтХт + V, (3.50) Уп = Тл! У1 + - • • + Ъь и-1 Уп-i + *ШХ1 + • • • + *птХт + е/г Система (3.50) называется структурной формой модели. Структурная форма модели создается в процессе формирования самой модели при стремлении отразить причинно-следственный механизм, существующий в реальности. Она позволяет проследить влияние 101
изменений в экзогенных переменных модели на значения эндогенных переменных. Параметры уравнений модели в данной форме получили название структурных коэффициентов, общее их число равно или меньше п (п—1 + т). Использование обычного метода наименьших квадратов для оценивания структурных уравнений, каждого в отдельности, приведет в общем случае к получению смещенных и несостоятельных оценок1. В последние годы были разработаны различные методы оценивания параметров взаимозависимых эконометрических систем. Прежде чем мы перейдем к рассмотрению принципов, на которых покоятся основные методы оценивания, нам необходимо ознакомиться с приведённой формой модели и понятием идентифицируемости линейной эконометриче- ской модели. ПРИВЕДЕННАЯ ФОРМА МОДЕЛИ По предположению структурные уравнения модели должны быть совместными и, следовательно, система (3.50) может быть решена относительно уи .. •, Уп, т. е. представлена как система линейных функций от Х\у ..., хт: Ух = 8П-*1 + • • • + \тхт + Чи (3.51) Уп = KlXl + • • • + КтХт + Чп- Система (3.51) называется приведенной формой модели, соответственно параметры бц, ..., 8Пт называются коэффициентами приведенной формы. Система (3.48), с которой мы встречались выше, также представляет собой приведенную форму. Каждая эндогенная переменная содержится в приведенной форме только в одном уравнении и зависит, не считая возмущения т)*, только от значений параметров и экзогенных переменных. Для иллюстрации возьмем простую структурную модель. Пусть У1 = Т12У2 + (ЧЛ + 81; Решим эту систему относительно у\ и уг. Легко убедиться в том, что для новой системы коэффициенты будут равны: § — qH й — 7l2a22 11 1—T12T21 ' 12 1 — TiaTai ' а 721д11 ss q22 00i — 0.j - W21 1 — 712721 ' 21 1 — 712721 ' 1 Доказательство можно найти в работе: Dhrymes P. J. Econometrics: Statistical Foundations and Applications. N. Y., 1970. Впервые смещенность оценок при применении МНК непосредственно к каждому уравнению взаимозависимой линейной системы обнаружил Т. Хаавелмо (Haavelmo T. The statistical implication of a system of simultaneons equations.—«Econometrica», vol. 11. № 1, 1943). 102
л ошибки составят: "~ 1 — 712721 ' ^2_ 1 — 712721 • Ошибки t]i здесь являются линейными функциями возмущений 8*, а коэффициенты 8ц — нелинейными функциями коэффициентов структурной формы. В общем виде переход от структурной к приведенной форме модели можно представить, используя матричную запись. Так, структурную форму модели можно записать как TY + AX = s, (3.52) где Г и А — матрицы неизвестных параметров размерностей (п X Х^) и (пу^т) соответственно, матрицы Г — не вырождена, Y и X — векторы эндогенных и экзогенных переменных, 8 — вектор случайных, нормально распределенных величин с нулевыми математическими ожиданиями, п — число эндогенных переменных, т — число экзогенных переменных. Тогда приведенную форму можно получить в виде 'Y=-T^AX + H = BX + H9 (3.53) где Н = Г-1 • е, В = —Г"1 А Уравнения приведенной формы с численными параметрами позволяют получить значения эндогенных переменных, однако они объясняют это значение только через экзогенные переменные, т. е. с существенно меньшей детализацией, чем структурная форма,— здесь отсутствуют взаимосвязи зависимых переменных между собой. Коэффициенты приведенной формы могут быть оценены МНК, причем к каждому уравнению этот метод применяется раздельно. Для прогнозирования значений эндогенных переменных достаточно применить систему (3.51), однако исключение из поля зрения взаимосвязей между эндогенными переменными может иногда существенно ухудшить прогностические возможности модели. ПРОБЛЕМА ИДЕНТИФИКАЦИИ После того как параметры приведенной формы оценены, в ряде случаев возникает задача 'обратного перехода — определения параметров структурной формы на основе уже известных оценок параметров приведенной формы. При решении этой задачи сталкиваются с так называемой проблемой идентификации уравнений. Проблема идентификации — это проблема единственности соответствия между приведенной и структурной формами. Приведенная форма в полном виде (т. е. когда каждое уравнение содержит полный набор я-ов) имеет пт параметров, в свою очередь структурная форма может содержать п(п—\-\-m) параметров. Ясно что п(п—\-\-m) оценок параметров структурной формы невозможно получить единственным образом на основе пт параметров приведенной формы. 103
В самом деле, между коэффициентами форм (3.52) и (3.53) существует следующая зависимость: Д + Г-*Л = 0, (3.54) откуда Г£ + Л = 0. (3.55) Для однозначного определения коэффициентов матриц Г и Л на основе (3.55) в общем случае недостаточно располагать матрицей коэффициентов приведенной формы В. Действительно, для одной и .той же матрицы- В можно подобрать множество матриц структурной формы Г и" Л так, чтобы удовлетворялось соотношение (3.55). Положение, однако, исправляется тем, что, как правило, можно принять некоторые ограничения на коэффициенты матриц Г и Л. Обычно многие из них равны 0 (если между экономическими переменными нет связи) или 1 (последнее, как правило, для тождеств). Если подобных ограничений недостаточно для однозначного определения Г и Л через элементы матрицы В, то говорят, что система (3.52) не идентифицируема. Если дополнительные ограничения на элементы Г и Л накладывать нет необходимости (уравнение (3.55) позволяет в силу внутренних особенностей этих матриц однозначно определить их по матрице В), то система (3.52) такой модели называется точно идентифицируемой. Наконец, если таких ограничений больше, чем это нужно для точной идентификации, то мы имеем дело со случаем сверхидентификации системы (3.52), наиболее распространенным в практике. В целом решение проблемы идентификации сводится к анализу системы уравнений ТВ + А = 0 и совокупности априорных ограничений на элементы Г и Л и соответствующих изменений системы (в рамках, допустимых экономической теорией). Таким образом, проблема идентификации — это прежде всего проблема конструирования алгебраической формы модели в соответствии с данными такого анализа. Формулировка полного решения проблемы довольно громоздка (она приводится, например, в обширной монографии Э. Маленво1), поэтому мы ограничимся лишь рассмотрением необходимого (но не достаточного) критерия идентифицируемости, который обычно и используется в практике моделирования. Пусть п — полное число уравнений, или, что одно и то же, число эндогенных переменных, m — число экзогенных переменных всей системы, п* + гщ — число экзогенных и эндогенных величин* присутствующих в i'-м уравнении. В этом случае необходимое условие идентифицируемости каждого уравнения системы имеет вид (п + т) — (л, + mt) > п — 1. (3.56) 1 См.: Маленво Э. Статистические методы эконометрии (Пер. с франц.).. Вып. 1. М., «Статистика», 1975. 104
Таким образом, число исключенных переменных не должно быть меньше числа уравнений системы без единицы. Если каждое уравнение структурной формы идентифицируемо, то идентифицируемой оказывается вся система уравнений в целом. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СТРУКТУРНОЙ ФОРМЫ Рамки настоящей работы не позволяют детально разобрать методы оценивания параметров структурной формы эконометри- ческих моделей — этот вопрос нуждается в специальном исследо-. вании. Поэтому здесь мы ограничимся лишь кратким обзором некоторых из этих методов. * Из теории математической статистики известно, что в определенном смысле наилучшие по свойствам оценки априорно неизвестных параметров системы (3-52) мы можем, вообще говоря, получить, находя экстремум соответствующей функции правдоподобия *. Однако в силу того, что соответствующий метод (метод максимального правдоподобия) основывается на предположении, что ошибки имеют нормальные распределения (а это часто не соответствует действительности), и достаточно сложен; его редко реализуют в практических ситуациях. Поэтому были предложены упрощенные варианты метода максимума правдоподобия, а также методы оценивания, основанные на иных предпосылках, но все так или иначе использующие обычный метод наименьших квадратов в сочетании с итеративными процедурами2. В последние годы в специальной литературе (особенно американской) можно было наблюдать настоящий бум методов оценивания линейных эконометрических моделей. Важно, однако, подчеркнуть, что, как правило, все эти методы, хотя и сопровождаются претендующими на математическую строгость доказательствами и выводами свойств оценок, в4 основе своей все же в какой-то мере связаны с эмпирическими подходами. Дело в том, что формальная логика соответствующих построений часто базируется на нереальных гипотезах о поведении случайных возмущений. Большинство из подобных методов предназначено для случаев, когда система сверхидентифицируема и идентифицируема. В случае, когда система точно идентифицируема, параметры «структурной формы оцениваются с помощью так называемого косвенного метода наименьших квадратов (КМНК), или, как его «ще называют, метода „приведенной формы. Суть его состоит в следующем. Сперва структурная форма преобразуется в приведенную, затем с помощью МНК оцениваются параметры каждого уравнения приведенной формы модели в отдельности. Наконец, параметры приведенной формы трансформируются в параметры структурной формы модели. Иначе говоря, на этом этапе осуще- 1 F i s k P. R. Stochastically Dependent Equations. L., 1967. 2 Mosbaek E., Wold H. Interdependent Systems. Structure and Estimation, A., 1970. 105
ствляется обратный переход от системы с численными параметрами (3.51) к системе (3.50). Для иллюстрации опять обратимся к простой структурной форме: N У1 = Т12У2 + an^i + ei; /0 „ч i r (3.57) У2=Т21У1+а22^2 + £2" Оба уравнения точно идентифицируемы. Приведенная форма имеет вид: yi = *n*i + 8i2*2 + V. У 2 = 821*1 + 822^2 + Ъ- (3.58) Пусть в результате статистического наблюдения собраны данные, характеризующие эндогенные переменные у\ и у2 и экзогенные переменные Х\ и jt2. На основе этой информации с помощью МНК оценим неизвестные коэффициенты 6ц приведенной формы. Обозначим их как с1ц. Оценки коэффициентов структурной формы обозначим символами а^и с#, где ац является оценкой ти а Сц — оценкой ти- Итак, имея величины dij, полученные МНК для множественной регрессии, необходимо определить ац и сц. Для этого перепишем выражения, полученн-ые выше для Ьц, заменив в них неизвестные значения коэффициентов их оценками. Имеем: (3.59) 21 ~ l-W*i ' 22 — 1 - c^n ' Определим теперь четыре неизвестные оценки аи, а22, сп и Сг* через четыре коэффициента приведенной формы dij. Получим: л ^22^и — ^12^21 . п d^2dxl — dV2d>2i ап — -т- , а22 — . Итак, если система идентифицируема (в первоначальном своем виде или после пересмотра спецификации неполно идентифицируемых уравнений), то ее параметры можно оценить с помощью КМНК, который обеспечивает получение несмещенных и состоятельных оценок приведенной формы. Что касается оценок параметров структурной формы, то они оказываются в общем случае смещенными и состоятельными 1. Оценить параметры сверхидентифицированной системы, используя приведенную форму, таким же путем, как при точно идентифицируемой системе, не удается. Так, пусть имеется структурная 1 Koutsoyiannis A. Theory of Econometrics. L., 1973. 106
форма ХЗ-57), оба уравнения которой точно идентифицируемы. Однако если на параметры любого из них наложить хоть одно ограничение, то это уравнение станет сверхидентифицируемым. Положим, что в первом уравнении предполагается, что 712 = ссц. Тогда, в структурной форме: У1 = Ti2(y24-^i) + ei; первое уравнение является сверхидентифицируемым. Система выражений, связывающих оценки коэффициентов приведенной формы с искомыми оценками коэффициентов структурной формы, аналогичная (3.59), имеет вид: Л g12 Л g12^22 21 ~ 1—с1ас21 ' а22~~ \-спс21 • Данная система из 4 выражений содержит 3 неизвестные величины, причем если 022 и c2i определяются ею однозначно, то этого нельзя сказать о с\2 (равного Яц). Если система сверхидентифицируема, то в этом случае прибегают к ряду методов оценивания 1, среди которых наиболее простым и в то же время надежным является двухшаговый метод наименьших квадратов (ДМНК), предложенный Р. Басманом и независимо от него Г. Тейлом 2. Рассмотрим в самых общих чертах суть вычислений по двух- шаговому методу, которым оцениваются коэффициенты лишь одного уравнения сверхидентифицированной системы. К процедуре оценивания параметров при применении ДМНК прибегают дважды. На первом шаге производится оценивание с помощью МНК параметров приведенной формы. Это дает возможность получить оценки систематической и случайной составляющей у, т. е. предполагается, что У/ = У! + ^. где у** — оценки значений зависимой переменной, получаемые по приведенной форме: у* = dixxt + di2x2 + ... + dtjXj. 1 Краткая характеристика методов оценивания параметров и сравнение результатов расчета для одной и той же модели приведены в работе: Лизер С. Эконометрические методы и задачи (Пер. с англ.). М., «Статистика», 1971. Аналитическое сопоставление пяти методов оценивания параметров такого рода моделей рассматривается в статье: А м и р о в И. Методы статистического моделирования взаимозависимых систем регрессионных уравнений и альтернативные оценки структур параметров для малого числа наблюдений. — В сб.: Методы эконометрического моделирования. М., ИМЭМО, 1974. 2 Basmann R, A generalized classical method of linear estimation of coefficients in a structural equation. — «Econometrica», vol. 25, 1957;Тей л Г. Экономические прогнозы и принятие решений (Пер. с англ.). М., «Статистика», 1971. 107
На втором шаге эндогенные переменные, находящиеся в правой части структурных уравнений, заменяются их оценками у*. К преобразованному таким путем структурному уравнению применяется обычный МНК. Существенным недостатком, связанным с процессом оценивания параметров взаимозависимых линейных регрессионных уравнений больших размеров, является неединственность оценок, получаемых для одной и той же совокупности данных. Неединственность оценок связана главным образом с обращением матриц. В случае, если матрицы имеют большую размерность, накопленные ошибки округления на каждой итерации начинают существенным образом сказываться на значении получаемых оценок !. ПРОГНОЗИРОВАНИЕ НА ОСНОВЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ Аналогично прогнозам, получаемым по уравнениям простой или множественной регрессии, любой прогноз на основе экономет- рической мбдели также является условным. Прогноз значений эндогенных переменных на момент времени t + i генерируется подстановкой в приведенную форму прогнозных значений экзогенных величин, получаемых независимо от концепций самой модели. Относительно прогноза yt+u .получаемого в результате такой процедуры, с уверенностью можно сказать следующее: математическое ожидание случайной величины yt+i близко к математическому ожиданию величины yt+i ^(реальное значение у в момент t + 0 лишь при выполнении следующих условий: а) пр'огнозные значения величин х находятся в окрестности реальных значений xt+i\ б) до момента t + i действительные параметры структурной формы не меняют существенным образом своих значений; в) моделируемая экономическая структура остается стабильной в основных своих чертах. Очевидно, трудно представить себе такую ситуацию, в которой полностью выполнялись бы все эти три условия, исключая, конечно, практически малоинтересный случай очень короткого периода упреждения. По этой причине любой эконометрический прогноз, особенно долгосрочный, будет в известной мере условным. Казалось бы, детализация модели позволяет более реалистично^ описать исследуемый экономический механизм. Однако увеличение числа переменных и уравнений неминуемо приводит к тому, что прогноз становится зависимым от еще большего числа условий и, таким образом, модель фактически дает возможность получить все более многовариантную картину развития явления. Выбор же самого варианта остается за рамками модели. 1 Подробный анализ этой проблемы можно найти в статье: А м и р о в И.. Неединственность оценок коэффициентов взаимозависимых систем регрессионных уравнений.— В сб.: Методы эконометрического моделирования. М., ИМЭМО*.
4 ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРИ ПОДБОРЕ УРАВНЕНИЙ ТРЕНДОВ Что-то будет дальше? Не знаю, — скромно говорит Тикки, — мы предсказываем прошлое. Л. Лиходеев. Звезда с неба Тренд в качестве инструмента прогноза должен содержать численно оцененные параметры (коэффициенты). Проблеме оценивания параметров уравнений, характеризующих тренды, и посвящена настоящая глава. Как уже было показано в гл. 2, для выравнивания данных, представленных в виде рядов динамики, в зависимости от характера последних подбирают различные виды кривых. Применительно к этим же кривым здесь будет рассмотрена проблема оценивания параметров. § 1. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ ПРИ ОЦЕНИВАНИИ ПАРАМЕТРОВ ПОЛИНОМОВ Пусть нам необходимо аппроксимировать действительное развитие явления с помощью полиномиального тренда, иначе говоря, представить зависимую переменную у как функцию времени в виде многочлена У* = я0 + axt + a2fi + ... + axt\ где aj — параметры, t — время, X — степень полинома. Оценки параметров а0, аь ..., а\ можно получить с помощью рассмотренного выше метода наименьших квадратов. Развернутая запись системы нормальных уравнений, в которой переменные #о, хи ..., хт заменены на характеристики времени t, t2, ..., fK9 имеет вид: 2У/ = а0л + агS * + а22 f + ... + Ях2 *х; Sy^^aoS' + ^S^ + ^S^ + .-. + ^xS^1; и и 109
где п — число членов в динамическом ряду. Суммирование здесь производится от t = 1 до t = л. Используя матричные обозначения, систему (4.1) можно записать в виде T'Y=T'Taf (4.2) где Y = (yt), fl = (fli), Т = 1 t...tx i *..> Система (4.1), состоящая из % уравнений, содержит в качестве известных величин 2*/*, 2у^, ..., Ъу^х (т. е. суммы наблюдаемых значений уровней динамического ряда, умноженных на показатели времени в степени 0, 1, 2, ..., Я) и X неизвестных величин ctj. Решение этой системы относительно а0, Яь ..., ах и дает искомые значения параметров. Системы для оценивания параметров полиномов невысоких степеней много проще. Обозначим последовательные параметры полиномов как я, bt ct d. Тогда нормальные уравнения для оценивания параметров прямой примут вид:- %yt = an + b2t; 2у<* = *Е'+*2*; (4'3) для параболы второй степени: Zy^an + b^t+c^t2; наконец, для параболы третьей степени получим: ^yt = an + b^t+c^t2 + d"Zfi; У yf = a^fi + ЬЪР + сЪ* + *Ъ*\ 2у/ = я2^ + &2'4 + ^2'5 + ^2'6. Поскольку полиномы выше третьей степени при обработке динамических рядов встречаются крайне редко, то нормальные уравнения для них приводить не будем. Составление нормальных уравнений можно упростить, воспользовавшись тем, что величины S£, 2£2, ... не зависят от конкретных уровней динамического ряда. Если последний состоит из уровней, равноотстоящих друг от друга (а именно с такими рядами чаще всего имеет дело экономист), то суммы Ht, 2^2 и т. д. являются (4.4) (4.5) ПО
функциями только числа членов в динамическом ряду, для них легко получить расчетные формулы. В частности, Я=Ш5+Л; (4.6) S^^^.gn+i^nCn+imn+D. (4J) 2 <• = (2 О2 = п2(п4+1)2; (4.8) g ^ _ у дйЗи2 + Зн— 1 _я (я + 1) (2я + 1) (Зп2 + Зя - 1) ^ д) ■о j>5 _ ^ f» 2w2 + 2n - 1 _я» (я + 1 )Ц2гР + 2я - Г). ^ ^ 2<« = 2*»3* + 6я,7-3я+'. (4Л1) Во всех приведенных здесь формулах суммирование производится от t = 1 до t = п. Значения сумм табулированы для широкого диапазона величины п1. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРЯМОЙ Оценки параметров полиномов, характеризующих тренд, можно получить, решив уравнение (4.2), т. е. a = (T'T)-iT'Y. Полученное выражение предусматривает такую трудоемкую операцию, как обращение матрицы. В случае, если полином имеет невысокую степень, нет необходимости прибегать к такому решению. Рассмотрим систему нормальных уравнений (4.3). Решение этой системы относительно искомых параметров а и Ь дает2: а— Л2*а_ (202 ' ( ' ° — п£'2-(202 ш ( } 1 Таблицы сумм первых семи степеней натуральных чисел от п = 1 до п = 50 приведены, например, в работе: Митропольский А. К. Техника статистического исчисления. М., «Статистика», 1970. 2 Если вместо 2£ и 2t2 подставить их значения [см. (4.6)—(4.7)], то получим: 2(2л+П 6 *« л(л-1)2)"- Л(Я-1)2уЛ 6 12 * л(л—1)2^ + л(ла_1)21М Множители перед суммами являются функциями только от п. Поэтому они могут быть подсчитаны и табулированы. Такой прием использован, например, Девисом и Нельсоном (Davis H. Т., Nelson W. F. Elements of statistics with application to economic data. Bloomington, 1934). Таблица Девиса и Нельсона для п от 2 до 50 приведена в работе Канди- ларова и Димитрова (см. сноску на с. 29). 111
Напомним, что параметр Ь здесь характеризует рост у при увеличении t на единицу, параметр а соответствует значению у при t = 0. Несколько преобразовав результат, можно получить следующие удобные выражения для оценивания параметров: (4.14) (4.15) Возьмем для примера оценки параметров прямой ряд добычи угля-в Англии (см. с. 55); соответствующие уровни (yt) и произведения (ytt) приведены в табл. 4.1. Таблица 4.1 ВЫРАВНИВАНИЕ ДАННЫХ О ДОБЫЧЕ УГЛЯ В АНГЛИИ b — а~ Xytt- ,2 yt h -=ГЯ (SO2 п п t 1 2 3 4 5 6 7 yt i 227 219 209 197 ! 193 200 199 А ! 227 438 627 788 I 965 1200 1393 t 8 э 1 10 ! и 12 13 14 У/ 197 ! 191 1 177 ! 175 ! 167 ■ 193 144 V 1576 1719 | 1770 ! 1925 ! 2 004 2 509 2 016 2 yf =2 688; 2У/*= 19157. Т\о формулам (4.6) и (4.7) находим: *Чким образом, систему нормальных уравнений запишем в виде: 2688 = ^.14 + 6-105; 19157 = а-105 + &-1015. Решение этой системы с.помощью выражений (4.14), (4.15) дает: 19 157- 2 688 14 105 1 015- 105-' -4,41; 14 а = - 2 688 14 (-4,41^)^225,1. 112
Уравнение, следовательно, имеет вид $, = 225,1 — 4,41*. Аналогичным путем можно было бы подойти и к системам (4.4) и (4.5).' Однако такой путь оценки параметров достаточно трудоемок при большом числе членов ряда, и практически им мало пользуются. Поэтому мы на нем больше останавливаться не будем, а сразу перейдем к упрощенным приемам расчета, применение которых дает ощутимую экономию труда без какой-либо потери точности результатов. ИСПОЛЬЗОВАНИЕ РАСЧЕТНЫХ ТАБЛИЦ ДЛЯ НЕПОСРЕДСТВЕННОГО ПОЛУЧЕНИЯ ПАРАМЕТРОВ ПРЯМОЙ И ПАРАБОЛЫ Таблицы, содержащие специальные коэффициенты, применение которых резко сокращает объем работы, разработаны для подсчета параметров прямой и параболы.чИспользуя логарифмические преобразования исходных данных, эти же таблицы можно применить для приближенного оценивания коэффициентов экспоненты и логарифмической параболы.? Рассматриваемый прием основан на том, что в расчетных формулах, с помощью которых оцениваются параметры кривых, в той или иной комбинации выступают величины, зависящие только от порядкового номера уровня в динамическом ряду и общего числа членов ряда. Эти величины можно заранее подсчитать и свести в таблицы. Например, в формуле (4.12) для расчета параметра а уравнения прямой знаменатель равен riLt2,— (2*)2> B числителе этой'формулы для каждого t можно записать yt(%t2 — fZt), тогда, приняв: ^ = S^ — 'Б'; - М = пЪ& — (SO2, получим Аналогично для расчета 6 введем величину ?/ = '•« —2', тогда и~ м • Значения величин а*, р* и М зависят только от я, 2* и 2/2, следовательно, они могут быть подсчитаны заранее и табулированы. При построении таблиц коэффициентов можно сократить зна- (4.16) (4.17) 113
чения щ9 р* и М на общий множитель. В приложении 3 приведены значения щ, р* и М (после сокращения на общий множитель) для числа членов ряда от 5 до 20. Для иллюстрации возьмем данные примера выравнивания по прямой, который мы рассмотрели выше. Найдем в приложении 3 значения коэффициентов а*, Р* для п = 14 (см. табл. 4.2), там же находим, что М = 455. Получив НаЩг = 102 405 и 2р*#* = = —2006, определим значения параметров: « = ^ = 225,1; Ь. —2006 : 455 = -4,41. Таблица 4.2 ВЫРАВНИВАНИЕ ПО ПРЯМОЙ ДАННЫХ О ДОБЫЧЕ УГЛЯ В АНГЛИИ t 1 2 3 4 5 6 7 ■ 8 9 10 . 11 12 13 14 Итого Ь 227. 219 209 197 193 200 199 197 191 177 175 167 193 144 — а/ 130 115 100 85 70 55 40 25 10 —5 —20 —35 —50 —65 — h —13 —11 —9 —7 —5 —3 —1 1 3 5 7 9 11 13 — *tyt 29510 25 185 20 900 16745 13510 11000 7 960 4925 1910 —885 —3 500 . —5 845 —9 650 | —9 360 102 405 hyt —2 951 —2 409 —1 881 —1 379 --965 —600 —199 197 573 885 1225 1503 2123 1872 —2 006 Аналогичный подход может быть реализован и при определении параметров параболы второй степени. Так, вместо того чтобы строить и решать соответствующую систему нормальных уравнений, можно сразу определить параметры я, 6, с по следующим формулам: / Ь. ~ М ' •_2Р#/. м ' _Sw (4.18) м Значения коэффициентов а*, рг и -у^ Для п от 5 до 20 приведены в приложении 4. Подберем теперь параболу для ряда, помещенного в табл. 4.3. 114
Таблица 4.3 ГОСУДАРСТВЕННЫЕ ЗАКУПКИ ЗЕРНА В СССР* за 1956—1972 гг., МЛН. Т Годы 1956 1957 1958 1959 1960 1961 1962 1963 1964 Закупки 54,1 35,4 56,6 46.6 46,7 52,1 56.6 44.8 68,3 1 Годы 1965 1966 1967 1968 1969 1970 1971 1972 Закупки 36,3 75,0 57,2 69.0 55.5 73,3 64,1 60.0 * Народное хозяйство СССР в 1972 г. Статистический ежегодник. М„ «Статистика», 1973, с. 298. Для ряда с п = 17 находим в приложении 4 следующие значения att р* и 7* (см. табл. 4.4) и М = 7752. На основе данных табл.-4.4 находим: а = Ш^ = 44,9902; Ь = Щ§= 1,2632; < = тЙ> = 0,0013. Таким образом, уравнение тренда с оцененными параметрами имеет вид у = 44,9902 + 1,2632*+ 0,0013/2. РАСЧЕТ ПАРАМЕТРОВ ПРИ ПЕРЕНОСЕ НАЧАЛА КООРДИНАТ Второй подход к упрощению расчетов заключается в переносе начала координат в середину ряда динамики. В этом случае упрощаются сами нормальные уравнения, кроме того, уменьшаются абсолютные значения величин, участвующих в расчете. В самом деле, если до переноса начала координат t было равно 1, 2, 3, ..., то после переноса t = ..., —3, —2, —1, 0, 1, 2, 3, ..., если число членов ряда нечетное. Если же число членов ряда четное, то / = ..., —5, —3, —1, 1, 3, 5, ..Л Следовательно, Ht и все 2£\ у которых X нечетное число, равны 0. Таким образом, все члены 1 Поскольку середина ряда оказывается между двумя центральными его членами, то отрезок от середины до ближайшего уровня составит 0,5 интервала. Для того чтобы избежать дробных значений, интервал следует уменьшить вдвое, тогда t, измеренное в новых интервалах от начала координат, будет иметь значения ..., —3, —1, 1,3,... 115
" Таблица 4.4 ВЫРАВНИВАНИЕ ПО ПАРАБОЛЕ ДАННЫХ О ЗАКУПКЕ ЗЕРНА В СССР t 1 2 3 4 5- 6 7 8 9 10 11 12 13 14 15 16 17 Уг 54,1 35,4 56.6 46,6 46.7 52,1 56.6 44.8 68.3 36,3 75,0 57,2 69,0 55,5 73,3 64,1 60,0 *' 4104 3 078 2 166 1368 684 114 —342 —648 —912 —1026 —1026 —912 —648 —342 114 684 1368 Р/ —872 —583 —330 —113 68 213 322 395 432 433 398 327 220 77 —102 —317 —568 Ь 40 25 12 1 —8 —15 —20 —23 —24 —23 —20 —15 —8 1 12 25 40 V/ 222026,4 108961,2 122595.6 63748.8 31942,8 5939,4 —19357,2 —29030,4 —62289,6 —37243,8 —76950,0 —52166,4 —44712,0 —18981,0 8356,2 43844,4 8208,0 348764,4 РЛ —47175.2 —20638,2 —18678,0 —5265,8 3175.6 11097,3 18225,2 17696,0 29505,6 15717,9 29850,0 ' 18704,4 15180,0 i 4273,5 —7476,6 —20319,7 | —34080,0 9792,0 V* 2164,0 885,0 679,2 46,6 —373.6 —781,5 —1132,0 —1030,4 —1639.2 —834.9 —1500,0 —858,0 1 —552,0 55.5 879.6 1602,5 2400,0 i . 9,8 (4.19) уравнений, содержащие 2/х с такими степенями, могут быть исключены. Системы нормальных уравнений теперь имеют вид: для прямой: 2y/=*S'2; для параболы второй степени. для параболы третьей степени: 2у^ = ая + <?2<2; Sy^ftS^ + dZ*4; Бу/ = я2'2 + *2'4; Sy^ = 6S<* + rfS^. (4.20) (4.21) Решив системы (4.19) — (4.21) относительно неизвестных параметров, получим оценки параметров соответствующих-полиномов: прямой1: 1 На с. 38 и 39 были приведены выражения для определения средних скользящих приростов (ut). Теперь, когда мы рассмотрели метод наименьших квадратов и получили выражение (4.23), легко показать справедливость приведенных формул для ut. В самом деле, пусть число членов ряда равно т (чис- 116
a = ^i; (4.22) 2'2' (4.23) и2у<<2-2<22у<. «Sf-(2*2)2 ' параболы второй степени: д-2л" 2<2Г"2у^2-2*22уЛ. r424v Ь=Щ'* ^ (4-25> пЪуР-ЪУЪу,. /426v параболы третьей степени: „_2у/ 2<2Г"2у^2-2*22уЛ. /,97V, а~~ FL л 2** MS*)9 J.. (4-27>" i, —Sy<* 2<Ч2<22у<<3-2<12у<П. U9«v 2'2 2*4 2*22*« — (2'*)2 J' (.ч-.zo/. (4.29> • ^_2*22у^-2^2у<< /430ч Значения 2f2, 2tf4, 2tf8 можно получить по следующим формулам: для нечетного п: s<a=(*-1)«(* + 1). (4>31), s<*=s^ 3n2277; <4-32> S<' = S<»a"'-;^ + 81; (4.33> суммирование во всех формулах производится от t = —/? до t = р, где р= (п—1)/2; для четного я: S<3= (п~1);(й+1); " (4.34> лу членов, охватываемых скользящей средней), тогда при т, равном, допустим,. 5 (выравнивание производится по пятилетней скользящей средней), находим: - _ь Sft* _ — 2У-2 - У-\ + Уг + 2у2 т. е. получили формулу (1.33). Аналогично могут быть найдены выражения длят ut при т = 7 и т. д. 117
S^=S^^!5zL; (4.35) S^-S^a'-y + M. • (4.36) Суммирование здесь производится также от t = —р до t = p, но р = п— 1. Значения S^x, полученные по формулам (4.31) — (4.33), табулированы, поэтому при ручном счете нет необходимости их вычислять каждый раз (см. приложение 5). Для облегчения расчетов по указанным выше формулам в приложении 6 мы приводим готовые значения выражений riZP — (Е*2)2 и ЪРЪф — (2/4)2. Рассмотрим следующий пример. Пусть ряд, характеризующий государственные закупки зерна в СССР за 1956—1972 гг. (табл. 4.3), необходимо аппроксимировать параболой третьей степени. Расчет соответствующих сумм приведен в табл. 4.5. В таблице начало отсчета времени перенесено в середину ряда. Для определения необходимых нам значений 2£2, 2£4 воспользуемся приложением 5. Общее число членов в нашем примере (п) равно 17, отсюда табличные значения 2£х составят: 2£2 = 408, Зг4=17 544. Значения знаменателей пЪР — (2*2)2 и StfS*6 — (E*4)2 находим по приложению 6; они соответственно равны 131 780 и 56 927-103. Теперь подставим найденные по табл. 4.5 значения 2у*, Е#*£, 2^2 и Hytt3 в выражения (4.27) —(4.30): а - 95М>_408 / 17.22849,2-408-951,6\ _ - , а~ 17 17 \ 131780 J=oo,y*/y, - _525,6 17544 /408-19288,2— 17544-525.64 _ 9 onQ °~ 408 408 \ 56 927-Юз ) — Ао№, _ 17-22849,2-408-951,6 _ П] С — 13Т780 = U'UU14> ._ 408.19288,2— 17 544-525,6 п noQ-7 а 56 927-Юз = ~и,Ш6( • Таким образом, уравнение имеет вид :' yt = 55,9429 + 2,309* + 0,00Ш2 — 0,0237^. Поскольку данный пример приведен исключительно для демонстрации техники расчета, то вопрос о том, какая из найденных кривых лучше соответствует данному ряду наблюдений, мы не рассматриваем. Для облегчения вычисления параметров по формулам (4.22) — (4.30) при большом числе уровней динамического ряда было разработано несколько приемов. Все приемы основаны на выделении промежуточных величин из указанных формул и составлении таб- 118
Таблица 4.S ВЫРАВНИВАНИЕ ДАННЫХ О ЗАКУПКЕ ЗЕРНА ПО ПАРАБОЛЕ ТРЕТЬЕЙ СТЕПЕНИ / —8 —7 —6 —5 —4 —3 —2 —1 0 1 2 3 4 5 6 7 8 Итого yt 54,1 35,4 56,6 46,6 46,7 52,1 56,6 44,8 68,3 36,3 75.0 57,2 69,0 55,5 73,3 64,1 60,0 951,6 t* 64 49 36 25 16 9 4 1 0 1 4 9 16 25 36 49 64 /3 V —512 —343 —216 — 125 —64 —27 —8 —1 0 1 8 27 64 125 216 343 512 ytt —432,8 " —247,8 —339,6 —233,0 —186,8 —156,3 —113,2 —44,8 0 36,3 150,0 171,6 276,0 277,5 439,8 448,7 480,0 525,6 V 3462,4 1734,6 2037,6 1165,0 747,2 468,9 226,4 44,8 0 36,3 300,0 514,8 1104,0 1387,5 2638,8 3140,9 3840,0 22849,2 V3 —27699,2 —12142,2 —12225,6 —5825,0 —2988,8. —1406,7 —452,8. —44, а 0 36,3 600,0 1544,4 4416,0- 6937,5. 15832,8 21986,3 30720,0 19288,2 лиц, содержащих значения этих величин при различном числе* уровней ряда *. Перенос начала координат в середину ряда позволяет получить, любопытную интерпретацию коэффициента Ъ прямой и параболы второй степени. Так, для указанных кривых выше было найдено,, что Подставим в эту формулу вместо £ значения, равные —/?, —(/?—1)„ ..., —1, 1, ..., (/?—IX, /?. (Напомним, что р представляет собой, расстояние от центра ряда до первого или последнего уровня). После несложных преобразований получим: , (У1 — У-!> + 2 (У2 — У-*) + ... + (Р— 1) (Ур-i — У-(р-р) +Р(УР- У-р) 2 Р В числителе здесь содержится сумма взвешенных разностей уровней, равноудаленных от середины ряда, В качестве веса выступают члены натурального ряда от 1 до р. Таким образом, параметр Ь представляет собой взвешенную среднюю разность уровней. Причем наибольший вес имеет разность крайних уровней ряда, наименьший — разность двух центральных его членов. 1 См., например, Четвериков Н. С. Статистические и стохастические исследования. М., Госетатиздат, 1963, с. 197—209. В этой работе приведены таб-; лицы множителей для расчета прямой и парабол второй и третьей степени для рядов с числом членов от 5 до 100. 119
§ 2. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ЭКСПОНЕНЦИАЛЬНОЙ КРИВОЙ И ЛОГАРИФМИЧЕСКОЙ ПАРАБОЛЫ ЭКСПОНЕНЦИАЛЬНАЯ КРИВАЯ Если выравнивание ряда производится по экспоненте yt=ab*\ (4.37) причем применяется обычный МНК, то, прежде чем .оценить параметры этого уравнения, его следует привести к линейному виду. Логарифмируя (4.37), получим: log yt = log a + /log b, (4.38) или, приняв, что У* = logy,, а = log а и p = l0g6, можно вместо выражения (4.38) записать обычное уравнение прямой yJ-« + Pt 44.39) Параметры этого уравнения можно оценить с помощью метода наименьших квадратов Здесь, впрочем, надо сделать оговорку. При расчете суммы квадратов отклонений участвуют не исходные уровни, а их логарифмы. Иначе говоря, нормальные уравнения строятся исходя из минимизации 2(logy-log9)2. (4.40) Соответственно в нормальных уравнениях вместо фактических уровней выступают их логарифмы. Так, если начало отсчета времени перенесено в середину ряда, то вместо нормальных уравнений (4.3) получим: 2logy, = «i + P2<; Elogy^aSf+PE*3. ( ' Легко показать, что при такой замене оцененные параметры оказываются несколько смещенными *. 1 На с. 92 показано, что применение МНК для оценивания линейных в логарифмах уравнений приводит к некоторому смещению оценок. Дополнительным аргументом может служить следующее. 120
Коль скоро уравнение экспоненты приведено к линейному виду,, то для оценки параметров можно воспользоваться рассмотренными- выше упрощенными подходами. В частности, при применении коэффициентов приложения 3 параметры этой прямой определяются* как: 'о _ SPf log?; ' v~ М Зная значения аир, нетрудно найти параметры а и b экспоненциальной кривой. Найдем значения параметров экспоненты для ряда, характеризующего динамику розничного товарооборота государственной и кооперативной торговли в СССР за 1960—1969 гг. Расчет всех необходимых для получения параметров кривой величин показан в, табл. 4.6. Значения а* и §* взяты из приложения 3. Табличное значение М равно 165, откуда: а = 30М68=Ь8489; Р = ^-0,0302. Таким образом, а = 70,61, Ь = 1,072, а функция имеет следующий; вид: yt= 70,61-1,072'. Следовательно, средний темп прироста составит за этот период. 7,2%; Для сравнения заметим, что средний темп прироста, получаемый по двум крайним членам ряда, равен 6,9%. Расхождение для темпа прироста ощутимое. Параметр а, определенный из условия 2(# — у)2 = min, при переносе начала* координат в середину ряда равен средней арифметической Используя же условия (4.40), получим, что a «log a « —, откуда а = л/>1-Уя...Уя- Иначе говоря, параметр а здесь не что иное, как средняя геометрическая. Сред* няя геометрическая меньше средней арифметической. При небольших различиях, в значениях yt смещение будет незначительным и им можно пренебречь. Однако оно окажется серьезным в случае, если значения yt существенно отличаются друг от друга. Не приводит к смещению в подобных случаях нелинейный ЛШК. 121
Таблица 4.6 ВЫРАВНИВАНИЕ ДАННЫХ О РОЗНИЧНОМ ТОВАРООБОРОТЕ СССР ПО ЭКСПОНЕНЦИАЛЬНОЙ КРИВОЙ* t 1 1 2 3 4 5 6 7 8 * 9 10 у* 2 78,6 81,1 87,3 91,7 96.4 104,8 113.0 123.6 134,2 144,4 log yt 3 1,8954 1,9090 1,9410 1.9623 1.9840 2,0204 2,0531 2,0920 2,1277 2.1586 at 4 66 55 ' 44 33 22 11 • 0 —11 —22 —33 1 h 5 —9 —7 —5 —3 —1 1 3 5 7 9 at l°8 У/ 6 125,096 104,995 85,404 64,756 43,648 22.224 0 —23,012 —46,809 —71,234 305,068 PfJog yf 7 —17,057" 1 —13,363 1 —9,705 —5.887 —1,984 2,020 6,159 10,460 14,894 19,427 4,964 * Народное хозяйство СССР в 1969 г. Статистический ежегодник. М.» «Статистика», <Л970, с. 601. ЛОГАРИФМИЧЕСКАЯ ПАРАБОЛА Оценку параметров логарифмической параболы (2.8) можно -осуществить опять-таки с помощью метода наименьших квадратов. Запишем соответствующую систему нормальных уравнений (при условии, что начало координат перенесено в середину ряда): 21ogy, = aAz + p2*+T2'2; Slogy^aSZ+PS^ + TS*3; (4.43) Следует, однако, напомнить, что и здесь справедлива оговорка, ♦сделанная нами при получении параметров экспоненты о некоторой смещенности получаемых оценок, поскольку последние определяются исходя из минимума 2(log#*— log#*)2> а не 2(#*— yt)2. Для определения параметров теперь можно ' воспользоваться коэффициентами приложения 4. В этом случае: Потенцируя полученные значения a, p и у9 находим оценки параметров а, Ь и с логарифмической параболы. 122
§ 3. УПРОЩЕННОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ МОДИФИЦИРОВАННОЙ ЭКСПОНЕНТЫ, КРИВОЙ ГОМПЕРЦА И ЛОГИСТИЧЕСКОЙ КРИВОЙ Далеко не для всех видов кривых непосредственно применим МНК. В частности, его нельзя применить для оценки параметров логистической кривой и кривой Гомперца. В этих случаях на практике чаще всего прибегают к различным упрощенным и грубым методам оценивания. В частности, в целом ряде статистических, руководств рекомендуется применять метод трех сумм и метод. трех точек, дающие приближенные оценки коэффициентов соответствующих кривых. МЕТОД ТРЕХ СУММ. Рассмотрим метод трех сумм применительно к модифицированной экспоненте: . s yt=k + ab* (4.45> В соответствии с этим методом весь ряд разбивается на три равных отрезка или подпериода. Обозначим сумму уровней для каждого подпериода как Siy* 22У* 2вУ/- Если бы уровни ряда точно следовали модифицированной экспоненте, т. е. #1 = й + я&°> У2 = k-\-abx, y3 = k + ab2 и т. д., то сумма этих уровней составила бы для первого подпериода величину Sjу, = "Ё (k + ab*) = nk + a(b* + bi + ... + й*"1), (4.46). где п — число уровней в подпериоде, t = О, 1, ..., (п—1). Прежде чем перейдем к определению Ег#* и 2>зуи упростим выражение (4.46). Нетрудно показать, что *о + Ы + ... + Ь^ = ^=1, (4.47> отсюда 21Л = я* + л^т- (4'48> Аналогичным путем определим две следующие суммы: 22У,-л£ + я^-^£р1; (4.49) 2i У/ = nk + ab*" -^5г • (Ч°> 12а
Решение уравнений (4.48) —(4.50) дает возможность определить три искомых параметра исходя из условия равенства сумм уровней расчетного ряда суммам уровней фактического ряда динамику. Так, вычтя из уравнения (4.49) уравнение (4.48) и из (4.50) уравнение (4.49), получим: 2|У/-г:,у,=дб" {bnbz\)2'. (4.52) Решим эту систему относительно Ь, тогда Ь =№»-%» т (4.53) У Еа У*-"2л 37 Теперь решив уравнение (4.51) относительно а9 получим: д = (28у«—2»У<) {Ьп_Х)2- (4-54) Наконец, из уравнения (4.48) находим: * = -5-(21У/-т=т«). (4.55) Таким образом, последовательность расчета параметров следующая: по формуле (4.53) определяется параметр Ь, затем по (4.54) оценивается а и, наконец, по (4.55)—6. Если в последнее выражение подставить найденные выше значения а и Ь, то k можно определить следующим образом: Значение £ лучше определять по формуле (4.56), чем по (4.55), поскольку в этом случае не будет сказываться округление параметров а и Ь (малейшее изменение этих параметров обычно существенно влияет на величину k). Приведем пример оценки параметров модифицированной экспоненты. Для большей наглядности возьмем в качестве исходного ряда не фактические, а искусственно генерированные данные. Пусть уровни ряда формируются по закону k-\-ably причем £ = = 120, а = —60 и Ь = 0,5. (Напомним, что k — асимптота, а — разность между асимптотой и уо, Ь — отношение последовательных первых разностей ординат.) Полученные по формуле у*=120— —60-0,5* ординаты показаны в табл. 4.7. Естественно, что если бы в качестве исходных для оценивания данных мы имели показатели гр. 2 этой таблицы, то оценки параметров совпали бы с параметрами, принятыми при генерировании ряда. Продолжим теперь эксперимент. Пусть на показатели ряда воздействуют некоторые случайные факторы, причем соответствующие случайные сдвиги ,124
(возмущения) составляют не более 5% значения асимптоты. Воспользовавшись (таблицей случайных чисел для определения конкретных значений возмущения (е*) и его знака, получим следующий ряд (см. табл. 4.7, гр. 4). Таблица 4.7 ГЕНЕРИРОВАНИЕ ДАННЫХ t 1 1 2 3 4 Stf 5 6 7 8 2tf 9 ' 10 11 12 2зУ (модифицированная экспонента) 120-60-оУ 2 60 90 105 112,5 367,5 116,25 118.12 119,06 119.53 472,96 119,77 119,88 119,94 119,97 479,56 *t 3 +2,4 +4,8 —6,0 +6.0 —1,2 +3,6 —2,4 +2,5 +2,4 + 1.2 . —4,8 0 у* 4 62.4 94,8 99,0 118.5 374,7 115,05 121,72 116,82 122,20 475,79 122.17 121,08 115,14 119,97 478,36 Определим теперь значения параметров по данным ряда, полученного в табл. 4.7. Находим: V 475, 36 — 475,79 79 — 374,7 ^0,3528; а = (475,79 -374,7) ,ft°SZi\« - -38,85; h—x( 374,7-478,. П~ 4 \374,7 + 478, (0,3528*—1)2 36 — 475,792 )^114. ,36 — 2-475,79 Функция, таким образом, имеет вид £,-= 114 — 38,8-0,35'. Как видно из приведенного примера, даже сравнительно небольшие отклонения привели к сдвигу значений параметров, осо- 125
бенно а и &. В какой-то мере, однако, смещение значений параметров связано с тем, что введение случайных колебаний само несколько сместило кривую: положительные колебания в сумме превысила отрицательные на 8 единиц. Следует отметить, что разность сумм Е3 и 2г невелика (всего- 2,57). Следовательно, легко может сложиться ситуация, при которой эта разность станет отрицательной, что сделает невозможным определение параметров. В самом деле, если бы значение седьмого уровня было не 116,82, а 119,82, то в этом случае разность сумм составит 478,36 — 478,82 = —0,46 и, следовательно, параметр b нельзя было бы определить. В целом если разность сумм Ез#* — 2г*/* под влиянием различных причин приближается к нулю, то стремительно растут коэффициенты b и k. Если же к нулю приближается разность Ег*/* — %Уи то приближается к нулю- и коэффициент а. Итак, метод трех сумм «работоспособен» в сравнительно узких "1 пределах колебаний исходных данных, а результаты весьма чувствительны к случайным возмущениям. В силу этого перед оценкой параметров ряд следует сглаживать с помощью скользящей сред- ' ней, если имеются сильные колебания на протяжении всего ряда,, или устранять отдельные значительные колебания, заменяя соответствующие уровни средними значениями. Применим теперь метод трех сумм к оценке параметров кривой* Гомперца, при этом будем иметь в виду все замечания относитель-. но влияния случайных колебаний на точность оценок. Напомним,, что с помощью логарифмирования кривую Гомперца легко представить в виде Модифицированной экспоненты logy,~log£ + &4og<2. (4.57) Отсюда, пользуясь только что рассмотренным приемом определения параметров модифицированной экспоненты, получим: b~V ^togyt-^logyr (4'58> loga = (22logyf—S|bgy«) (у»_i)2' (4-59> log* = 4-[Silogy<-y£yIoga], (4.60) наконец, подстановка log с и log & в выражении (4.60) дает Аналогичный подход возможен при оценке логистической кривой. Если последняя имеет вид — = k + ab*, (4.62) 126
то в системе (4.48) — (4.50) значения уt надо заменить на— После соответствующих преобразований получим: или Ь = . yt 'Ss yt V Ss yt "~Sl yt u l /„ l 6«—l \ 1 Sl У/ 2з УЬ (Sa У*) УН Если логистическая кривая представлена в виде _ k У*— \ + be-at' (4.63) (4.64) (4.65) (4.66) то метод трех сумм для оценки параметров можно применить следующим образом. Пусть, как и выше, ряд разбит на три части. Соответствующие суммы обратных значений уровней равны Si—, 22 —- и 23 —, тогда: > yt yt где yt (1-*-™) (1 -e~a) Определим теперь разности: A=Sir—S2-Jr=4o-^); yt yt be /)2 = 22-^-S8^-=-f-^(l-^). yt yt (4.67) 127
Отсюда отношение разностей составит: и, таким образом, а -1 (In A -In £>,). (4.68) Далее можно поступать следующим образом. Легко доказать, что D\ be Di—Do Однако из первого выражения системы (4.67) находим: ^с — v JL л Определим теперь значение k: Поскольку то ! = e:(StlT-75^Bb)- *С А — £>2 "" А » с; »_i с D1 — Di (4.69) (4.70) Если логистическая кривая задана в виде у, = * " 1 + io*+w МЕТОД ТРЕХ ТОЧЕК (4.71) и нет полного ряда данных, то для оценки параметров можно воспользоваться методом трех точек. Подбор параметров соответственно этому методу производится так, чтобы кривая прошла через некоторые заданные точки: уровни ряда динамики в начале, середине и в конце ряда. Непременным условием является равенство расстояний между этими уровнями. Итак, нам необходимо провести логистическую кривую вида (4.71) через три точки, соответствующие уровням t/o, У\ и уз. Пусть расстояние между у0 и у\ 128
равно п единицам времени. Тогда используя соотношение (4.71), получим: v * y«-i+iU- . (4J2) 2 1 -i- Юв+б2П ■ Определим теперь параметр а из первого уравнения системы (4.72), которое представим как yo(l + W) = *. Откуда и a = log-^k (4.73) Параметр Ь найдем из второго уравнения системы (4.72), подставив в него вместо 10е соответствующее выражение. Получим: У, (1 + -^ 10*») = ft Отсюда следует, что 10Ьп = A (£ — уг) н 6=>е^п^5Ь (4J4) Наконец, перепишем последнее уравнение системы (4.72) следующим образом: yt[\ +10* (№*)*]= к. (4.75) Подставив в это выражение найденные значения 10а и 106п и произведя некоторые преобразования, получим: к_ъш-А(* + уд (4J6) У0У2-У1 Рассмотрим пример. Предварительно заметим, что при расчете по методу трех точек используется лишь малая доля информации, содержащейся в динамическом ряду,— только три уровня. Поскольку последние не свободны от случайных погрешностей, то, ло-видимому, лучше взять уровни, полученные усреднением (например, средние геометрические). 'U 5 Е. М. Чешркин 129
Итак, нам необходимо провести логистическую кривую через три точки. Пусть у о = 12,9, ух = 62,1 и у$ = 152,7. Интервалы Уо — У\ и у\ — #2 равны 6 единицам времени, тогда: А_2-12,9«62.1-152,7-62,l2(ia,9+ 152,7) _OAQ Q. Я~ 42,9.152,7—62, la =^uo,o, * ' , 208,8—12,9 - 101 a = log—'l2>9 ^1,181; A_ 1 , 12,9(208,8-62,1) _ Qn5 Q— 6 1U^62,1 (208,8- 12,9) = v>lo°- Таким образом, 208,8 1 + 101,181-0,135* Аналогичным путем найдем параметры логистической кривой вида ' у<=1тЬ- (4-77) Ординаты трех точек, через которые надо провести кривую* имеют следующие значения: Уо=тО + *); у, = |(1 + *^-); (4.78) У, = Т (!+**-*»•). Определим теперь разности d\ и d2: 1 Уо )>i * v " ^2=-—-=4- *~™ (1 —^лл). Отсюда do Таким образом, 4^' а = -^(1п^ —lnrf2). (4.79; "1 Далее определим значение выражения j-^y- После ряда преоб- 130
разовании получим: Откуда 4 4 — d% 1 1 b k ~ 1 к i k Уо d\ — d?a (4.80) Наконец, из первого уравнения системы (4.78) получим: Уо (4.81) Для иллюстрации вернемся к только что рассмотренному примеру, где уо = 12,9, yi = 62,1 и у%= 152,7, п = 6. На основе этих данных получим: -i- = 0,0775; -J— 0,0161; i- = 0,0065; Уо У\ Уч tf = 0,0614; d2 = 0,0095; а = ^ (In 0,0614 — In0,0095) =-±-[-2,7901 — (-4,6513)1^0,31; Откуда Таким образом, : 0,07752-0>06У^Ш5^ 0,0048. k = 208,2; д_208,2-0,00775 9~Я0 208,2 У* = 1+2682-* ,-0,31* • Оценка асимптоты крайне незначительно отличается от оценки, полученной выше. Как было показано, непременным условием применения метода трех точек является равенство расстояний по оси времени между выбранными для подбора кривой точками. Если это условие не соблюдено, то подбор кривой также может быть осуществлен с V*5* 131
помощью данного метода, однако для этого необходима дополни тельная информация, а именно оценка значения асимптоты. Значение асимптоты можно в ряде случаев оценить или получит вне данного статистического наблюдения, например исходя из су щества развития самого изучаемого явления и различного poдi ограничений, сопутствующих ему. Основания для определение асимптот могут быть самые различные: физические законы ил! известные физические постоянные, физиологические пределы по требления продуктов питания, наличие природных ресурсов, зако нодательные акты и т. д. Наконец, это могут быть просто некото рые априорные суждения. Пусть оценка параметров логистической кривой вида (4.71) производится на основе заданного значения асимптоты (&*) i ординат двух первых точек кривой. Решение поставленной задач? можно получить, воспользовавшись уравнениями (4.73) и (4.74) в которых вместо k подставлены k*. Допустим, что мы располагаем следующими данными: у0= 12,9; у, = 62,1 и £*^215. Тогда fl=1°g215llt92'9-1>194' При условии, что п=6, получим: & = ±log12>9(215-62>l)^_0134 ° 6 Шё62,1 (215— 12,9) = и'10^' При оценивании параметров логистической кривой вида (4.77) используем выражение (4.81), с помощью которого определим величину Ь при заданном К равном £*. Параметр а рассчитан по второму уравнению системы (4.78). Несколько преобразовав его, имеем е — ь Рассмотренный метод оценки весьма прост, однако он очень чувствителен к величине значений уо, У\ и #2, которые, даже если они получены усреднением, могут содержать существенный элемент случайности. К тому же, как об этом говорилось выше, этот метод не опирается на всю информацию, содержащуюся в динамическом ряду. Вместе с тем он весьма полезен при осуществлении различного рода прикидок, особенно при наличии отрывочных дан* ных о динамике явления. 132
§ 4. ИСПОЛЬЗОВАНИЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ДЛЯ ОЦЕНКИ ПАРАМЕТРОВ КРИВЫХ, ИМЕЮЩИХ АСИМПТОТЫ Как уже было сказано выше, при применении метода трех сумм или особенно метода трех точек получают весьма грубые оценки параметров соответствующих кривых. (Сопоставление оценок, получаемых разными методами, в том числе методом трех точек и трех сумм, приведено ниже). Вместе с тем применение метода наименьших квадратов непосредственно для оценивания параметров кривых, имеющих асимптоты, связано с чисто математическими затруднениями. В самом деле, если мы попытаемся минимизировать, например, для логистической кривой сумму квадратов отклонений то, взяв производные относительно неизвестных параметров а и Ъ и приравняв их нулю, получим пару трансцендентных уравнений, при решении которых неминуемо возникнут существенные трудности. Однако положение не совсем безнадежное. Наиболее точное оценивание параметров может быть получено с помощью нелинейного метода наименьших квадратов. Процедура такого оценивания достаточно громоздка. Поэтому если требования к точности получаемых оценок не являются очень высокими, а так обычно и бывает, то можно воспользоваться некоторыми обходными путями» позволяющими применить МНК- К рассмотрению этих подходов мы и переходим. УТОЧНЕНИЕ ОЦЕНОК С ПОМОЩЬЮ МНК Для уточнения получаемых оценок кривых, имеющих асимптоты, П. Стонер предложил применять итерационную процедуру, основанную на МНК1. Рассмотрим этот подход применительно к оценке кривой Гомперца. Для этой кривой, записанной как log t/t = log к-{-Ьг log а, можно построить систему нормальных уравнений: S ^ log yt = log k • 2 Ь* + log a v b2'; (4.82) 2 tb* log yt = log k^tb(+ log a S tb2t. Пусть t = 0, 1, ..., n— 1. Тогда преобразование этой системы после введения значений для сумм членов степенного ряда дает: Е log У/= л logk + log a (xzy) ; 1 S t о n e r P. M. Fitting the Exponential Function and Gompertz-Function by Method of Least Sguares. Journal of the American Statistical Association, vol. 36* 1941, p. 515. —-~"" 5 E. M. Четыркин Ш
л--1 I>logy^log*(^) + loga(i^i); Л-1 Ya tb*\ogyt = 0 = log*[ ^—^ J+loga[i J(y_1)a ^ J. (4.83) Решим данную систему так, чтобы в результате в качестве неизвестного фигурировал только параметр Ь. Получим следующее громоздкое выражение: (b— \)(bn— \)JJtbt-logyt-[(n~ 1)УИ-1 — nbH + bySb'lozyt = п (ь-1) s a* log y/_(^-i)s log у, "~ __ b(b™- \)-nbn(№—\) n(№-\){bn+ \) — (b + \y(b"-\) (4.84) Выражение (4.84) позволяет уточнить значение параметра 6, полученное каким-либо приближенным способом. Первоначально в правую и левую части выражения (4.83) подставляется некоторая оценка параметра b (например, можно получить ее с помощью метода трех сумм). Если эта оценка совпадает с оценкой метода наименьших квадратов, то будет иметь место равенство. Если же равенства нет, то оценку b следует изменить. Причем если левая часть выражения (4.83) больше правой, то оценку Ъ уменьшают, и, наоборот, увеличивают оценку Ь> если левая часть этого выражения меньше правой. Величина изменения b на каждой итерации зависит от принятой степени точности, с какой желательно получить параметр Ь. По-видимому, вполне достаточно изменение на 0,01. Итеративный процесс уточнения оценки продолжается до тех пор, пока знак «баланса» сторон не изменится на обратный. Тогда считается, что получена удовлетворительная точность оценки параметра Ь. Затем на основе первых двух выражений системы (4.82) можно оценить и другие параметры. Можно утверждать, что найденные оценки будут несколько смещены, поскольку нормальные уравнения строятся не для исходной функции, а для ее логарифмического преобразования. Для краткости ограничимся здесь ссылкой на аргументацию, которую мы привели в связи с оценкой параметров экспоненциальной кривой. Распространим теперь метод Стонера на "оценку параметров модифицированной экспоненты. В этом случае система нормальных уравнений примет вид: п—1 п—1 о о eS*'y< = *S*' + a'S*w; (4-85) 0 0 0 S tb% = kS tb* + aS №. 134
Заменив суммы членов степенного ряда соответствующими выражениями, получим: $Ъ = Ц$=})+а($=±); (4.86) п-\ 2^го у —r, у (б—])з ; -га \ (^—1)з ; • Наконец, решив систему (4.86) так, чтобы сохранился только неизвестный параметр &,'получим: (6—1)(6"-1)Л2 ttfyt — [(n-ljyHi —/i6" + 6]"s ^ о о о о __ 6(у|-1)-лУ(63-1) (4<87. п(^2—1) (6«+1) — (^ + 1)4^—О • Аналогичный метод можно применить и при оценивании логистической кривой, записанной в виде ~ — 1 Тогда в системе нормальных уравнений (4.85) и (4.86) вместо уе следует записать —. Соответствующим образом трансформируется и выражение (4.87). ОЦЕНИВАНИЕ ПАРАМЕТРОВ С ПОМОЩЬЮ РЕГРЕССИИ Попытаемся применить МНК для оценивания параметров модифицированной экспоненты. Выше (см. с. 48) мы утверждали, что логарифмы приростов этой кривой линейно зависят от пере- менной L Поэтому для оценивания параметров естественно использовать эту зависимость. Имеем: log uM = \oga + log (b — 1) + *log b. Две постоянные величины этого выражения log а и log(6 — 1) можно объединить в одну постоянную, назовем ее z: z = log a + log (b — 1), откуда logufn = z+tlogb. (4.88) Параметры уравнения (4.88) можно получить любым из рассмотренных выше методов, применяемых для оценивания прямой, 5* , 13&
в том числе и путем составления и решения нормальных уравнений, которые для данного случая имеют вид: 21og«m = z(n — l) + l0gb-%t; 2loguMt=zZt+logb.2fi9 где п — число членов в исходном ряду. Суммирование производится от t = 1 до t = п — 1. Имея оценки z и logb, легко находим log а = 2 — log (6 — 1), а следовательно, и параметр а. В связи с предлагаемым подходом к оцениванию надо сделать одно замечание. Этот метод применим лишь в тех случаях, когда ряд изменяется монотонно или близок к монотонности, т. е. тогда, когда значения приростов положительны и можно найти их логарифмы. Если все же имеются некоторые отрицательные отклонения (а так чаще всего и бывает), то от них иногда можно освободиться, применив предварительное сглаживание ряда по скользящей средней. Существует и более общий подход, который дает возможность применить метод наименьших квадратов при оценке данного класса кривых. Соответственно этому способу отыскивается такое преобразование уравнения кривой роста, которое является линейным относительно параметров. Задача, следовательно, сводится к оценке этих параметров с помощью соответствующих регрессий. Большинство из созданных для оценивания логистической кривой методов предусматривает раздельную оценку параметров. Сперва с помощью регрессии оцениваются параметры k и а уравнения ~ _ k У*~ \ + ье-**9 а затем определяется параметр Ъ. Рассмотрим эти методы. Методы Фишера и Готеллинга основываются на следующем. Дифференцируя функцию (4.77) по t> получим: ■& = «*(1-£). <4-89> Разделим обе части (4.89) на yt: ЗЧг—О-*). <«*» Несколько преобразуем выражение (4.90), представив его в виде линейной функции с параметрами аи у:- ' V-^.-i-'-T*. . (4-91) Последнее выражение показывает, что относительный прирост логистической кривой (темп прироста) падает пропорционально 136
достигнутому уровню. Задача теперь заключается в том, чтобы найти значения производных и т*. Однако динамические ряды не дают возможности определить dy/dt> и, следовательно, т*. Поэтому оценивание т* производят одним из следующих двух способов. Согласно Фишеру, который предполагал, что интервалы между уровнями в динамическом ряду равны, т* приближенно оценивается в виде натурального логарифма от средней геометрической двух цепных темпов роста. Для момента t эта величина составит: ^ Уш V~1U У yt-i' откуда 1 V У/-1 Уг x' = TlnU"« ' = 2, 3, ..., п— 1. (4.92) Располагая значениями %t, нетрудно построить систему нормальных уравнений для оценки регрессии (4.91). Запишем эту систему: (4-93) S^ = aSy/ + xSy?. Суммирование везде производится от t = 2 до t — n—1, где п — число членов в динамическом ряду; первый и последний члены ряда выпадают при исчислении темпа роста. Решение этой системы относительно неизвестных параметров дает: Z*/Sy?--SyfS*dV (л-2)2у?-(2>7)2' (к-2) S */У< — 2N S У< (л псч ' (*-2)2y?-CSy,>' • К^Ь) U -144 St 4J J>1 44 "Ul /-л г\л\ Располагая этими коэффициентами, легко определить значение k. Метод Готеллинга 1 отличается от метода Фишера только способом аппроксимации значений темпов прироста %t. Причем при определении темпов не предполагается, что уровни ряда равно отстоят друг от'друга. Аппроксимация достигается путем преобразования последовательных разностей. При равенстве временных интервалов между уровнями ряда результат оценивания почти не отличается от результата, получаемого с помощью метода Фишера. Практическое применение метода связано с целым рядом трудностей. В частности, результаты ненадежны, если первоначальные ряды данных содержат ошибки2. Поэтому далее на этом способе мы останавливаться не будем. 1 Hottelling H. Differential equations subject to error and population estimates. The Journal of American Statistical Association, vol. 22, 1927, p. 283— 324. 2 См.: Тинтнер Г. Введение в эконометрию (Пер. с нем.). М., «Статистика», 1965, с. 290. 137
Метод Юлах основывается на свойстве, согласно которому или Jto^.e(e._l)_£zdyM. (4.96) Таким образом, темп прироста представлен как линейная функция уровня ряда. Отсюда можно найти соответствующую регрессию Уш~~у на у*+ь Систему нормальных уравнений запишем Уж—У У в виде: а где 2*,= а(я—1)+£2Уй (4-97> Zt = lmZZlL9 а = *»—1. Суммирование производится от ? = 1 до £ = п— 1. Здесь п — число членов в исходном динамическом ряду. Решение этой системы имеет следующий вид: а— (я—i)Sy? —(Z^)a * * _(n — \)Ъ'*tУt'-Ъ,ttЪyt ь (я-1)2у?-(2у,)2 (4.98) Можно найти еще одно линейное преобразование логистической функции. Определим для этого разность между двумя обратными значениями соседних членов ряда, развивающихся по логистическому закону: 1^~J7=^^[t~\^+1^)\- (4'99) Отсюда TS7-±T1+'*-i- (4-100> Роде2 предложил оценку параметров а и k основывать на выражении (4.100). Таким образом, имеется регрессия на — Ум-i Уг * J u 11 G. V. The Growth of population and the factors which control it. The Journal of the Royal statistical Society, vol. 88, 1925. p. 1—58. 2Rhodes E. C. Population mathematics. Journal of the Royal statistical Society, vol. 103, 1940, p. 362-,387. 138
(1 _ <y-a\ с коэффициентами е~а и -—^—ч Система нормальных уравнений в данном случае имеет вид: L.(i-i)2i + ^s(^. ~ Ум У( Суммирование здесь производится от / = 1 до t = п— 1. Решение системы (4.101) относительно параметров —^— и е~а дает следующий результат: - („_1)2(^-(^Г ' (4.102) • - (n^{±)4z±r ■ Как и выше, п означает число членов в исходном ряду динамики. В заключение обзора методов оценивания параметров а и k логистической кривой остановимся на методе К. Нейра К Последний, используя соотношение (4.99), определял регрессию разности обратных значений уровней ряда на их сумму, т. е. регрессию --на 1 , Для того чтобы компактнее записать нор- У/-ы yt У/+1 yt малыше уравнения, примем: */ = -^7—=7"> (4Л03) 1. 7~~ Ум * Уж & pd Л. 1 yt 1 yt -1 - 1 • ** = -^7 + -S7"» (4-104) (4.105) Тогда выражение (4.99) можно переписать в виде zt = gj — gvt. (4.106) Для оценки параметров g и g^- составим нормальные уравнения: (4.107) S *А = £ х 2 «/— ЙГ2 •»?• 1 N a i г К. R. The Fitting of Growth Curves. Statistics and Mathematics in Biology. Jova, 1954. 139
Суммирование здесь производится от t = 1 до t = п— 1. Решение- 2 системы (4.107) относительно неизвестных параметров g н g-£ дает следующие результаты: 2__ S^Sp?—S^S*^* . g k~ (/i-i)2"?-(2«/)3 ' Определим сперва значение ~g. Затем исходя из найденного" па 2 первому уравнению системы (4.107) значения g -^ рассчитываем 2 2 величину £. Если g-^ = А, то & = g~. Что касается параметра а„ то его нетрудно найти на основе уравнения (4.105). Преобразование этого выражения дает *а—0±Ю (4.108> откуда а = In ea. . Оценим теперь параметр Ь. Если параметры а и k уже оценены,, то в этом случае для оценивания Ь можно поступить следующим образом. Перепишем уравнение логистической кривой: — — 1 = be~at. yt Прологарифмируем это выражение. Получим: ln(-J--l) = ln6 — at, откуда In b = at + In (— — 1) . (4.109) Уравнение (4.109) может быть записано для каждого члена динамического ряда, т. е. для t = 1, ..., п. Найдем средние для обеих сторон уравнения: Slnfr_ Sfl* г 21n Vy?"v После чего, имея в виду, что J] t-=n (я + х) 1 2 получим: Inft = -0Hll)+^.Sin(J._l). (4.110) 140
СРАВНЕНИЕ РЕЗУЛЬТАТОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ Для сравнения результатов, получаемых различными методами «щенки, искусственным путем сконструируем ряд. Пусть параметры логистической кривой имеют следующие значения: k = 200, а = 0,3, Ь = 35. Таким образом, ~ _ 200 У'~1+35.*-°*3<- Наложим теперь на строгую закономерность в развитии случайные колебания. Пусть они составят до ±5% от щ. Значения полученных расчетных уровней ряда {уг±гуг) показаны в гр. 2 табл.4.8. В этой же таблице в гр. 3—7 показаны все необходимые для определения регрессий линейные и логарифмические преобразования уровней. ** • Т а б л к ц а 4.8 t 1 1 2 3 4 5 6 7 S 9 10 И 12 ЛИНЕЙНЫЕ И ЛОГАРИФМИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ У1 Ь 2 7,62 10,41 12,-75 17,18 22.00 29,60 39,88 47,80 62,50 69,30 ; 87,30 105,70 I lw-й) i з 0,25735 0,25046 0,27271 0.27199 0,29739 0,23958 0,22463 0,18566 0,16708 0,21104 — Ут-yt У( 4 0,36610 0,22478 0,34745 0,28055 0,34545 0,34720 0,19859 0,30750 0,10880 0,25970 0,21070 — 1 1 Ь 5 0,13123 0,09606 0,07843 0,05821 0,04545 0,03378 0,02508 0,02092 0,01600 0,01443 0,01145 0,00946 —+ — б 0,22740 0,17440 0,13660 0,10360 0,07923 0,05885 0,04599 0,03692 1 0,03043 0,02588 0,02091 — 1 _ 1 Ут yt 7 —0,03520 —0,01763 —0.02023 —0,01275 —0,01167 —0.00871 —0,00415 —0,00492 —0,00157 —0,00298 —0,00199 — Определим теперь оценки параметров различными методами. Так, по методу Фишера получим следующую регрессию xt на yt\ т, = 0,2862 —0,001214у,; Я = 0,78. Здесь и далее R — коэффициент корреляции. Так как а ^ 0,2862 и -J- 0,001214, то 0,2862 k: 0,001214 ^234. По методу Юла имеем: it = 0,3326 — 0,00131 l#w; R = 0,52. Так хак еа — 1 = 0,3326 и = 0,001311, то k = 0°оо^зп = 254> я = In** = In 1,3326 s 0,39. 141
Использовав метод Родса, получим следующую регрессию: 0,001241 + 0,745 — ; R = 0,997. Ум yt Откуда е~а = 0,745 и а = —In 0,745 = 0,2943. В свою очередь па- \ 0-а раметр k определим следующим образом. Так как —^— =0,001241 (см. 4.100), то 1__101745 0,001241 =zuo>^ Наконец, метод Нейра (4.106) дает: —! ^ = 0,001321—0,145 (—+—V, Ум yt' , \ Ум ' У/ / /? = 0,967. Таким образом, получены следующие параметры регрессии: g^ = =0,001321 и g=0,145. На основе (4.108) имеем *"=T~FlS = 1>355 и я = In 1,355 ^0,29. Так как g -|- =0,001321, то & = 0,145 0,001321 = 22°" Параметр b оценим для всех вариантов расчета по формуле (4.110). Так, для варианта оценивания по методу Фишера получим: ln6 = 0-29<122+1>+112Sln(^-l) = 38.8. Найденные таким путем значения параметров Цриведены ниже в табл. 4.9. Опираясь на эти же данные, оценим параметры методом трех сумм (формулы (4.68) — (4.70)). Для этого разобьем ряд значений — (см. табл. 4.8, гр. 5) на три равные группы. Суммы для каждой из этих групп равны: 2i-57 = 0,3639, 22-«0,1252, 23-57 = 0,05134. Соответственно А =2,-^-22 «0,2387 Я» = 2, -£■ — 2, ~ = 0,07389. 142
: 2,717. Откуда а - -J" :'(ln 0,2387 — In 0,07389) =0,2931; 6 = 4: (0,3639-0 ^'i38^) a219.6. Для определения параметра Ь необходимо найти вспомогатель ную величину с: _(1^е^д)_(1-^-одаЦ) С~ (1_^)— (1- ,-0.2981) Тогда , 219,6 0.23872 о70 ~ 2,717*0,2387 — 0,07389 ~ Z/,y# Трехточечный метод для равноотстоящих друг от друга уровней 0,13123; 0,03078 и 0,01145 (см. табл. 4.8, гр. 5) дает следующие результаты: а = 0,29; k = 207,5 и 6 = 26,3. Если же сдвинуть данные на один шаг, т. е. оценить параметры, взяв равноотстоящие уровни 0,09606, 0,02508 и 0,00946 (II вариант), то получим: а = 0,30; £=197,9 и 6 = 24,5. Все полученные выше результаты сведены в табл. 4.9. Таблица 4.9 ОЦЕНКИ ПАРАМЕТРОВ ЛОГИСТИЧЕСКОЙ КРИВОЙ, ПОЛУЧЕННЫЕ РАЗНЫМИ МЕТОДАМИ Метод Фишера Юла Родса Нейра Метод трех сумм МетТоех 1ваРиант а 0,29 0,39 0,29 0,29 0.29 0,29 0,30 k 234 254 205 220 220 208 198 ь 38,8 34,1 34,6 37,2 27,9 26,3 24,5 R 0,78 0,52 0,997 0,968 Как легко убедиться при рассмотрении табл. 4.9, наилучшее' приближение к исходным параметрам кривой дал метод Родса и затем Нейра. Соответствующие регрессии имели высокие значения коэффициентов корреляции. Сделаем еще несколько замечаний, связанных с оцениванием параметров логистической кривой. Выше все рассуждения и пример относились к случаю, когда логистический процесс полностью проявился в прошлом. Однако далеко не всегда исследователь имеет перед собой такой ряд. Значительно чаще фактически наблюдаемый ряд охватывает не весь процесс развития, следующий 143
логистическому закону, а лишь его часть. Поскольку методы оценивания основываются на определенных соотношениях уровней: ряда, их приростов, темпов и т. д., то эти соотношения справедливы. как для всей кривой, так и для отдельных ее участков. Поэтому, если имеется отрезок ряда, в котором логистический характер развития полностью себя не проявил, однако есть основание принять гипотезу о наличии в целом логистического тренда, то этот отрезок ряда может быть аппроксимирован логистической кривой. Естественно, что точность и надежность полученных на основе неполного ряда наблюдений оценок ниже, чем при наличии полного объема информации. Для иллюстрации влияния числа наблюдений на значения параметров кривой обратимся опять к нашему искусственно генерированному ряду (см. табл. 4.8) и оценим методом трех точек пара метр k9 меняя длину ряда (число уровней от начала ряда). Пол} чим следующий результат: Длина ряда & 5 —107 7 -410 9 165 11 . 208 Только последняя оценка близка к реальности. Что касаетсяг первой и второй, то они просто не имеют смысла. Теперь возьмем три равноотстоящие точки, охватывающие в целом семилетний период, и подсчитаем возможные значения k> сдвигая этот отрезок- времени на один шаг. Получим следующие «скользящие» значения k: —410; —465; 236, 208. Как вытекает из результатов приведенного эксперимента, применять метод трех точек в силу его малой надежности (особенно при небольшом числе наблюдений) надо в крайних случаях — только тогда, когда нет иной информации, кроме трех равноотстоящих точек. Мы остановились на этом методе здесь лишь только потому, что его иногда рекомендуют без каких-либо оговорок для оценивания при неполной информации1. Методы, основанные на регрессиях дают, вообще говоря, более надежные результаты. Так, по методу Нейра получены следующие оценки параметра k при изменении продолжительности наблюдений (измеряемого от начала ряда): Длина ряда k 6 415 7 205 8 269 9 186 10 208 11 198 1 В о h m E. Modelle fur Entwicklungsprognosen ira Fernsprechwesen. Univ^ Stuttgart, 1970. 144
Примерно такую же колеблемость в значении параметра k при увеличении продолжительности наблюдений дает метод Родса. Следует, однако, отметить, что оценка параметра k наиболее чувствительна к объему и точности исходных данных и, как правило, относительная ее ошибка превышает ошибки в значении остальных параметров кривой. В ряде случаев даже методы, основанные на регрессиях, дают значения параметра &, которые явно выглядят нереальными, например, они оказываются меньшими, чем отдельные значения уровней. В этих случаях, по-видимому, следует прибегнуть к какому-либо итерационному способу корректирования оценок1. На одном из них мы останавливались выше (метод Сто- нера). ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРИ ЗАДАННОМ ЗНАЧЕНИИ АСИМПТОТЫ Есть еще один прием, позволяющий применить МНК при оценке функций, имеющих асимптоты. Он заключается в приведении выражения соответствующей функции к линейному виду. Мы полагаем, что исследователь располагает некоторой информацией о возможном значении асимптоты. Обозначим эту оценку как k*. Тогда модифицированную экспоненту (2.10) можно записать как yt — k* = abt. Откуда log(yt—k*) = loga + tlogb. (4.111) Параметры log а и log Ь теперь нетрудно оценить обычным методом наименьших квадратов. Аналогично подходим и к оцениванию логистической кривой. Несколько преобразовав уравнение (4.77), получим: yt Заменим k на известную величину &* и прологарифмируем это выражение (поскольку здесь имеется величина е, то удобнее применить натуральные логарифмы). Получим: 1п(— — l) = ln* — at . ' (4.112) Теперь можно применить МНК для оценивания In b и а, являющихся коэффициентами линейного уравнения. 1 Совсем недавно предложен иной итеративный путь корректировки параметров логистической кривой, который заключается в разложении функции в ряд Тейлора и применении 7V1HK к ее приближению, полученному при разложении. В качестве первоначальных значении параметров кривой принимаются оценки, полученные каким-либо приближенным способом (Е11 e t о О., Н u n у a d i L. On the Estimation of the parameters of the logistic function. — Доклад на Европейской конференции эконометрического общества, Будапешт, 1972 г.). 145
Рассмотрим пример. Пусть исходя из некоторых соображений принята гипотеза, согласно которой асимптота логистической кривой для рассмотренного выше примера (см. табл. 4.8) равна, скажем, 210. Тогда, обозначив новые переменные символом у* получим: Необходимые для оценивания параметров суммы имеют следующие значения: 2/ = 78; 2'2^650; 2^=19,908; 2у* / = 86,955; лЕ*2 —(2')2 = 12-650 — 782= 1716. Откуда (см. (4.12) и (4.13)): , , 19,908.650 — 78-86,955 0 -00/1 in о = j-yjg = о,ооо4; 6 = 36,15; 12.86,955 — 78.19,908 п оп~0 а = Тш = ~°>2968- Если априорная оценка асимптоты (&*) имеется для кривой Гомперца, то выражение (2.11) может быть слегка преобразовано: k* a ' После логарифмирования получим: 1°ё (-£*)=& log a и log[log(^)]=log(loga)a + nogft. (4.113) Таким образом, опять найдено линейное выражение, для оценки параметров которого можно применить метод наименьших квадратов. § 5. ДИСКОНТИРОВАННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ При оценивании параметров методом наименьших квадратов все наблюдения, как это было показано выше, рассматриваются как равные с точки зрения их информационной ценности. Однако в ряде случаев, а именно тогда, когда окружающие условия, влияющие на формирование тренда, изменяются сравнительно быстро и мы можем предположить, что сам тренд постоянно изменяется, гипотеза независимости ценности наблюдений от времени представ- 146
ляется сомнительной. В этих случаях, по-видимому, иногда полезно прибегнуть к так называемым дисконтированным наименьшим квадратам. Соответственно этому методу каждому наблюдению» (уровню ряда) можно придать вес. Обозначим вес через Pj, где / — период отставания данных от последнего уровня. Вес уменьшается по мере «устаревания» наблюдения. Сумму квадратов отклонений, которую надо минимизировать,, теперь можно представить следующим образом: <г=Ё«Ду,-У,)8. (4Л14> где t = п — j; t = 1, ..., n, / = 0, ..., n — 1. Исходя из выражения (4.114) получим следующую систему нормальных уравнений для прямой: 2уА = «2Ру + *2*у; 2уА = *2<Р/ + *2^. Соответствующим образом можно ввести весовые коэффициенты и в нормальные уравнения для оценивания параметров более высоких степеней. При работе с системой (4.115) приходится выполнять довольно много вычислений, поскольку величины pj представляют собой некоторые функции от периода отставания / и начальной величины весового коэффициента. Однако расчет можно упростить без потери в точности результатов, если подойти несколько иначе. Так возьмем уравнение, характеризующее взаимосвязь у со временем:' Введем в него веса. Для этого согласно (4.114) надо остаточный член st умножить на весовой коэффициент: Разделим полученное выражение на pj. Получим: Таким образом, получили регрессию величины •£- на две перемен- 1 t Pj ныео7 и 57. Основной проблемой здесь является выбор формы функции pj и значения р. От этого в существенной мере зависят оценки параметров тренда и, следовательно, получаемые на этой основе прогностические оценки. Поскольку система весовых коэффициентов определяет степень влияния прошлого на тренд, то, по существу, она как бы представляет собой числовую характеристику степени инерционности явления. Отсюда сам собой напрашивается вывод о том, что система весов должна устанавливаться с учетом влияния фактора инерционности. Чем быстрее изменяются усло- 14Т
вия, формирующие явление, тем меньше влияние на параметры тренда должны оказывать данные, удаленные в прошлое. Какова же должна быть функция р*, определяющая систему весов? Ответ на этот вопрос, очевидно, связан со спецификой воздействия прошлого на настоящее и будущее и может быть дан только в ходе конкретного анализа явления по существу. Что касается самих систем весовых коэффициентов, то можно предложить ряд функций для их определения. Например, если предполагается, что воздействие прошлого ослабевает постепенно, без ускорения, то, по-видимому, в таких случаях можно применить веса, определяемые арифметической прогрессией, т. е. РУ=1 — й/, у = 0, ..., т— 1. (4.117) Величина р, естественно, больше 0. Что касается ее верхней границы, то в том случае, если протяженность ряда (п) больше т, она не может быть больше 1/т, где т — число уровней, которое должно быть учтено при определении тренда. Если т = я, то при выборе значения р, по-видимому, можно исходить из значения р,, придаваемого первому наблюдению в ряду. Так, если Pj«n-i равно, допустим, 0,4, то р= (1 — 0,4)/(гс— 1). Рассмотрим теперь, так сказать, «лавинообразующий» процесс, т. е. тот случай, когда устаревание данных происходит с ускорением (геометрическая прогрессия). Тогда Ру=Р. 7 = 0, ..., я—1. (4.118) Величина р больше нуля и меньше 1. Поскольку падение веса при низких значениях р происходит весьма стремительно при росте /, то р должно быть достаточно высоким. Во всяком случае, чем выше величина р, тем больше число уровней ряда практически окажет влияние на получаемые оценки параметров тренда. Так, при р = = 0,8 вес порядка 10% соответствует десятому члену ряда, при Р = 0,7 этот вес приходится на шестой член, при р = 0,9 уже лишь 22-й член имеет примерно этот же вес. Можно полагать, что практически р может находиться в пределах 0,99—0,8. Значение р, необходимое в данной ситуации, можно выбрать исходя, например, из веса, который желательно придать, допустим, первому или иному уровню ряда. Арифметическая и геометрическая прогрессии не исчерпывают всех возможных конфигураций систем весовых коэффициентов. Вообще говоря, эта конфигурация может быть любой. В частности, в ряде случаев веса могут следовать, например, логистической кривой или располагаться по. ступенчатой линии. Обе предложенные системы коэффициентов имеют, как нам представляется, практическое значение. Так, если весь наблюдаемый ряд можно разбить исходя из каких-либо соображений на несколько подпериодов, имеющих различную степень воздействия на формирование современных тенденций, и нет оснований для учета степени устаревания внутри каждого подпериода, то в этих случаях можно прибегнуть к ступенчатой конфигурации системы весов. 148
Для иллюстрации возьмем линейный тренд добычи каменного угля в Англии (см. с. 60). Предположим, что при оценивании коэффициента следует применить систему весов, определяемую геометрической прогрессией: пусть знаменатель прогрессии § равен 0,9. Тогда значения —т- и — будут следующими (см. табл. 4.10): р7 р7 Таблица 4.10 значения 1 t Р7" (Р=0,9) t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Э> 0,254 0,282 0,314 0,349 0,387 0,430 0,478 0,531 0,590 0,656 0,729 0,81 0,9 1 1 . р* 3,934 3,541 3,187 2,860 2,582 2,323 2,091 1,882 1,693 1,524 1,372 1.234 1,111 1,000 / • 3,934 7,081 9,560 11,472 12,906 13,938 14,635 15,053 15,241 15,241 15,089 14,815 14,444 14,000 Соответственно, найдя регрессию на -^ и -т^-, получим ^ = 226,3 J-+(-4,64)^. Таким образом, линейный тренд, определенный с учетом дисконтирования наблюдений, имеет вид у, = 226,3 — 4.64* Напомним, что без дисконтирования параметры линейного тренда .были равны соответственно 225,1 и —4,41..Небольшое расхождение в оценках параметров связано с тем, что ряд, взятый в качестве примера, относительно короткий и, следовательно, дисконтирование не проявило себя здесь очень резко (вес первого отклонения, у\ — уи составляет 0,913^0,25). Если мы усилим учет «устаревания» данных путем уменьшения значения знаменателя прогрессии, например примем р = 0,8 (соответственно первое отклонение получит вес 0,813^ 0,05), то весовые коэффициенты примут следующие значения (табл. 4.11): 149
Таблица 4.11 ЗНАЧЕНИЯ ?У, — и — (р==0,8) t 1 2 3 , 4 5 6 7 8 9 10 11 12 13 • 14 Э> 0.055 0.069 0,086 0.107 0,134 0.168 0.210 0,262 0,328 0,410 0,512 0.64 0.8 1 1 18,190 14,552 11,642 9,313 7,450 5.960 4,768 3.815 3,052 2,441 1.953 1,562 1.250 1.000 t 18.190 29.104 34,925 37,253 37.253 35,763 33.379 30.518 27,466 24,414 21,484 18,750 16,250 14.000 Соответственно уравнение тренда примет вид h = 229 J Л + (-5,66 -U Р' V \ V) у, = 229,7 — 5,66/. Как и следовало ожидать, ослабление влияния ранних^членов ряда и соответственно увеличение влияния последних его членов привело к росту абсолютного значения коэффициента при /.
5 ЭКСТРАПОЛЯЦИЯ ТРЕНДОВ За 175 лет длина Миссисипи в ее нижнем течении сократилась на 242 мили. В среднем река укорачивалась более чем на 1,3 мили в год. Всякий здравомыслящий человек, не являющийся тупицей или идиотом, поймет, что ровно миллион лет назад длина Миссисипи составляла более 1,3 миллиона миль, и она пересекала Мексиканский залив подобно удилищу. В силу тех же причин каждому должно быть ясно, что по прошествии 742 лет протяженность. Миссисипи в ее нижнем течении сократится до одной мили с четвертью... В науке есть нечто такое, от чего захваты- ~ вает дух. Обладая пустяковыми запасами фактов,* с помощью науки можно выдвинуть невероятное число догадок и предположений. Марк Твен. Жизнь на Миссисипи Один из наиболее распространенных методов прогнозирования заключается в экстраполяции, т. е. в продлении в будущее тенденции, наблюдавшейся в прошлом. Экстраполяция тенденций динамических рядов сравнительно широко применяется в практике в силу ее простоты, возможности осуществления на основе относительно небольшого объема информации, наконец, ясности принятых, допущений. Отсутствие иной информации помимо отдельно рассматриваемого динамического ряда часто оказывается решающим при выборе этого метода прогнозирования. При таком подходе к прогнозированию предполагается, что размер признака, характеризующего явление, формируется под воздействием множества факторов, причем не представляется возможным выделить порознь их влияние. В, связи с этим ход развития связывается не с какими-либо конкретными факторами, а с течением времени. Экстраполяция базируется на следующих допущениях? 1) развитие явления может быть с достаточным основанием охарактеризовано плавной (эволюторной) траекторией — трендом; 2) общие условия, определяющие тенденцию развития в прошлом, не претерпят существенных изменений в будущем. 151
Таким образом, экстраполяция дает описание некоторого общего будущего развития объекта прогнозирования. Причем если развитие в прошлом носило перманентно скачкообразный характер, то при достаточно продолжительном периоде наблюдений скачки оказываются «зафиксированными» в самом тренде, и последний опять-таки можно применить в прогнозировании. Поясним это следующим примером. Как известно, ЭВМ имеет довольно короткую, но бурную историю развития. Можно выделить по крайней мере три ее этапа: создание ЭВМ на лампах, замена ламп транзисторами, переход к интегральным схемам. Причем на каждом из этих этапов реализовывались десятки различных новшеств. Соответственно резко изменялись функциональные возможности ЭВМ, увеличилась скорость выполнения операций, вырос объем запоминающих устройств и т. д. Так или иначе, но все указанные изменения привели к тому, что развитие характеристик, отражающих рост^ производительности ЭВМ, близко к экспоненциальному тренду1. С другой стороны, если рассматривать небольшой период, резкое изменение окажется единичным и не проявит себя при определении тренда. Выше были сформулированы основные условия, наличие которых дает возможность осуществлять экстраполяцию тренда. В практике прогнозирования может возникнуть вопрос, а как поступить, если условия формирования тренда заметно изменяются и этого следует ожидать и в будущем? В этом случае возможны различные подходы к решению проблем. В частности, в ряде случаев тренд можно «исправить», сокращая период наблюдения, отсекая члены ряда, сформировавшиеся при явно других условиях и искажающие новую тенденцию. Однако далеко не всегда можно провести четкую границу во времени, разделяющую новые и старые условия развития исследуемого явления. В этом случае подходящим является оценивание параметров, учитывающее устаревание данных. Такой прием возможен тогда, когда переход к новым условиям не имеет резкой границы и в то же время есть основания считать влияние этого перехода достаточно эффективным. Наконец, возможна корректировка параметров уравнений,, характеризующих тренд. Например, изменение постоянного члена в уравнении полинома сдвигает тренд по оси ординат, не изменяя формы кривой. Такой прием применим, когда предполагается, что развитие будет следовать прошлой тенденции, однако есть основание для перехода к какому-либо базовому уровню, отличающемуся от уровня, полученного по уравнению тренда. Корректированию могут быть подвергнуты и другие параметры (помимо постоянного члена). Такого рода поправки изменяют форму тренда. Например, изменяют угол наклона прямой, растягивают или сжимают кривую и т. д. Подобные деформации тренда,, разумеется, должны иметь достаточные основания. 1 Marti no J. Technological Forecasting for Decisionmaking. N. Y., 197Ц p. 140—141. 152
По-видимому, самым правильным было бы рассматривать экстраполяцию не как конечный результат прогнозирования, а как некоторый отправной момент, на основе которого с привлечением дополнительной информации, не содержащейся в самом динамическом ряду, разрабатывают прогноз. Вместе с тем часто ее результат с соответствующей корректировкой или без нее рассматривается и как окончательный прогноз. Можно привести много примеров, когда экстраполяция оказалась достаточно точным инструментом прогнозирования. В частности, можно указать на прогноз потребления алюминия в США. на 1965 г., разработанный в 1957 г..по данным за 1919—1954 гг.1. Фактическое отклонение от прогноза составило всего лишь 0,1 среднего квадратического отклонения от линии, характеризовавшей тенденцию2. Вероятно, нетрудно найти примеры, когда экстрапо- ляционный метод оказался несостоятельным. Как правило, большие. погрешности при таком подходе оказываются следствием несоответствия фактических условий развития тем предположениям^ которые лежат в основе экстраполяции. При определении прогностических значений того или иного явления с помощью экстраполяции наибольший интерес представляет, по-видимому, не сама экстраполяция — это более или менее механический прием, а определение доверительных интервалов прогноза. В самом деле/экстраполяция дает возможность получить точечное значение прогноза. Однако экономические переменные, как правило, являются непрерывными и, следовательно, указание их точечных значений, строго говоря, лишено содержания, поскольку «попадание» в точку имеет нулевую вероятность. Отсюда следует, что прогноз должен быть дан в виде «вилки», интервала значений. Одним из путей получения такой «вилки» является определение доверительного интервала прогноза. $ Доверительные интервалы могут быть определены двояко: формально и неформально. Что касается.последнего, то это дело экспертного суждения, которое выносится при качественном осмыслении результатов прогноза, сопоставлении их с другими имеющимися у эксперта данными и т. д. При этом, естественно, эксперт должен учитывать не только степень колеблемости фактических уровней вокруг тренда в прошлом, но и возможность деформации тренда в будущем (соответственно могут быть получены различные варианты прогноза). Формальный доверительный интервал учитывает лишь ту неопределенность, которая связана с ограниченностью числа наблю- / дений и соответствующей неточностью найденных оценок параметров кривой. Основной вопрос — в какой мере в будущем сохранится найденная тенденция, — естественно, не может быть решен 1 Rosenzweig. I. E The Demand for Aluminium: a Case Study in Long- Range Forecasting. Univ. of 111. Bull., p. 463, Apr., 1957. 2 Строго говоря, единичное совпадение или расхождение прогноза и действительного значения показателя еще не является достаточно убедительным свидетельством качества прогнозирования. Ниже мы рассмотрим эту проблему. •_ 15а-
с помощью таких доверительных интервалов. Это дело содержательного экономического анализа и, вероятно, экспертной оценки. Основное внимание в данной главе уделено оценке формальных доверительных интервалов, базирующихся на статистическом ана- . лизе. Сразу же заметим/что формальные доверительные интервалы можно получить далеко не во всех случаях. В частности, доверительные интервалы для сложных кривых, отличающихся от полиномов, если их и можно как-то определить, имеют достаточно условный характер. § 1. ПРОСТЕЙШИЕ ПРИЕМЫ ЭКСТРАПОЛЯЦИИ Операцию экстраполяции в общем виде можно представить в ъиде определения значения функции yi+L=f{fn Ч (5-1) где t/гч-ь — экстраполируемое.значение уровня; L — период упреждения; у* —уровень, принятый за базу экстраполяции. ЭКСТРАПОЛЯЦИЯ НА ОСНОВЕ СРЕДНЕЙ В самом простом случае при предположении о том, что средний уровень ряда не имеет тенденции к изменению или если это изменение незначительно (на проверке гипотезы о стационарности ряда мы останавливались в § 1 гл. 1), можно принять Уч1 = У, (5.2) т. е. прогнозируемый уровень равен среднему значению уровней в прошлом. В некотором смысле отрезок динамического ряда, охваченный наблюдением, можно уподобить выборке. В самом деле, увеличение или уменьшение длины динамического ряда или плотности наблюдения в' каждом временном интервале изменяет объем наблюдения и состав уровней, входящих в расчет средней. Таким образом, значение средней для данного отрезка ряда можно рассматривать как своеобразную выборочную оценку некоторой «истинной» средней, т. е. как выборочную среднюю. Отсюда можно определить ее погрешность и доверительный интервал, в котором с заданной вероятностью находится средняя. Доверительные границы для средней при небольшом числе наблюдений (и предположений о нормальном распределении) определяются следующим образом: ' — ay' где U—табличное значение ^-статистики Стьюдента с п—1 степенями свободы и уровнем вероятности р, Sy —средняя квадратиче- 154
екая ошибка средней. Значение последней определяется по формуле В свою ^очередь среднее квадратическое отклонение 5 для выборки, равно: — У*^. (5.4> Доверительный интервал, полученный как taSy9 учитывает ту неопределенность, которая связана с оценкой средней величины.. Применение его для прогнозирования, несомненно, несколько увеличивает степень надежности (переход от точечного прогноза к интервальному) . Однако при этом остается в силе предположение о том, что прогнозируемый показатель равен средней, т. е. при таком подходе не учитывается то, что отдельные значения исследуемого показателя варьировали вокруг средней в прошлом и, несомненно, будут варьировать и в будущем. Поэтому доверительный интервал для прогностической оценки должен учитывать и этот фактор. Отсюда общая дисперсия (связанная как с колеблемостью- выборочной средней, так и с варьированием индивидуальных значений вокруг средней) составит величину s2-\~-^- Таким образом,, доверительные интервалы для прогностической оценки равны: yi+L = y±te]fl + -n- . (5.5> Недостаток рассмотренного подхода заключается в том, что доверительный интервал здесь не связан с периодом упреждения. По-видимому, будет уместным подчеркнуть, что характеристик» вероятности, да и сам доверительный интервал, строго говоря,, имеют вполне определенное содержание только для статистической совокупности, имеющей устойчивый характер (стационарная совокупность). Вряд ли можно говорить о том, что в экономике в основном имеют дело с устойчивыми совокупностями (по крайней мере для-продолжительных периодов). Однако там, где есть основание для того, чтобы прогноз, обычно краткосрочный, основывался на средней величине, т. е. если есть предположение о том, что совокупность приближается*к стационарной, расчет доверительного- интервала — вполне оправданная и полезная операция. * Еще одно замечание. В ряде практических и учебных руководств (в частности, относящихся к страховым расчетам) рекомендуется для оценки средних (например, так называемой средней убыточности страхового рубля) брать возможно больший период, так как это якобы позволит получить более надежную среднюю на перспективу. Действительно, если совокупность была бы стационарной, это указание было бы справедливо, однако при охвате довольно дли- 155
тельного ряда, как правило, обнаруживается тенденция к изменению. Отсюда чем продолжительней ряд, взятый для расчета средней, тем меньше оснований для применения ее в прогностических расчетах. Например, в случае, если ряд обнаруживает тенденцию к росту, средняя, взятая в качестве основы прогноза, будет заведомо занижать искомые величины. «НАИВНЫЕ» ЭКСТРАПОЛЯЦИОННЫЕ МОДЕЛИ В краткосрочных прогностических исследованиях иногда оперируют с так называемыми «наивными» моделями. Эти модели можно записать в следующем виде: У* = У«; (5.6) У/—Ум = Ум—Ум- (5.7) Первая модель означает неизменность уровня, вторая — постоянство абсолютных изменений. Естественно, что такие модели в силу чрезмерной «наивности» вряд ли можно рассматривать как надежный инструмент прогнозирования. Правда, в краткосрочном прогнозировании они иногда дают вполне удовлетворительные результаты. Такие модели могут практически применяться и для других целей — для получения базы сравнения и оценки качества краткосрочных прогнозов. В этом случае ошибки «наивного прогноза» рассматриваются как некий эталон, с которыми сопоставляются ошибки прогнозов, полученных иными методами. ЭКСТРАПОЛЯЦИЯ ПО СКОЛЬЗЯЩЕЙ И ЭКСПОНЕНЦИАЛЬНОЙ СРЕДНЕЙ Для краткосрочного прогнозирования в ряде случаев могут быть применены адаптивная или экспоненциальная скользящие средние. Если прогнозирование ведется на один шаг вперед, то Ум = Мц или yM = Ql9 (5.8) где Mi — адаптивная скользящая средняя (1.31); Q — экспоненциальная средняя (1.39)., Естественно, что прогноз, выраженный точечной оценкой (5.8), не удовлетворяет нас, поскольку не учитывает возможных отклонений от этой оценки. Доверительный интервал для скользящей средней можно определить аналогично тому, как это было сделано в (5.5). В формуле (5.5) для обозначения числа наблюдений использован символ п. Поскольку при расчете скользящей средней через т обозначалось число членов ряда, участвующих в расчете средней, то заменим в этой формуле п на т. Так как т обычно берется равным нечетным числам, то подсчитаем для них соответствующие значения величины |/ 1+— (см. табл. 5.1). Что касается экспоненциального сглаживания, то, так как диспер- J56
сия экспоненциальной средней равна тт-^— s2, где s — среднее квад- ратическое отклонение1, вместо величины I/ 1 + ~в формуле (5.5) при исчислении доверительного интервала прогноза следует взять величину!/ 1 + 2^~» и^и I/ 2 —а * Напомним, что здесь а — коэффициент экспоненциального сглаживания. Применение скользящей и экспоненциальной средних в качестве основы для прогностической оценки, вообще говоря, имеет смысл лишь при относительно небольшой колеблемости уровней. Если же уровни имеют значительную флуктуацию во времени, то> значения, среднего квадратического отклонения и i-статистики Стьюдента будут весьма высокими и, следовательно, доверительный интервал окажется очень, широким. Например, обратимся к. примеру с урожайностью озимой пшеницы, который мы рассматривали в гл. 1 (см. табл. 1.2). Если принять t/i+\ = Ми то прогноз,, например,-для шестого по-порядку члена ряда (см. табл. 1.4) составит 12,5 (при т=^=5). Среднее квадратическое отклонение для первых пяти уровней ряда равно 3,37 ц/га. При 4 =2,132 (90%-ная доверительная вероятность, число степеней свободы равно 5—1=4) прогноз для шестого года с учетом доверительного интервала равен 12,5±2,132-3,37-1,095= 12,5±7,86, т. е. результат настолько неопределен, что вряд ли имеет какую-либо практическую значимость2. Приведенное выше замечание о неправомерности применения средней для прогнозирования при наличии явной тенденции ряда к росту (или падению) справедливо и для экстраполяции с адаптивной и экспоненциальной средней. ЭКСТРАПОЛЯЦИЯ НА ОСНОВЕ СРЕДНЕГО ТЕМПА Если в основу прогностического расчета положен средний темп роста, то экстраполируемое значение уровня получают по формуле yi+L = yhL> (5.9) где х — средний темп роста; У* —уровень, принятый за базу для экстраполяции. Сразу же сделаем одну существенную оговорку. Так, применение среднего темпа для экстраполяции предполагает только один тип развития — развитие по геометрической прогрессии или по экспонентной кривой.. Во многих же случаях фактическое развитие явления следует иному закону, и экстраполяция по среднему темпу нарушает основное допущение, принимаемое при экстраполяции, — 1 BrownR. Smoothing, Forecasting and Prediction. N. Y., 1963, p. 10. - 2 Столь высокое значение среднего квадратического отклонения связано в~ первую очередь с большим отрицательным отклонением от средней третьего члена ряда, что существенно повлияло на sy при небольшом числе усредняемых величин. 157*
допущение о том, что развитие будет следовать основной тенденции— тренду, наблюдавшемуся в прошлом. Чем больше фактический тренд отличается от экспоненты, тем больше данные, получаемые при экстраполяции тренда, будут отличаться от экстраполяции на основе среднего темпа. На рис. 5.1 показаны примеры этого (для прямолинейного тренда и тренда; следующего модифицированной экспоненте). Н 1 *J%P < У1 У / / / ^ U-" ifi 1 Е У1Н Рис. 5.1. Сравнение результатов экстраполяции по среднему темпу (I) с экстраполяцией по прямой (II) и модифицированной экспоненте (III) Таблица 5.1 ЗНАЧЕНИЯ ВЕЛИЧИНЫ!/ 1+-1 V т т. 3 5 7 9 11 /^ 1,153 1,095 1,068 1,054 1,044 Рис. 5.2. Экстраполяция по среднему темпу. Влияние выбора базового уровня Средний темп определяется или на основе изучения прошлого, или оценивается каким-либо другим путем (например, подбор вариантов для различных ситуаций). В качестве исходного (базового) уровня для экстраполяции представляется естественным взять последний уровень ряда, т. е. уь = у^ поскольку будущее развитие начинается именно с этого уровня. Обычно так и поступают. Однако такой подход может привести к смещению прогностической оценки. Рассмотрим рис. 5.2. На нем изображены последние уровни ряда, характеризующего динамику некоторого показателя. Пусть 158
развитие в прошлом следовало экспоненциальному тренду. Пред- полагается, что" он сохранится и в будущем. Ряду свойственна некоторая колеблемость относительно найденного тренда. Совершенно очевидно, что прогностическая оценка будет зависеть от того, в какую сторону отклонялся базовый уровень от тренда. Экстраполяция от Уг при значительном отклонении, например, вниз (как это и показано на рисунке) приведет к соответствующему занижению прогностической оценки. В связи с этим в качестве базового уровня лучше принять расчетный уровень, соответствующий найденному тренду. Для этого надо определить экспоненциальную кривую и на ее основе найти базовый уровень. Если тренд не был найден, то для устранения влияния колебаний можно прибегнуть к усреднению последних нескольких уровней. Здесь вполне уместно было бы применение экспоненциальной или геометрической средней. Нельзя исключить возможность выбора в качестве базы экстраполяции максимального (а в ряде случаев минимального) уровня, наблюдавшегося в прошлом. Разумеется, выбор того или иного метода зависит от содержания анализируемого показателя и цели прогнозирования. Вместе с тем можно полагать, что наиболее употребительными должны быть подходы, позволяющие в какой-то мере устранить влияние колеблемости ряда и тем уменьшить влияние случайности. Во всяком случае это относится к рядам, которым свойственны значительные колебания. Что касается доверительного интервала прогноза, то он может быть получен и в этом случае. Однако квадратическая ошибка и, следовательно, доверительный интервал будут значительно выше, чем доверительный интервал, получаемый при экстраполяции по экспоненциальному тренду. § 2. ЭКСТРАПОЛЯЦИЯ ТРЕНДА И ДОВЕРИТЕЛЬНЫЕ: ИНТЕРВАЛЫ ПРОГНОЗА Если при анализе развития объекта прогноза есть основания принять два базовых допущения экстраполяции, о которых мы говорили выше, то процесс экстраполяции заключается в подстановке соответствующей величины периода упреждения в формулу, описывающую тренд. Причем, если по каким-либо соображениям при экстраполяции удобнее начало отсчета времени установить на момент, отличающийся от начального момента, принятого при оценивании параметров уравнения, то для этого в соответствующем, многочлене достаточно изменить постоянный член. Так в уравнении прямой при сдвиге начала отсчета времени на т лет вперед постоянный член будет равен а-^Ъту для параболы второй степени он составит величину а + bm + cm2. Экстраполяция, вообще говоря, дает точечную прогностическую оценку. Интуитивно ощущается недостаточность такой оценки и необходимость получения интервальной оценки с тем, чтобы про- 159
тноз, охватывая некоторый интервал значений прогнозируемой переменной, был бы более надежным. Как уже сказано выше, точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, — явление маловероятное. Соответствующая погрешность имеет следующие источники: 1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной или тем более наилучшей для экстраполяции в данных конкретных условиях; 2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а следовательно, и ее положению в пространстве свойственна некоторая неопределенность; 3) тренд характеризует некоторый средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем. Погрешность, связанная со вторым и третьим ее источником, может быть отражена в виде доверительного интервала прогноза*» при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный экстраполяционный прогноз преобразуется в интервальный. Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения прогноза. » Одна из основных задач, возникающих при экстраполяции тренда, заключается в определении доверительных интервалов прогноза. Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве «уровень — время» и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, вопрос о доверительном интервале прогноза следует начать с рассмотрения измерителя колеблемости. Обычно такой измеритель определяют в виде среднего ювадратического отклонения (стан- 160
дартного отклонения) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда. В ^общем^виде cPg^ggJJ5B-?AP.^THj^£gQg °™£Q^e^^_9T-JP-gg£^ можно выразить как I/ Е(*--й)а «у= г Ь1-7—• (5Л0) где #*, yt — соответственно фактическое и расчетное значения члена ряда; / — число степеней свободы, f—n — т\ где т!— число оцениваемых параметров;^— число наблюдений. Так, если выравнивание производится по прямой, то f—n — 2, для параболы второй степени f=n — 3 и т. д. Сумму квадратов отклонений от тренда (возьмем для простоты линейный тренд) можно, очевидно, разложить следующим образом: |/у,-у,)2==Е(у?-2у,у,+й) = = Е [У2, — 2У* (а + **) + (а +ЫУ] = = 2У? — 2a^yt—2bZytt-{-a2n + 2al>2,t+bs2lt2. (5.11) Выражение (5.11) можно упростить. Допустим, что начало отсчета времени находится в середине ряда, тогда 2£ — 0. Параметры а и Ь, как мы уже убедились ранее, в этом случае равны: а = 2У/я; Ь = Ъу1[2Р. Отсюда после упрощений получаем: |>-У,)2 = Еу?-^--^. (5.12) Разность первых двух членов правой стороны этого равенства равна сумме квадратов отклонений от средней арифметической, т. е. п 2 (yt — yt)2- Таким образом, t=\ S(y,-y,)2 = S(y,-y,)2—^ff-- (5-13) Выражение (5.13) показывает, что сумма квадратов отклонений от линейного тренда меньше, чем от средней арифметической. Этим выражением можно воспользоваться в тех случаях, когда характеристика колебаний вокруг тренда определяется до того, как определен сам тренд. Сумма квадратов отклонений от линий тренда, т. е. Е(#* — yt)2, и среднее квадратическое отклонение от тренда sy являются основой при определении средней квадратической ошибки отдельных параметров уравнения тренда и их доверительных интервалов, ~а также ошибки и доверительных интервалов тренда и прогноза. 161
Прежде чем приступить к определению доверительного интервала прогноза, необходимо сделать оговорку о некоторой условности рассматриваемого ниже расчета. То, что следует далее, является в некоторой мере произвольным перенесением результатов, найденных для регрессии выборочных показателей, на анализ динамических рядов. Дело в том, что предположение регрессионного анализа о нормальности распределения отклонений вокруг линии регрессии не может, по существу, безоговорочно утверждаться при анализе динамических рядов. Дискуссии в статистической литературе еще в 30—40-х годах пролили свет на трудности, связанные с этой проблемой *. В итоге, однако, принципиально новый подход, по существу, не был найден. Все предложения так или иначе связаны с определением доверительного интервала на основе оценки среднего квадратического отклонения членов ряда. Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, чта каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения tjt несут на себе груз неопределенности, связанной с ошибками в значении параметров. В общем виде доверительный интервал для тренда определяется как 4 где Sy — средняя квадратическая- ошибка тренда; yt — расчетное значение у%\ ta — значение ^-статистики Стьюдента. Если t = i-\-L, то уравнение (5.14) определит значение доверительного интервала для тренда, продленного на L единиц времени. Доверительный интервал для прогноза, очевидно, должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда. Обозначим соответствующую среднюю квадратическую ошибку (ошибку прогноза) как sp, тогда доверительный интервал прогноза составит Vi+L+taSp. (5.15) В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернатив- 1 W о t k i n g Н., Н о t е 11 i n g H. Aplication of the Theory of Errors to the Interpretations of Trends. JASA, vol. 24, 1929, p. 73—85, и Schultz H. The Standart Error of a Forecast from a Curve. JASA, vol. 25, 1930, p. 139—185. 162
ных трендов, то очевидно, что пространство между экстраполируемыми трендами и представляет собой некоторую «естественную доверительную область» для прогнозируемой величины. С таким утверждением нельзя согласиться. Прежде всего потому, что каждая из возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них — через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный «доверительный интервал» теряет всякий смысл. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРОГНОЗА ДЛЯ ЛИНЕЙНОГО ТРЕНДА В предыдущей главе мы рассматривали регрессионный анализ. Воспользуемся приведенным там выражением для среднего квадрата отклонений линейной регрессии. Итак, пусть имеется линейная регрессия у = a-f-bx-f-e. Принимая во внимание, что параметры аи'6 являются выборочными оценками, для которых можно найти средние квадратические ошибки, получим (см. 3.18): Напомним, что хр = хь— х, где xL — заданное, а х—среднее значение независимой переменной, S(a:7)2 — сумма квадратов отклонений значений независимой переменной от их средней, sy — средний квадрат отклонений фактических значений у от расчетных. Воспользуемся этой формулой при определении величины sv для случая, когда тренд характеризуется прямой. Поскольку в качестве независимой переменной здесь выступает время (t), то, заменив хЬу х и Бх2 соответственно на tLy ty S(if — f)2 и слегка преобразовав выражение (5.16), получим: s„=Sy,A±I+±-i)L, (s,7) У ъи-D2 где sy — среднее квадратическое отклонение фактических наблюдений от расчетных значений у\ п — число наблюдений (длина ряда динамики); tt, — время, для которого делается экстраполяция, т. е. tb = = п + L; t — значение порядкового номера уровня, стоящего в середине ряда. 163
Соответствующие этой формуле доверительные интервалы для линейного тренда изображены на рис. 5.3. Так как последовательность значений t составит натуральный ряд чисел, то' 7=-^±±. (5.18) Воспользовавшись тем, что величины, характеризующие разности t — Т9 являются членами ряда с равноотстоящими элементами (например, в ряду с нечетным числом членов эти разности равны ..., -3, -2, —1, 0, 1, 2, 3, ...), сумму квадратов этих отклонений получим по формуле Период наблюдения Рис. 5.3. Доверительные интервалы прогноза для линейного тренда tL — t — П + L Е ('-<)*= л(/|3-1) 12 (5.19) Величина tL — t характеризует расстояние от середины ряда динамики до точки на оси времени, для которой делается прогностическая оценка. Следовательно, /г+1 _ п + 21—1 (5.20) Обозначим корень в выражении (5.17) через /(. Учитывая (5.18)- (5.20), можно К записать следующим образом: к— i/"-H ■ 3(n + 2L-l)a А~~ V п ""г л(ла —1) (5.21) Значение К зависит только от п и L, т. е. продолжительности наблюдения и периода упреждения. Поэтому можно составить соответствующие таблицы значений К или /С*, где К* = taK (см. приложения 7 и 8). Теперь введем величину К* в выражение для доверительного интервала, получим: Vt+L ± SyK*. (5.22) При увеличении продолжительности наблюдения (п) значения ■К и К* уменьшаются, наоборот, с ростом величины L они растут. Это, собственно, и следует ожидать. На рис. 5.4 приведены диаграммы, характеризующие зависимость величины К от п при условии, что L= 1, L=7, L= 10. Зависимость К от L для л = 5, /г == 10 и /г = 20 показана на рис. 5.5. Как видно из приведенных графиков, влияние периода упреждения неодинаково для различных значений п: чем больше длительность наблюдения (п), тем меньшее влияние оказывает пе- 164
риод упреждения (L). Характер влияния, естественно, не изменится и в том случае, когда L определяется как относительная величина от п. Для иллюстрации возьмем два варианта соотношений. Пусть L = 0,1 я и L = п. Тогда соответствующие значения К будут равны (см. табл. 5.2). Таблица 5.2 ЗНАЧЕНИЯ К ДЛЯ £=0,1 п И L=n п 5 10 20 /.=0,1/1 1,47 1.21 1.13 L=n 3,05 1.91 1,27 L'T Следует отметить, что п влияет на величину доверительного интервала не только через К Дело.в том, что значение статистики ta при фиксированном значении вероятности определяется, как известно, числом степеней свободы. Последнее же зависит от п. Исследуя проблему соотношения продолжительности наблюдений и периода упреждений, Г. Де- вис, введя' некоторые дополнительные допущения, нашел следующую зависимость 1: ю 15 Рис. 5.4. Зависимость К членов ряда п 20 от числа При рассмотрении этого выражения предполагается, что величина L не может быть равна или больше п. 1 2 3 J_ в 9 j£ // 12 /3 /4 Рис. 5.5. Зависимость К от продолжительности периода упреждения 1 Devis H. The analysis of economic time series. N. Y., 1941. Формула Деви- ca записана здесь в символах, принятых в данной книге; *'=*— 7. 165
Для иллюстрации расчета доверительных интервалов обратимся к примеру с добычей угля (см. табл. 1.1). При решении вопроса о выборе формы кривой для данного ряда были признаны наилучшими модифицированная экспонента, а в первом приближении — прямая. Поскольку линейный тренд (#* = 225,4 — 4,41/) содержит отрицательный показатель прироста, то экстраполяция при большом периоде упреждения дает отрицательные (!) показатели добычи. Сомнительно, что здесь мы имеем тот случай, когда основное допущение экстраполяции (неизменность условий формирования уровней ряда) следует принять безоговорочно для длительного периода упреждения. Однако для небольшого упреждения это предположение допустимо, по-видимому, без особой натяжки. Чтобы' была возможность сравнить оценки с фактическими данными, сократим период наблюдения, отбросив, допустим, последние четыре наблюдения. Теперь ряд охватывает десятилетие 1957— 1966 гг. Для этого периода прямая, характеризующая тренд, имеет вид у, = 224—4,2/ (/==1 для 1957 г.). Среднее квадратическое отклонение от линии тренда равно в этом случае 6,943. Подставив соответствующие значения /, получим ретроспективные прогнозы для 1967—1970 гг. (см. табл. 5.3, гр. 2). Таблица 5.3 РАСЧЕТ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ДЛЯ ЛИНЕЙНОГО ТРЕНДА t 1 11(1967) 12(1968) 13(1969) 14(1970) Ь 2 177,8 173,6 169,4 165,2 К* 3 2,2524 2,3614 2,4827 2,6142 syK* 4 15,6 16,4 17,3 18,1 w** 5 162,2-193,4 157,2ч-190,0 152,1-^-486,7 147,1-f-183,3 Фактические значения у^ 6 175 167 193 144 Погрешность прогноза 7 -2,8 —6,6 23,6 —21,2 Доверительные интервалы найдем по формуле (5.22). Необходимые для этого значения /С* определим по приложению 7. Значения svK* и yt ± syK* приведены в гр. 4 и 5 таблицы. В последней графе показаны значения погрешности прогноза в виде разности фактических и прогнозируемых показателей добычи угля. Как видно из таблицы (рис. 5.6), прогностические значения лишь немного выходят (для t = 13 и t= 14) за пределы доверительных интервалов. Приведенный пример является лишь иллюстрацией техники экстраполяции по прямой с использованием доверительных интервалов и не претендует на большее. Однако и из него можно извлечь некоторые выводы. Во-первых, даже при небольшой протяженности и умеренной колеблемости ряда вокруг тренда доверительные ин- 166
гервалы оказались весьма широкими (при доверительной вероятности 90%). Уже для упреждения на 4 года (/=14) доверительный интервал составил почти 22% расчетного уровня. В данном примере при увеличении периода упреждения отношение ширины доверительного интервала к расчетному уровню будет ускоренно возрастать, поскольку ряд убывающий и по мере роста t увеличивается числитель отношения и сокращается его знаменатель. Отсюда довольно быстро экстраполяция приведет к неопределенным в статистическом смысле результатам. Можно сократить ширину доверительного интервала, заплатив за это некоторым уменьшением его -надежности — сократив доверительную вероятность 240i 1957 то 1965 то Рис. 5.6. Экстраполяция по прямолинейному тренду получаемых оценок. В самом деле, уменьшение доверительной вероятности приводит к сокращению /-статистики Стьюдента, а последняя влияет на значение доверительного интервала. Учитывая, что экстраполяция — довольно грубая операция, основывающаяся на целом ряде допущений, в практике такого рода расчетов обычно принимают, что доверительная вероятность равна 80—90%. В рассмотренном нами примере уменьшение доверительной вероятности до 80% ' не приведет к появлению новых случаев выхода за границы доверительного интервала. Вообще говоря, нарушение доверительных интервалов здесь относится к случаям резких колебаний, которые не наблюдались в прошлом и, по-видимому, связаны с существенными изменениями условий формирования уровней ряда. МИНИМАЛЬНОЕ ЧИСЛО НАБЛЮДЕНИИ ПРИ ЭКСТРАПОЛЯЦИИ ПО ЛИНЕЙНОМУ ТРЕНДУ Уравнения трендов иногда определяют на основе относительно коротких рядов. Естественно, что в этом случае возникает опасность того, что доверительные интервалы для линии тренда, а сле- 1 Значение К* при вероятности 0,8 приведены в приложении 8. 167
довательно, и для прогностических оценок окажутся, весьма широкими. Это непосредственно вытекает из формулы (5.21) и иллюстрируется кривыми на рис. 5.4. Задавшись некоторыми ограничениями на размер ошибки прогноза или ошибки уравнения тренда, можно, очевидно, найти минимальное число наблюдений, при котором поставленное условие будет соблюдено. Например, уравнение, определяющее средние квадратические ошибки линий тренда (sy), в общем виде можно представить как *; =SyK, где К есть некоторая функция числа наблюдений и периода упреждения. Для линейного тренда, как это легко заключить на основе (5.21), F_ -I/I 3(n + 2£-l)2 А— Г и"1" п(п? — 1) * Величина К. характеризует собой отношение средних квадрати- ческих ошибок: *=£. (5.23) Итак, К представляет собой стандартизированную среднюю квад- ратическую ошибку уравнения, измеренную в единицах среднего квадратического отклонения от тренда. Этим отношением можно воспользоваться в качестве некоторого критерия погрешности и, исходя из его значения определить минимально необходимое число наблюдений при заданном периоде упреждения. Допустим, стандартизированная квадратическая ошибка уравнения не должна превышать 1 при L=l. Тогда откуда п » 6. ^ ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПОЛИНОМОВ НЕВЫСОКИХ СТЕПЕНЕЙ Выше, при определении средней квадратической ошибки прогноза на основе линейного тренда, мы не прибегали к матричной записи, так как в этом просто не было необходимости. Однако при получении средних квадратических ошибок прогнозов, определяемых на основе полиномов более высоких степеней, без матричной алгебры обойтись нельзя. Как и выше, доверительные интервалы прогноза будем определять исходя из предположения о том, что ошибки прогноза связаны только с ошибками в оценках параметров. 168
Итак, при исследовании линейной множественной регрессии было показано, что дисперсия у определяется следующим матричным выражением (см. 3.41): где Х'Х—матрица системы нормальных уравнений. При оценивании параметров трендов матрица системы нормальных уравнений, как показано в (4.2), будет равна Т'Т. Соответственно уравнение для s J полиномиального тренда можно записать в виде %=£jT'L{fT) lTL, (5.24) где, например, для параболы TL = (l tL tL), a tL — время, для которого производится экстраполяция. Рассмотрим теперь три тренда, описываемых соответственно прямой, квадратичной и кубичной параболами. Матрицы нормальных уравнений для этих кривых при условии, что начало отсчета времени 'приходится на середину ряда (т. е. 2 t дующий вид: 0), имеют еле- Т'Тп) = Т'Г{2) = T'TW = п О О 2'2 я О 2'2 0 Si8 О Ц/8 0- 2^ J п О 2U2 О 0 2'3 0 2'4 2'3 0 2^ 0 0 S/4 0 2*°J Суммирование везде производится от t = 1 до t — п. Обратимся теперь к обратной матрице (Т'Т)-1. Обозначим ее через В, В = = (Ьц). Она, как известно, равна: В: >D ■М\ где D — определитель матрицы Т'Т; М' — транспонированная матрица алгебраических дополнений матрицы Т'Т; пусть М=(\1ц). Найдем определитель матрицы Т'Тцу. п 0 0 2U2 Ап = — nY,t- © Е. М. Четыркин \№
Первый элемент матрицы алгебраических дополнений равен 2£2, откуда первый элемент обратной матрицы Ьц = "^h^lT • Находим далее, что [ii2 = jut2i = 0 и [i22 = п. Откуда Ьх2 = Ь2\ = 0 и h п _ 1 ' Определим теперь величину sj для уравнения прямой. Подставив в (5.24) полученное выражение для {Т'Т)~1 и Tl = (1 tL), получим: sl=s2r[UL] п о о 1 [^]^(i+-^r). (5.25) Напомним, что здесь tL и t измеряются от середины периода наблюдения. Таким образом, получили формулу, аналогичную (5.16). Для параболы второй степени определитель и миноры будут равны следующим выражениям: = /г2'22^— (2'2)3; п О Ъ? £>(2) = | 0 2>2 О 2'2 О 2'4 ^i = 2^-S^; ^2 = ^^—(2*2)2; 4i = -(2'2)2; остальные \hj = 0. Отсюда: u Pit 2J 2*1 A fX22 J . ^33— £> — Л 2 ^-.(2 /9)2 » ^13— £> 2*2 /iS*1—'(S^)2 ' V /2 Для сокращения дальнейшей записи обозначим nZt4 — (2£2)2 = Л. Подставим в (5.24) соответствующие значения Ьц\ s}=sy[UL%] 2 ^ л О —2*2 О 1 2*2 —S*2 О 0 .-т ^ Г -«J :М~л x-^+^^+v—т~+1г'чк\- no
После ряда преобразований получим: = 5уУ "sF^ + 2*-(2S'8)'i+«'2 -у —-у у 2<2 '" ' л 2* — (2'2)2 " (5.26) Определитель матрицы нормальных уравнений параболы третьей степени равен: О 2'2 О Аз> = п О 2*3 о S*2 о е*4 о 2** о 2** О S^6 + 2'2[2'2(2'4)2 = «.[2<2s^-S<6—(2**)31 + (2^)2S^°]. Несколько преобразуем полученное значение определителя: As) = /*2'42^2*—(2^)4 +(2*И(2*)2—2*2*4 = = [„ s /4 - (2 *2)2] IS <» 2 fi - (2 <*)»]. Определим теперь миноры: 1*п = 2^2^2^—(2*4)3; ^ = «2^2^—(2^)22^; Рм-яг^Е*—я(2<*)8; t*44 = «2*22't-(2*2)3; ^ = Е^(2^)2-(2^)22^; ^ = (2^)22^-«(2^)2. Остальные jx^i равны нулю. Элементы обратной матрицы теперь можно определить следующим образом: 2*6 ^i-л2** — (2'2)2' *зз — я 2 **. *(2*2)2 *« = -2* «""Л2** —(2*»)а *22 — 2^2^ — (2'4>2* *24 = 2^22^ —(S^4)2* Поставив найденные нами значения в выражении (5.24) и произведя ряд преобразований, находим: _ т/2<*-(22*2)*! + ^ (2*-22ft)<i + (2P)*f P 5у —5у V ns<*-(2*2)2 + 2*22'6-(2*4)2 • (°-2/> Для расчета доверительных интервалов прогнозов, определяемых параболическим трендом, в подкоренные выражения уравнений (5.26) и (5.27) необходимо ввести в качестве слагаемого по единице. Поскольку в этих выражениях содержатся величины, зависящие только от числа наблюдений (п) и продолжительности периода упреждения, то можно подсчитать эти величины и свести их в таблицы (см. приложение 9)4. 1 Напомним, что необходимые для расчета доверительных интервалов значения riZt*— (2tf2)2 и 2t22t6— (S^4)2-приведены в приложении 6. В приложений 9 приводятся значения К* для квадратичной параболы. 6* 171
Запишем теперь вместе все три уравнения доверительных интервалов прогноза (последнее несколько преобразуем): SyK* = t*yYl + ± + 2* = 45, *у^+^«+2* 2*2 ■(22^)^ + ^ , (S^e-2S^)<i + (2<l)^i «2^- (2'2)2 2*22*6-(2*4)2 Простое сопоставление подкоренных выражений приведенных формул говорит о том, что при одной и той же величине sy доверительный интервал прогноза тем шире, чем выше степень полинома, характеризующего тренд. Это и понятно, поскольку дисперсия уравнения тренда определяется как взвешенная сумма дисперсий соответствующих параметров уравнений. Для иллюстрации сопоставим средние квадратические ошибки уравнений трендов, полученных для одного и того же ряда, на одной диаграмме (рис. 5.7). Напомним, что среднеквадрати- ческая ошибка уравнения не является единственным фактором, определяющим ширину доверительного интервала, однако она оказывает преобладающее влияние на эту величину. Для удобства сопоставления отклонения отложены от прямой линии, а не от соответствующих кривых. Как видно из рисунка, если в пределах наблюдения (до точки М) средние квадратические ошибки уравнения в общем незначительно различаются между собой, то для периода, относящегося к экстраполяции, различие становится существенным. Особенно быстро увеличивается эта величина у кубической параболы. Если тренд лучше описывается кривой более высокого порядка, та соответственно квадратическая ошибка Sy будет ниже и, следовательно, доверительный интервал уже, чем, скажем, при линейном тренде. Исходя из тех же соображений, которые были высказаны при определении минимального числа наблюдений для линейного тренда, найдем необходимое число наблюде_ний для параболического и кубического трендов при условии, что К не должно превышать 1; Ь5; 2 и при 1=1 (см. табл. 5.4). Рис. 5.7. Средние квадратические ошибки уравнений: а — прямой, б — параболы второй степени и в — кубической параболы. 172
Таблица 5.4 МИНИМАЛЬНОЕ ЧИСЛО НАБЛЮДЕНИЯ ДЛЯ ЛИНЕЙНОГО, ПАРАБОЛИЧЕСКОГО И КУБИЧЕСКОГО ТРЕНДОВ ПРИ 1-1 Степень полинома 1 2 3 Минимальное число наблюдений (п) F=l б 13 23 /С=1,5 7 13 К=2 5 10 ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ТРЕНДОВ, ПРИВОДИМЫХ К ЛИНЕЙНОМУ ВИДУ Выше уже было показано, что уравнения экспоненты и логарифмической параболы с помощью логарифмирования легко приводятся соответственно к линейному и параболическому виду. На этом, собственно, и основан метод оценивания параметров данного вида кривых. Итак, экспоненциальная кривая и логарифмическая парабола после логарифмирования записываются как: logyt=loga + tlogb; 1°ёУ* — l°Sa + tlogb + f logc. Для приведенных выражений можно найти средние квадратиче- ские ошибки оценок параметров и значений у%. Отсюда можно определить и среднюю квадратическую погрешность прогноза. При этом для упрощения расчетов можно воспользоваться показателями /(*, подсчитанными для прямой и параболы второго порядка (приложения 7—9). Воспользуемся в чисто иллюстративных целях данными примера, в котором мы оценили параметры экспоненты (см. с. 122). Определим теперь доверительные интервалы для нее. Напомним, что экспонента имела следующий вид: у, = 70,61-1,072'. Для определения доверительного интервала нам прежде всего необходимо рассчитать среднее квадратическое отклонение. Поскольку уравнение содержит два оцениваемых параметра, то число степеней свободы при расчете квадратического отклонения составит 10 — 2 = 8; необходимые для расчета квадратического отклонения показатели разности между фактическими и расчетными значениями логарифмов уровней представлены в табл. 5.5. Заметим, что для заполнения графы «log до нет необходимости находить yt и затем их логарифмировать. Проще к логарифму параметра а последовательно добавлять логарифм параметра 6. В нашем примере log а = 1,8489, logft = 0,0302. 173
Таблица 5.5 РАСЧЕТ ОТКЛОНЕНИИ ОТ ЭКСПОНЕНЦИАЛЬНОГО ТРЕНДА t \ 1 2 3 4 5 б 7 8 9 10 У* 78,6 81,1 87,3 91,7 96,4 104,8 113,0 * 123,6 ! 134,2 144,4 log yt 1,8954 1,9090' 1,9410 1,9623 1,9840 2,0204 2,0531 ; 2,0920 2,1277 2,1586 logy, 1,8791 1,9093 . 1,9395 1,9697 1,9999 2,0301 2,0603 2,0905 ! 2,1207 2.1509 log yt~\og yt 0,0163 —0,0003 0,0015 0,0074 —0,0159 —0,0097 —0,0072 —0,0015 0,0070 0,0077 Сумма квадратов отклонений (в логарифмах) равна в данном примере 0,0008321. Откуда -V* 0008321 S 0,01017. "у У 8 Доверительный интервал определяется следующим выражением: ant log {log уi+L ± SyK*). Например, для периода упреждения, равного, допустим, 4, коэффициент К* * при доверительной вероятности 0,9 составит 2,6142. В свою очередь log Як = log70,61 + 14 log 1,072 = 2,2717. Откуда доверительный интервал будет равен: an* log (2,2717 ± 0,01017-2,6142) = ant log (2,2451 -*- 2,2983) = = 175,8-^198,7. Если же доверительная вероятность принята на уровне, скажем, 70%, то, следовательно, отношение табличных значений ta равно: Чз 1,108 *ол 1,860 = 0,5957 и доверительный интервал составит: ant log (2,2717 ± 0,01017 • 2,6142 ■ 0,5957) = = ant log (2,2559 -ь 2,2875) = 180,3 -г-194,1. Примерно такой же подход к определению доверительных интервалов прогноза возможен при экстраполяции модифицированной экспоненты и S-образных кривых, если значение асимптоты 174
задано. В таких случаях, как -было показано в гл. 4, названные кривые л'егко приводятся к линейному виду (см. 4.111, 4.112,4.113) и при оценивании их параметров применим МНК. Рассмотрим метод определения доверительного интервала про- гноза для модифицированной экспоненты. Пусть данная кривая имеет отрицательный параметр а (см. рис. 2.4), т. е. yi = k—аЫ. Приведение к линейному виду этого выражения дает zi = log(k—yt) = loga + tlogb. (5.28) Предполагая, что асимптота задана, т. е. k = k*, и не содержит ошибки (условие, разумеется, весьма жесткое), получим следующее выражение для доверительного интервала величины zi+l: Zt+L + sJt*: (5.29) где sz — среднее квадратическое отклонение от тренда (5.28). Располагая значениями границ доверительного интервала для Zi+L, легко определить доверительные интервалы прогноза для #*+£,. Последние равны £* — antlog [zi+L ± s2K*). (5.30) Для ряда данных, содержащего 14 членов (см. с. 58), получена следующая модифицированная экспонента при условии, что асимптота ее принята равной 40: у, = 40—48,29- 0,875' (5.31) или в соответствии с (5.28-) 2,в 1,6839—0,05788*. (5.32) Прогноз значения zi+L и уг+z,, скажем, на 9 лет вперед составит соответственно 0,3526 и 37,75. Квадратическую ошибку sz оценим, использовав 2 (z* — zt)2, где z* = log(40 — yt). Пусть sz равно 0,0674, тогда доверительные интервалы для Zi+L имеют следующие значения (при условии, что доверительная вероятность равна 0,8, следовательно, коэффициент К*=1,978): 0,3526 ± 0,0674-1,978 = 0,2193 -г- 0,4859. Откуда доверительные интервалы для прогноза исходной переменкой будут равны: 40—ant log (0,^93 -з- 0,4859) = 36,94 -г-' 38,34. Как видно из приведенного примера, доверительный интервал несимметричен относительно величины, определяемой по уравнению тренда. 175
§ 3. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ АДДИТИВНЫХ И МУЛЬТИПЛИКАТИВНЫХ МОДЕЛЕЙ В ряде случаев исследуемая характеристика может быть представлена в виде суммы (аддитивная модель) или произведения (мультипликативная модель) соответствующих компонент. Примером аддитивной модели является суммарное потребление населения страны, региона. Здесь в качестве составляющих выступают показатели потребления отдельных слоев населения, потребления по отдельным товарным группам, районам и т. д. В отличие от аддитивной мультипликативная модель состоит из разнохарактерных элементов, которые в отношении их влияния на исследуемое результативное явление обычно разделяют на экстенсивные и интенсивные. В качестве примера такой модели укажем на показатель объема производства, представленный как произведение числен- .ности рабочих (экстенсивный фактор) на среднюю производительность труда (интенсивный фактор). Если компоненты аддитивной и мультипликативной модели в своем развитии обнаруживают явные тенденции и экстраполяция каждого из «частных» трендов является обоснованной, то прогноз результирующего признака достигается объединением (в виде суммы или произведения) прогнозов отдельных компонент. Следует ожидать, что такой путь в общем должен повышать надежность прогноза в связи с тем, что он, во-первых, основывается на большем объеме информации, чем используется при определении и экстраполяции тренда одного результативного признака. Во-вторых, расчленив ряд на составляющие, исследователь имеет возможность подобрать соответствующие тренды (в общем случае различающиеся по своей форме) для каждого частного ряда. При этом становится более очевидным воздействие каждого отдельного фактора, влияющего на формирование суммарного уровня,— этим в некоторой мере уменьшается механистичность экстраполяции — и более обоснованной может оказаться корректировка трендов. Рассмотрим кратко проблему определения доверительных интервалов для аддитивного и мультипликативного прогнозов. Если модель аддитивна, то определение общего доверительного интервала не связано с затруднениями. Воспользуемся хорошо известной в математической статистике теоремой, согласно которой дисперсия суммы независимых величин равна сумме дисперсий слагаемых. Тогда, при условии, что входящие в аддитивную модель переменные независимы друг от друга, имРеем* л " $р = 2j Spji (5.33) где s2p — дисперсия суммарного прогноза, $2Pj — дисперсия прогноза /-Й составляющей, N — число суммируемых прогнозов. Дове- 176
рительный интервал для суммарной величины теперь можно записать как Jjyt+L±spb (5.34) Если прогностическая модель мультипликативна, то. нахождение доверительного интервала для результативного признака требует специального анализа (выходящего по своей сложности за рамки настоящей работы). Приближенно дисперсия величины Yi+u обозначим ее как s2p, оценивается при условии, что дисперсии отдельных компонент ее (slj) малы по сравнению с Уг+ь^, с помощью следующего выражения: N л л. 4=У,-^-'УЪ, (5.35) Для случая, когда рассматриваются две компоненты — экстенсивная и интенсивная, выражение (5.35) легко приводится к виду Sp = sliyi+Lt2 + Sp2-y2i+L, Ь (5.36) Допустим, что прогнозируются раздельно интенсивная и экстенсивная компоненты, пусть уц.ь%\ = 30, г/нь,2 = 43, кроме того, из- вестно, что 5Р1 ~ 2, sp2 = 3. Тогда Yi+L = 30-43 = 1290 и sp= = У 22 • 432 + З2 ■ 302 £ё125. Следовательно, доверительный интервал для произведения интенсивной и экстенсивной компонент составит примерно 1290±125. Заканчивая параграф, еще раз подчеркнем, что расчеты доверительных интервалов, особенно для трендов и прогностических оценок, получаемых экстраполяцией трендов, не должны создавать иллюзию большой точности и надежности результатов. Они точны и надежны только в рамках тех предположений, которые были приняты при их определении. § 4. КРИТЕРИИ ТОЧНОСТИ И НАДЕЖНОСТИ ПРОГНОЗОВ Точность и надежность прогнозов — широко распространенные в прогностической литературе термины, смысл которых, как это представляется на первый взгляд, вполне очевиден. Однако содержание этих терминов часто толкуется достаточно субъективно. Нередки случаи, когда одно понятие подменяется другим. Во всяком случае мы здесь имеем дело скорее с интуитивным пониманием, чем с более или менее строгим определением данных категорий. 177
О точности прогноза принято судить по величине погрешности (ошибки) прогноза — разности между прогнозируемым и фактичег ским значением (реализацией) исследуемой переменной. Однако такой подход к оценке точности возможен только в двух случаях. Во-первых, когда период упреждения уже окончился и исследователь имеет фактические значения переменной. При краткосрочном прогнозировании это вполне реально. Во-вторых, когда прогноз разрабатывается ретроспективно, т. е. прогнозирование осуществляется для некоторого момента времени в прошлом, для которого уже имеются фактические данные. Так поступают в тех случаях, когда проверяется разработанная методика прогноза. При этом имеющаяся информация делится на две части. Одна из них, охватывающая более ранние данные, служит для оценивания параметров прогностической модели, а более поздние данные рассматриваются как реализации соответствующих прогностических оценок. Полученные ретроспективно ошибки прогноза в какой-то мере характеризуют точность примененной методики прогнозирования и могут оказаться полезными при сопоставлении нескольких методов. В то же время, величину ошибки ретроспективного прогноза нельзя рассматривать как окончательное доказательство пригодности или, наоборот, непригодности применяемого метода прогнозирования. К ней следует относиться с известной осторожностью и при ее применении в качестве меры точности необходимо учитывать, что она получена при использовании лишь части имеющихся данных. Однако эта мера точности обладает большей наглядностью и уж во всяком случае более надежна, чем погрешность прогноза, исчисленная для периода, характеристики которого уже были использованы при оценивании параметров модели. В последнем случае погрешности, как правило, будут незначительны и мало зависимы от теоретической обоснованности примененной для прогнозирования модели. Точность же прогнозов будет преувеличенной и в известном смысле иллюзорной. В связи с проверкой точности прогнозов необходимо сделать еще одно замечание. Так, если для ретроспективного прогнозирования применяется модель, содержащая одну или несколько экзогенных переменных, то точность прогноза будет в значительной мере зависеть от того, насколько точно определены значения этих переменных на период упреждения. При этом возможны два пути: воспользоваться фактическими значениями экзогенных переменных (так называемый прогноз ex post) и ожидаемыми их значениями (так называемый прогноз ex ante). Естественно, что точность прогноза ex post будет выше, чем прогноза ex ante, так как в первом случае будет исключено искажающее влияние погрешности в значении экзогенных переменных. О степени погрешности прогноза можно судить по относительной ошибке — отношению абсолютной погрешности прогноза к ожидаемому (или фактическому) значению признака. Проверка точности единичного прогноза, как правило, мало что может сказать исследователю. В самом деле, на формирование 178
исследуемого явления влияет множество разнообразных факторов, поэтому полное совпадение или значительное. расхождение прогноза и его реализации может быть следствием просто особо благоприятных (или неблагоприятных) стечений обстоятельств. Единичный хороший прогноз может быть получен и по плохой модели, и наоборот. Отсюда, следует, Фго о качестве прогнозов применяемых методик и моделей можно судить лишь по совокупности сопоставлений прогнозов и их реализаций. Наиболее простой мерой качества прогнозов при условии, что имеются данные об их реализации, может стать относительное, число случаев, когда фактическая реализация охватывалась интервальным прогнозом, к общему числу прогнозов, т. е. где р — число прогнозов, подтвержденных фактическими данными: q — число прогнозов, не подтвержденных фактическими данными. Когда все .прогнозы подтверждаются, q—О и ч=1, если же все прогнозы не подтвердились, то р9 а следовательно, и ц равны нулю. Как было показано в гл. 3 и 5, ширина доверительного интервала в значительной мере зависит от принятой доверительной вероятности. Чем меньше эта вероятность, тем уже интервал. Таким образом, сопоставление коэффициентов г) для разных инструментов прогноза и моделей может иметь смысл только при условии, что доверительные вероятности приняты одинаковыми. Если прогнозы получены в виде точечных оценок, то при проверке качества прогнозирования можно использовать целый ряд статистических характеристик, например среднюю абсолютную и среднеквадратическую ошибку прогноза. Указанные две характеристики качества имеют ту же размерность, что и сами показатели прогноза. Легко заметить, что значения обеих, характеристик существенно зависят от масштаба измерения уровней исследуемых явлений. Применение такой меры качества прогноза, как коэффициент корреляции между прогнозами и их реализациями, вообще говоря, возможно, однако следует помнить, что коэффициент парной корреляции указывает на степень близости к линейному соотношению коррелируемых величин. Так, если коэффициент корреляции прогнозов и реализации равен единице, то это вовсе не означает, что соответствующие показатели полностью совпали — просто они могут находиться в строгом линейном соотношении. Одним из исследователей проблем экономического прогнозирования, Г. Тейлом, предложен в качестве меры качества прогнозов коэффициент расхождения (или коэффициент несоответствия), числителем которого является среднеквадратическая ошибка прогноза, 179
а знаменатель равен квадратному корню из среднего квадрата реализации. Итак, 7,_V2,{Pt-At?:n_V2{Pt-At)* . о v~ V&jQ... ~ уъщ ' ' (5,38) где Pt и At — соответственно предсказанное и фактическое (реализованное) изменения переменной. Коэффициент v = О, когда все Pt = At (случай совершенного прогнозирования); 0 = 1, когда процесс прогнозирования приводит к той же среднеквадратической ошибке, что и «наивная» экстраполяция неизменности приростов; наконец, v > 1, когда прогноз дает худшие результаты, чем предположение о неизменности исследуемого явления. Верхней границы коэффициент не имеет. По данным табл.*5.3, в которой приведены прогнозы для четырех последовательных лет, получим о « 1, что и следовало ожи- . дать, поскольку прогноз по линейному тренду и предполагает равномерное изменение. Коэффициент расхождения может быть использован при сопоставлении качества прогнозов, получаемых на основе различных методов и моделей. В этом его несомненное достоинство. К тому же он имеет весьма прозрачный смысл 1. Величина v поддается разложению на составляющие (частные коэффициенты расхождения), характеризующие влияние ряда факторов2. Измерители качества прогнозов (их точности) рассматривались выше при условии, что исследователь располагает информацией об истинных значениях величин, которые он оценивал в ходе разработки прогнозов. Такие меры качества, несомненно, представляют ценность при изучении различных методик прогнозирования. Однако в практической работе проблему точности прогноза надо решать, как правило, тогда, когда период упреждения еще не прошел и истинное значение прогнозируемой переменной неизвестно. В этом случае проблема точности может рассматриваться в плане сопоставления априорных качеств, свойств, присущих альтернативным прогностическим моделям. Так, если прогнозирование осуществляется статистическими методами, то, вероятно, понятие точности прогноза можно сделать более узким, а именно связав априор- 1 В работе «Экономические прогнозы и принятие решений» Г. Тейл рассматривает более ранний вариант этого коэффициента: v_ V2(Pt-At)*:n Значение v находится .между 0 и 1. 2 Это достигается разложением числителя, представляющего собой средний квадрат ошибки прогноза. Подробнее об этом см.: Тейл Г. Экономические прогнозы и принятие решений (Пер. с англ.). М., «Статистика», 1971, с. 39—40. 180
ную точность прогноза с размером доверительного интервала. Модель, дающая более узкий доверительный интервал при одной и той же доверительной вероятности, и является более точной. (Разумеется, при этом теоретическая обоснованность сравниваемых моделей является примерно равной.) В ряде случаев сопоставление моделей, используемых для прогнозирования, по их априорной точности можно связать со степенью смещенности параметров, получаемых при альтернативных методах их оценивания. В самом деле, чем более смещена оценка параметра, тем менее точной (при всех прочих равных условиях) является экстраполяция, базирующаяся на соответствующей модели. Возьмем, например, экстраполяцию по среднему темпу роста. Средний темп, исчисленный упрощенно, т. е. по средней геометрической, имеет явное смещение. Расчет темпа путем выравнивания ряда по экспоненте с помощью МНК с предварительным логарифмированием дает опять-таки смещенную оценку. Однако смещение здесь заведомо меньше, чем в предыдущем случае, поскольку она связано лишь с тем,' что минимизируется не сумма квадратов отклонений, а сумма квадратов отклонений логарифмов. Очевидно, что надежность прогноза определяется вероятностью наступления прогнозируемого события, т. е. реализации соответствующей прогностической оценки. Чем она выше, тем выше и: надежность. Вероятность реализации может быть оценена субъективно (экспертное прогнозирование) или может быть связана с доверительными интервалами прогноза, если последний основывается на статистической модели. Рассмотренные здесь понятия априорной точности и надежности прогнозов, связанные с доверительными интервалами, являются в значительной мере условными показателями. Они могут использоваться в практической работе лишь при условии, что принятая для получения прогнозов модель имеет серьезное теоретическое обоснование и спецификация модели корректна. В противном случае полученные доверительные интервалы лишь создают иллюзию точности. Практика разработки экономических прогнозов и прогнозов научно-технического прогресса опирается на целую систему методов, среди которых статистические методы прогнозирования занимают важное место. Решающую роль при статистическом подходе к прогнозированию играет выбор соответствующей модели, которая, будучи наполненной числовыми параметрами, становится непосредственным инструментом прогнозирования — так называемым предиктором. Большая часть настоящей работы и посвящена технике получения статистических предикторов. Располагая предиктором, можно получить варианты прогноза, отвечающие определенным условиям и гипотезам, учтенным при его построении. Вместе с тем необходимо помнить, что механическое использование предиктора может стать причиной серьезных погрешностей. Экономическое прогнозирование слишком ответственное дело, для тога чтобы можно было ограничиться одними формальными построе- 181
ниями и расчетами. Цель статистической модели — не заменить суждения и опыт специалиста, а дать ему в руки инструмент,'позволяющий более глубоко проникнуть в существо исследуемых явлений, инструмент, в котором специфическим образом обобщена и приведена в систему разнообразная статистическая информация. Получаемые на основе предикторов прогнозы имеют смысл только в рамках тех условий, гипотез и предположений, которые были учтены при разработке соответствующих статистических моделей и при их применении для прогнозирования. Таким образом, разработка и применение моделей в прогностических целях предполагают углубленный экономический и экономико-статистический анализ.
ПРИЛОЖЕНИЯ 1. НЕЛИНЕЙНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ В гл. 3 было показано, что МНК приводит нас к минимизации суммы квадратов отклонений: Нелинейный метод наименьших квадратов отличается от линейного только- тем, что вместо линейной функции относительно параметров здесь участвует нелинейная функция f. Это обстоятельство резко меняет задачу нахождения оценок НМНК- (В линейной, регрессии параметры находятся из системы нормальных уравнений dQ/dcij = О, / = 1, 2,..., т. Такая система уравнений будет линейной, решить которую не составляет большого труда.) В нелинейной регрессии система нормальных уравнений dQjddj будет уже нелинейной, поэтому решить ее так же просто, как в случае линейной, уже нельзя. Проще найти оценки параметров., непосредственно минимизируя сумму квадратов отклонений (1). Итак, нелинейный метод наименьших квадратов привел нас к минимизации функции многих переменных аь аг, ..., ат. Методы минимизации функции многих переменных Задача минимизации функции — одна из наиболее старых и интересных проблем вычислительной математики. Однако именно в последние два десятилетия эта задача стала привлекать к себе внимание специалистов. Как выяснилось^ к этой проблеме сводится большое число прикладных задач, в том числе и задача нелинейного оценивания. Проблема минимизации функции многих переменных формулируется очень просто. Дана функция F от переменных Х\,..., хт- Надо найти такие числа яь х2, ..., хт, которые обращают функцию F в минимум. Другими словами, если F = F(x) = F(x\, ..., хт) (здесь через ямы обозначили вектор (хи ..., xm)t то »»«'(*>-'&.*, ....Я.)-*(*)• Большинство методов минимизации функции многих переменных построена на итерациях. Суть итераций заключается в следующем. Предположим, из физических, экономических или других соображений мы определили, что некоторое значение вектора х может служить первым приближением минимизирующего вектора х. Обозначим его через х° и назовем начальным приближением. Предположим, что вблизи этого вектора мы можем найти другой вектор х\ при котором функция принимает значение меньшее, чем при векторе х°, т. е. F(xl)<F(x°). Перейдем в точку х1 и снова вблизи этого вектора'построим x2:F(x2) < Fix1) < 183
<jF(*°). Двигаясь таким способом, мы вправе ожидать, что **->»#, причем F(x°) > F(x*) > >F(x) = minF(x), где /С — номер шага. Такой переход от одного приближения минимизирующего вектора хк к другому хк+* при F(xK+i)<F(xK) и хк-+х будем называть итерационным релаксационным (от слова relax — уменьшать) процессом. Итак, если мы найдем такое правило, согласно которому, для каждого вектора хк вблизи него можно строить другой вектор хк+\ для которого значение функции F уменьшается, то задача минимизации будет решена. Для нахождения такого правила вспомним главу математического анализа, посвященую функциям многих переменных. Одна из теорем этого раздела гласит: в направлении градиента функция имеет максимальную скорость роста. Сформулируем эту теорему применительно к нашему случаю: в направлении антиградиента, т. е. в направлении противоположном градиенту, функция имеет максимальную -скорость снижения. Отсюда следует, что уж если двигаться из точки х° так, -чтобы уменьшить функцию Ft то надо двигаться в направлении антиградиента, который обозначим qo. Для того чтобы точно знать местонахождение х1, необходимо еще знать и расстояние от х° до х1 по этому направлению, т. е. длину шага в направлении от х° к х1. Обозначим длину шага Ло. Итак, окончательно Х1 = хР + Ао?о. Получив х19 можно аналогичным способом построить х2 -» Xх + %\qu где %\ — длина шага во второй итерации, q\ — антиградиент в точке Х\. Таким образом, .для всех итераций К = 0, 1, 2, ... хК+г = хк + \кдк. (2) По построению алгоритма F(x°)>F(xl)> ... >F(xK) > . .. Методы минимизации функций, в которых итерации строятся по правилу (2), называются градиентными, хотя правильнее было бы называть их антиградиентными. И хотя с теоретической точки зрения такой метод оправдан, на практике им пользуются в редких случаях. Одной сходимости метода минимизаций к минимизирующему вектору мало. Необходимо также, чтобы предлагаемый метод сходился быстро. В большинстве практических задач градиентные методы этим условием не обладают. Как правило, первые две-три итерации по этому методу дают резкое снижение функции, однако последующие итерации не приводят к заметному уменьшению значения функции. Одна из основных причин такого поведения градиентных методов заключается в том, что они очень чувствительны к форме функции. Замечено, что если уровни функции 1 вытянуты в одном направлении и сжаты в другом, то градиентный метод сходится очень медленно, т. е. практически не сходится. К сожалению, многие минимизируемые функции имеют именно такую форму. К задаче минимизации функции можно подойти с другой точки зрения. Рассмотрим сначала более легкую задачу — минимизацию параболоида. В частном случае параболоид превращается в параболу ах2 + Ьх + с. Известно, что если а > 0, то парабола имеет единственный минимум. Аналогично дело обстоит с обобщением параболы — параболоидом. Обозначим х = (хи х%..., xm)r—вектор-столбец независимых переменных порядка m, b = (&i, ..., bm)' — вектор постоянных коэффициентов,- А — положительно-определенная матрица2 порядка *п X w, с — постоянное число. Параболоидом называется геометрическое тело, которое описывается уравнением Р^х'Ах + х'Ь + с. (3) 1 Уровнем функции называется множество независимых переменных, на котором функция принимает одинаковые значения. 2 Понятие положительной определенной матрицы и описание работы с ними приведены в книге: Сирл С., Госман У. Матричная алгебра в экономике (Пер. с англ.). М., «Статистика», 1974. 184
Продифференцируем это выражение по я и приравняем его нулю1. Получим дР откуда 1с=~\а-Ч, (4) Легко проверить, что это значение независимых переменных обращает значение параболоида в минимум. Заметим, что для вычисления минимизирующего вектора достаточно однократного нахождения обратной матрицы или же решения системы линейных уравнений относительно х. Вернемся к проблеме минимизации общего вида функции. Пусть х° — начальное приближение. Наша задача заключается в том, чтобы вблизи этого вектора найти вектор х1, для которого Fix1) <F(x°). В том случае, если бы F была параболоидом, мы бы сделали очень просто, применив формулу (4). Но мы можем приближенно заменить нашу функцию на параболоид, применив разложение ее в ряд Тейлора. Итак, разложим функцию F в ряд Тейлора до членов второго порядка включительно в точке х°. Получим: F(x)*F(jfl)+q'(j<fi)(x-xP) + Y{x — &yH(jfi){x--xfi), (5) где q(x°) —градиент функции F в точке.*0, вектор порядка т; Н(х°) —матрица вторых производных функции F в точке х° порядка тУ,т, гессиан функции. Как видим, правая часть выражения (5) является уравнением параболоида, минимум которого мы умеем находить: х — хо = — у (2Я-1 (*о) q (*>)) - —//-* (*о) q (*о). Принимая во внимание эту формулу, положим следующее значение х равным xi = *о - #-1 (*о) q (хо). (6) Получив значение я1, можно таким же способом найти х2 и т. д. Такой метод минимизации функций называется методом Ньютона. Этот метод обладает как достоинствами, так и недостатками. Отметим, что достоинством этого метода является большая скорость сходимости, чем у градиентного. Это объясняется тем, что даже в том случае, когда уровни-функции имеют желобовидную форму, этот метод довольно быстро приводит к решению. Недостатки метода следующие: во-первых, для минимизации по этому методу необходимо вычисление вторых производных минимизируемой функции. А это не всегда бывает возможно, а если и возможно, то нахождение их численного значения требует больших затрат времени. Во-вторых, при разложении функции в ряд Тейлора мы воспользовались формулой (5), в которой стоит знак приближенного равенства. Поэтому алгоритм Ньютона зависит от того, насколько совпадает в выражении (5) левая часть с правой, т. е. от того, насколько хорошо параболоид аппроксимирует минимизируемую функцию в исследуемой точке х°. Если аппроксимация плохая, то метод Ньютона может привести даже к увеличению значения функции, а не к ее уменьшению. Как правило, хорошая аппроксимация параболоида наблюдается вблизи минимизирующего вектора, и, наоборот, плохая для точек, которые расположены на достаточно большом расстоянии от искомого решения. Поэтому в тех случаях, когда начальное приближение выбрано неудачно (т. е. находится на значи- 1 Это необходимое условие минимизации функции. 185
тельном расстоянии от минимизирующего вектора х) метод Ньютона может и не привести к дальнейшему уменьшению функции, а может и вовсе не сойтись. Наоборот, если начальное приближение выбрано хорошо, то обычно метод Ньютона быстро приводит к решению. Последний недостаток можно иногда обойти следующим образом: выбранную поправку в методе Ньютона, как и в градиентном методе, будем рассматривать только как направление, по которому необходимо переходить от вектора хк к следующему вектору хк+*. Итак, пусть H~lq будет направлением движения, значит, следующее значение вектора будет равно: хк+г = хк + \к Я "I (хк) q (хк), (7 ) где К — номер итерации, а Ах>0 — шаг в выбранном направлении. Выбор К к для каждого К производится эмпирическим путем. Метод (7) будем называть модифицированным методом Ньютона; з том случае, когда Яя = 1, этот метод совпадает с обычным методом Ньютона. Указанный метод обладает одним существленным недостатком: матрица вторых производных обязательно должна быть положительно определена (это условие нам было необходимо при минимизации параболоида Р). Если Н не положительно определена, то вероятнее всего ожидать, что произойдет увеличение значения функции. Функции, для которых матрица вторых производных всегда положительна, называются выпуклыми вниз (или просто выпуклыми). Для этих функций, очевидно, последний недостаток метода Ньютона не имеет места. Класс выпуклых вниз функций — очень важный класс минимизируемых функций. Для таких функций доказана сходимость многих алгоритмов минимизации, в частности градиентого метода и метода Ньютона. Важным свойством выпуклой функции является то, что градиент этой функции может быть равен нулю только в единственной точке. В этой же точке достигается минимум этой функции. Для градиентных методов это свойство является решающим, так как эти методы могут «остановиться» в точке с градиентом, равным- нулю (в этом случае поправка будет равна нулю), и не найти минимума функции. Другим важным свойством выпуклой функции является тот факт, что такая функция не имеет локальных минимумов, вернее, каждый локальный минимум совпадает с глобальным. Это свойство подробнее будет обсуждаться в специальном параграфе. Как следует из вышеприведенных соображений, что также подтверждается и практикой соответствующих вычислений, в большинстве расчетов в конце сходимости %к>\\ при плохом начальном приближении %к далеко от 1. Итак, читатель познакомился с двумя основными способами минимизации функций многих переменных: градиентным и методом Ньютона. Какому же методу отдать предпочтение? Как было установлено, первый метод проще, но зато медленно сходится. Второй метод сходится быстрее, но в тех случаях, когда исходные условия для этого метода не выполняются, он может не.привести к решению. Спрашивается, а нельзя ли построить метод, который вобрал бы в себя • лучшие черты первого и второго методов? Другими словами, нельзя ли построить интерполяцию этих методов? Оказывается, для функции, которую можно представить как сумму квадратов отклонений, это можно сделать. Минимизация суммы квадратов отклонений Метод Ньютона—Гаусса. В данном случае мы будем минимизировать сумму квадратов отклонений Q(a) (1). Найдем сначала матрицу вторых производных этой функции. Продифференцировав выражение (1) сначала по ty, а потом по аР, получим: d^rp = -2Z~^j &p--*Z{yi-f{*XM да,да. • <8> J *»1 J i-Л } Р Пусть элементы первой суммы будут элементами матрицы Ни второй — Н2> тогда если Н — гессиан функции, то Н = Н{ — Н2. Покажем, что при некотором 186
весьма слабом предположении можно считать, что матрица Н\ положительно определена. Пусть производная функции регрессии наблюдения i по параметру / будет элементом матрицы D порядка п X т, т. е. —Щ~ = °и> где i = 1, 2, ..., п\ j = 1, 2, ..., т. Легко проверить, что #i = 2D'£>, где £>'г- матрица, транспонированная к D. Предположим теперь, что вектор-столбцы матрицы D независимы, т. е. между ними нет линейного соотношения. Другими словами, матрица производных D функций регрессии по параметрам имеет полный ранг. В этом случае матрица D'D, а значит, Н\ = 2D'D, будет положительно определена, что и требовалось доказать !. Исследуем теперь на положительную определенность вторую матрицу Яг. Решить вопрос в том же духе здесь уже не представляется возможным. Однако рассмотреть различные варианты имеет смысл. Предположим, нелинейная регрессия «не очень нелинейна», другими словами, вторые производные функции регрессии по параметрам принимают небольшие значения. Предположим, что эти рассуждения имеют смысл вблизи минимизирующего вектора а и исследуемая регрессия «хорошая», yi « f (а; я*), т. е. фактические данные хорошо описываются теоретической кривой /(a; xi). В этом случае элементы матрицы #2 принимают малые значения и мы вправе ожидать, что Hi — Н2 будет положительно-определенной матрицей. Итак, если: а) векторы производных функций регрессии по параметрам линейно-независимы, т. е. матрица D имеет полный ранг; б)~ рассматриваемая регрессия «не очень нелинейна», т. е. вторые производные функции регрессии имеют не очень большие значения; в) регрессия хорошо приближает фактические данные, то матрица вторых производных суммы квадратов отклонений положительно определена. В условиях б) и в) можно считать что H**HV Из этих соображений в формуле (6) метода Ньютона вместо Н мы можем записать матрицу Н\. Найдем градиент функции Q по а. Имеем: >Я,-&-^%»-М«*д)2%&. 7-1.2. .'.„т. В матричных обозначениях это можно переписать следующим образом: ?--22У(у-/(а;*)), где q — градиент функции Q, D — матрица производных, функций регрессий по параметрам порядка «Х^, у — /(а; х) —вектор порядка п. Подставив имеющиеся величины в формулу (6), получим: а1 = ао_ //f1 (—27) (у -/(аР; х)) = «о + (D'D)-i Dr (y—f(aP; x)). (9) Вычислив таким образом о1, можно аналогично найти а2 и т. д. Такой метод минимизации суммы квадратов отклонений Q называется методом Ньютона — Гаусса, Как видим, этот метод является в каком-то смысле интерполяцией градиентного метода и метода Ньютона. Действительно, как и в градиентном методе, здесь вычисляются только первые производные, 1лким образом, время, затрачиваемое на одну итерацию, не намного больше, чем в градиентном методе (как правило, время, необходимое на обращение и перемножение матриц, намного меньше, чем вычисление значения или производных функций). С другой стороны, этот метод близок к методу Ньютона, так как по смыслу является его приближением. Больше того, этот метод не обладает одним существенным недостат- 1 См. уже названную книгу С. Сирла и У. Госмана. 187
ком метода Ньютона, а именно в предположении а) матрица Н\ = 2D'D всегда обратима, в то время как в методе Ньютона этого может и не быть. Метод Ньютона—Гаусса — эффективный метод нахождения параметров "нелинейной, регрессии. Однако в тех случаях, когда предположения а) и в) не выполняются, он может привести к плохим результатам. Это проявится либо в расходимости процесса, либо в сходимости, но очень медленной. Последнее, как правило, возникает при плохо выбранном начальном приближении. В этом случае вполне разумно воспользоваться его модификацией. Метод Хартли 1. При применении метода Ньютона—Гаусса можно было бы воспользоваться не формулой (6) обычного метода Ньютона, а формулой (7) Рис. 1. Определение оптимальной величины шага модифицированного метода Ньютона. В этом случае мы придем к модифицированному методу Ньютона—Гаусса или методу Хартли. Итак, по этому методу следующее значение параметров ак+* рассчитывается на основании предыдущего значения ак по формуле а*+* _ аК + хк(Z>'D)-i £>' (у-/(а*; *)), (10) где Хк —длина шага в выбранном направлении. Исследуем вопрос, как на практике отыскивать оптимальную величину шага, т. е. Я*. К сожалению, пока для этого не разработаны унифицированные методы. Хартли, например, предлагает следующую процедуру. Вдоль выбранного направления в методе Ньютона—Гаусса аппроксимируем сумму квадратов отклонений Q параболой. Для этого подсчитаем значение Q для Як = 1/2 и Яя = = 1 (метод Ньютона—Гаусса). Заметим, что Q(0) нам известной равно Q(aH. Проведем через полученные три точки параболу Р(%) =а%2 + Ь% + с (рис. 1). Найдем ее коэффициенты. Очевидно, P(0)«Q(u)«c, так как парабола проходит через точку Я = 0. Далее Р(1) = Q(l) = а + Ь + Q(0) и Р(1/2) = а . Ь = Q(l/2) = ~+~2~+ Q(0). Отсюда легко найти а и Ь. Имеем: a = 2Q(l)-4Q('l/2)+2Q(0); *-4Q(l/2)-Q(l)-3Q(0); e-Q(O). Как известно, парабола Р(Я) принимает минимальное значение при la ! Hartley Н. О. The modified Gauss-Newton method for the fitting of non-linear regression functions by least squares, Technometrics, vol. 3, m 2^ 1961. 188
Подставляя полученные значения для a, bt с, получим: 1 Q(l)-4Q(l/2)+3Q(0) 1 'i Q(0)-Q(1) . Л*=4 Q(l)-2Q(l/2) + Q(0) ~ 2 + 4 Q(l)-2Q(l/2)+Q(0)- Это значение Хк и возьмем в качестве длины шага по методу Ньютона— Гаусса. Метод Хартли — эффективный метод минимизации суммы квадратов отклонений. В большинстве практических расчетов с увеличением итерации значение Хк приближается к единице. Поэтому близость к единице можно расценивать как сходимость алгоритма. Наоборот, в тех случаях, когда процесс не сходится, значение Хк близко к нулю, значение Хк сильно колеблется от итерации к итерации. Как было ранее доказано в предположении а), матрица Я, будет положительно определена. Учитывая это обстоятельство, можно доказать, что поправка вектора параметров в методе Ньютона—Гаусса и антиградиент имеют острый угол. С другой стороны, легко показать, что вдоль направления, имеющего острый угол с антиградиентом, можно выбрать такую длину шага, что значение функции уменьшится. Отсюда следует, что в методе Хартли можно всегда подобрать такое Хк, что сумма квадратов отклонений Q уменьшится. И это нельзя сделать только тогда, когда не выполняется предположение а), т. е. ранг матрицы D меньше т. Конкретно уменьшить Q нельзя из-за того, что матрица #t становится необратимой, т. е. |#i| = 0 (см. (9) и (10)). В силу того, что все расчеты ведутся с конечной цифровой записью чисел, достаточно бывает, чтобы |#i| » 0. Следующий метод позволяет обойти и эту трудность. Метод Марквардта1. Суть этого метода заключается в том, чтобы вместо матрицы D'D в алгоритме Ньютона—Гаусса рассматривать матрицу D'D + XIt где X — положительное число, которое специальным образом подбирается на каждой интерации (здесь уже X не имеет никакого отношения к длине шага), а / — единичная матрица порядка m\m. Так как X > 0, го матрица D'D + XI становится положительно-определенной, а значит, и обратимой в любом случае, даже е£ли условие а) не выполняется. На практике целесообразно корректировать матрицу D'D не отвлеченным числом X, а для каждого / — 1, 2, ..., m брать Xj, которое можно, например, положить . равным Xj = X*(D D)^, где (D'D)jj— диагональный элемент матрицы D'D. Обозначим через L диагональную матрицу,, диагональные элементы которой совпадают с D'D. Тогда в алгоритме Марквардта значения векторов параметров от итерации к итерации находятся по формуле: а*+1 = ак + (D'D + X^I)-i & (У —/(<**; *)). (11> Этот алгоритм обладает следующим свойством. Очевидно, при Хк=0 алгоритм Марквардта превращается в алгоритм Ньютона—Гаусса; наоборот, если X устремлять к бесконечности, то, как легко показать, направление поправки в алгоритме Марквардта приближается к антиградиенту. С другой стороны, ранее* было отмечено, что градиентный метод хорошо работает на первых итерациях,, а метод Ньтона—Гаусса — в непосредственной близости к искомому значению» вектора параметров, т. е. на последних итерациях процесса минимизации. С этой точки зрения был бы оптимален алгоритм, который на первых интерациях работал бы как градиентный, а на последующих — как алгоритм Ньютона—Гаусса.. Таковыми и является алгоритм Марквардта! Действительно, полагая Хк равным большим значениям для первых итераций К = 1, 2,..., мы приближаем этот алгоритм к градиентному. Наоборот, при стремлении Хк к нулю для последующих значений К алгоритм Марквардта приближается к алгоритму Ньютона—Гаусса. Таким образом, алгоритм Марквардта является в некоторой степени интерполяцией градиентного алгоритма и алгоритма Ньютона—Гаусса. 1 М а г q u а г d t D. W. An algorithm for least squares estimation of non linear parameters, Journal Society of Applied Mathematics, vol. 2, 1963. p. 431— 441. 189»
Значение %к для каждой итерации находится эмпирическим путем. Можно, например, предложить такую стратегию выбора Хк. Пусть Хк-\ и Qx-i — значения X и Q из предыдущей итерации. 1. Положим X = Ак-i/lO. ^ 2. Если Q(X)<Qk-u то полагаем Як = X, находим соответствующий вектор параметров и переходим к следующей итерации. 3. Если Q(X)^Qk-u то полагаем X = Хк-\ и определяем, будет ли QM^Qk-ь если нет, то полагаем Хк — X, находим соответствующий вектор параметров и переходим к следующей итерации. Если это условие выполняется, то полагаем X = 10Хк-\, и так до тех пор, пока для некоторого pQ{}.) < Qk-} и X = lOpXK-i. Полагаем в этом случае Хк = X. На нулевой итерации можно положить Хо = 0,01. Остановимся вкратце на вопросе сравнения эффективностей двух алгоритмов минимизации: алгоритме Хартли и Марквардта. Практика расчетов по этим алгоритмам показывает: алгоритм Марквардта является более «осторожным», чем алгоритм Хартли. Другими словами, алгоритм Марквардта иногда сходится даже для тех нелинейных регрессий, для которых алгоритм Хартли расходится. Зато в среднем, вычисляя по этому алгоритму, необходимо затратить больше времени, чем по алгоритму Хартли. Отсюда можно сделать следующий вывод, касающийся стратегии эксплуатации этих алгоритмов. Для регрессий, на которых проверено, что алгоритм Хартли сходится, нужно применять именно его. Для тех регрессий, для которых неизвестно, сходится алгоритм Хартли или нет, надо применять метод Марквардта. В заключение несколько слов о существовании и единственности оценок НМНК. Во-первых, искомая оценка может вообще не существовать. Рассмотрим, например, следующую нелинейную регрессию: У1 = еа + Н, / = 1, 2, ..., л, (12) здесь а — неизвестный параметр. Пусть наблюдения г/* будут все неположительны, т. е. tji^iQ. Очевидно, в этом случае а будет стремиться к —оо и поэтому оценка НМНК не существует. Разумеется, мы привели нетипичный пример. Однако такая возможность существует, и, прежде чем искать параметры нелинейной регрессии, необходимо убедиться в существовании оценок НМНК, т. е. существовании минимума суммы квадратов отклонений.
00 -4 *4 *4 -J j4j«Jj4 <JjJ o^o^o^J^lnVXo'to^-1 •JOnonOnCnONONOnOnOn o^o^oVoNcn^oo'io'"»-! ONOnonononononononOn Ъ^чоЪо^лЪч'оп^Оэ'ьо'и' о ^рЪо ^^In^ie'to'»-* 'сГчоЪо^Ъч'оп^^Л S3 ^ jtfWbOJOjO^O^OJO^OJO о^чооэ^о^оп^оэТо^ ON ON ON ON ON ON ON ON On ON On On ON On ON On ON ON ON ОП ОП ОП ОП ОП ОП ОП On On ОП Vl ОП ОП ОП ОП ОП 0П ОП ОП ОП ОП ОП ОП On ОП On ОП ОП ОП ОП On On ОП ОП ОП ОП ОП On ОП ОП ОП loLololo^oToioVa^i-i mmmqooooVvo vo^NO^^o'oo^o'po'oo'oo Ъо^^^о^^'оч/оч'оч ^ЪNInInInЪГonЪuлV -4ж^^~4ь>^Ъо'оэ'оэ,Ьэ'оэ CO •-* NO 00 ON 4> tO О 00 «4 On 09 ЬД \5 00 Оч Л. tO ?5 NO *4 On J> tO Q 09 ^ Cn CO i-i О 00 ON On 09 £« © OO ON 4* 00 ь-i VO 00 On 1Л ОЭ I-* Q 35 ON On 00 ff О 00 *J ОП 0Э K9 ОП «J vO О ЬО E On -J NO »-* ОЭ On *4 <Z »-» 0э СЛ GO Q tO On «4 О tOC* 00 009J? NO mXsJOWOnSG^vO CO On >0 £5 Cn О CO »4 i-2 £. 00 tO ON V© ОЭ «4 »-* ОП vO ОЭ soSoon090 00 0N*&09 09 CO 09 ОП ON-*J © ОЭ СЛ n& 00 <I 09-J *^ О <I ОП09 О ч© Зо 00 55 00 VO О >-+ On <I »-» СО »5 Ю ON ►= 00 4*© *J rfM-i ►-* 4© «4 «4 *4 «*1 00 ч© -4>*J*4»4*4~J»4^4*4~J ^ oa^^o'ooVj'jj'J*! <i~on -4 -4 -4 -4 -4 -4 «J -4 *4 -4 *4 «4 «J «J *4 ^4 <I -J -4 >*J izmm ^4j«4^jNajo;jaj3NONuON04 On On ON O^ ON ON ON ON ON On On On On ON ON ON ON On On ON ОЭ 09 CO 09 ЬО ЬО tO ЬО H-» £* Mi-iQOOOvO«vOvQ 00 00 00 OO 00 «4 *4 »4 ■* v© ON & >-» NO On 4b •-» чО On iU m U) А а и> u) si S K) no *4 un N9 О -4 On CO С "«SSWOJM^SSN ?3<|SooSvQSSo^[o OoSoON09N6onfOM OOls9O0O9i-»O9*4-4JO0O0 ©ОЭ-^ОСЛЬЭОООПОПСО iU09Un00OiSN00nC NO NO NO NO NO 4© \0 NO NO NO *ON~On~oVln ~4v VJ^. ел lal^a WNOONtOOO i NO ЧО ЧО NO NO ЧО NO NO 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 «4 *4 *J 44*4*4.4*4.4*4*4*4*4 OnN9»4ttiS23^cS >p^.so9q£;o9.q.s &£|£<§з&:зз©* »-lO»-l090Ni-i04tO^ шз ass ooopoppooo ~4©~ve~oo^~<iVj^-pVon~on ^K9*4t00009C0090009 ODOOOONOOl-'OOCnONNO ©ОЭч©*4-400ОЭ>-1ч©р OOOOOOOOOO §&$£* mQ^voSon n^S «4 fc >- « = >S On N© ЬО ч© 00 ч© С О NO NO NO NO NO NO NO NO NO NO 4©4©VO4©VOV0VO4©4© f^l©^o~Qo'oo'^jWoVpN Inl/T^V^Op^coWtob? 00 ОЭ V© К О СП ;>Д-4 bO 00 ОЭ VO On t-i <K tO 00 4*. © i-» ON i-» ON IO *4 09 О ON K9nOOn090000n£1k90 ЬО ЬО 09 On tO 00 •*) © bO NO On On «4 n© On 09 CO 09 On nONOnOnOOOOOOOOOOOOO '►-i'm'oo^o'no^o^o^oo'^i опнд*4оэч5оП1-*Х5СЗчо NQ**]ONOn>fb.U<fe.09i&fe t0»40b00N00ni->40OlO OOOOOOOOOO ОООООООООЧО On ОП £. 4ь 09 bO bO »-» M Q О VO 00 00 *4 -4 ON On On On УОЙмю^М^БмчО ЬО On rf*, Cn *4 4>-4x *4 н* 00 ^1пёОпЗ^©Опч k.006 0RtU.C5tOMONJ ОП On ОП ОП ОП On ОП ОП £» 4b. 4*. 4*. 4*. 4* 4*. 4*. 4*. 4*. 4*. 4* ОП ON 00 M Д 00 tO ON b-» *4 09Q-4Q09i-»OOQO H* 4ь ч© у© 4ь On © o ч© *4 On -4 tO 4ь О О ОП ON ОЭ К5 ^4 On 09 09 09 b0 tO tO tO K9 tO tO tO tO bO bO bO tO bO bO 1- «■■JONONOn ^feoNtO§ S4b*4 ь __ ^roONtO-JCONOONtO^ •4 -4 «J -4 -J «J -4 -4 «4 ON ON ON ON ON ON ON ON On ON ОП ОП On ОП ОП ОП ОП ОП ОП ОП On 4ь £ь 4ь 4ь 4* rfb 4ь 4ь 4* 4b. 4^ ОЭ 09 09 09 09 ОЭ 09 09 09 09 09 09 tO tO tO tO tO tO tO 0*4040n»U09N900 чс OO-JONOnJ^OOtOO^O NO00r4 0NOn4».09tOMt-i Ov000*40N0N0n4^09t0 О 00 *4 ^ »4-4 ON ON ON ON ON *4 -*J «4 55 00 \0 NO Q О ь-» tO 09 *»• On ON *4 » NO J-* to 09 On ON 00 Q »-» ОЭ On ^4 009NpOntOQ4Q000000 VOM^4]MLnOONNSvO •*! On 4v Ш 09 4^. ОП On NO tO ОП NO ttw NO On tO 00 On 4> tO hong 00 NQ ^4 bOOn 09 00 00 »4 Ю tO 09 ОП ON 4^ »4 ОП >-* Ю Q 4^ »& tO tO NQ ,& N3 \Q 00 Оч <g Q\ Q \Q On 4^ чр МОПУООчОчО\00ОпчО«4 OOOONOnOnOnONOnO OnOnpNOOi-tOnOONOSb^ N9N9CoCO^^gOQ4^>4 ЧО 4© 00 00 O0 00 00 00 00 00 •*! «4 «4 *4 «4 «4 «4 >4 Оч Оч On ON Оч Оч ON On On On On On On en On ОП On On On 4* 4* 4* 4* 4ь. *ъ 4ь 4* 4ь 4* ОЭ 09 09 «4 ON 4^ 09 ЬО М О ЧО 00 «4 ON ОП 4ь 09 Ю н-i О nO 00 *4 •3 Ъ 00 ■*! Оч On on 4> 09 ОЭ to to ь* >-* ■-* о И &»-»»-» {л5Л5Р°пОм?<м ON КЭ NO ON jt». 09 КЭ tO 09 ОП О ON tO ON чо k-j <т ЬО fy 00 NO In >i rf>. go О In NO Хд Ja. 4§КлЬойЙЙс 40^00cSo30nOb0094f atsssBBBBss b0O00*4On09tOQ00**] otooa bobotototototobototo ^со^оо^о^Ъ^^Хс^ ИЛч10«0\ОР^И ЬП NO ОЭ -4 tO ON M ON »-» ON 4>^нДмДКЭОПООПЬОМ 0)-i090NUiXjrf».tOS909 OOCot0094goog4QOno Оч 09 On чЬ 4*. 0Д jt 00 Co g »~»§b0«4O9vOOnh-i*509 4k.00bO-44>bO)-4--ibOOn чО>-*ОПчО00ОПОП*4чД>-* 00O0OD00O0^J«4»4*4»4 "vO^N^ljo^lS^^lS^ opooooonSboSbOon^ 040*44^0909000000 •^^•JOnOnOnOnOnOnON t°S4°lS^,ONLnfeWe tO0N09O0D>*I040040bO 0<ООИоДуОО*]0\ ONononononononononon oo5on4>.St-io^oooo ONOONOOpOOOOONOl-A bObObON9bOK9bOt>9bpbO Очу»ОгухСпу»^4к.4>.4ж b-V^J^^N?»-1^0^^^ as&§^2sot^s^ ООЧЮОЭ4ЬЬДОООП090П i>^vO>*JOnOO>-tNOOoON4w tO09J^OnS00 4Oi-i090n i—Ч04Ь-ОЮЬО-40«4>-* чО000000000000О0>4<4 4О0О9ОЧ On Ox 4k. tO ^Sno^^J ^4QxQN \0 4О\Ли>ы ssss ^^•J^^OnOnOnOnOn (Л^ЬОн-ООоо OnJ>09i-ip4000040n4k. >-> *4 00 OO 4w no VO 00<*}0900<5чОООпОО ^ййёёй^^^^ BBbobo^E^riti NOOOOOOOOOOOOOOO^1*) 00 ON|UN9NO •* ооопьооЗч OOONOON- ON 4 *-NO»-*bOOnC 5 л. to to j». *4 Co о о to Ln о 500 rfk. tO О <«4ОП»-» ON •-» 4> 4*- ОООч4ъОЭ>-1чООООч4ь.ОЭ on|gSbSoiB3oi^
* 18 *> НА IS 165 м НА о f£ 00 J82 en * £ о 408 2,907 570 8 ' ° О VO 00 *J ON 1 HA en 1 > 00 «4 1 1 1 1 ess » & 8 1 1- 1 1 "l I vo oo «a on 1" ii L M ЙЙ^ё I ь* НА H* HA НА 1 so «a tn со о Порядковый номер периода СП 1 (О ю на 1 НА со I 8 ON 1 1-4 8 & СП 1 £ \о ^ 1 en со 1 £ ,_, 00 А, НА ^ СП 4 СП S 1 НА о Jx 1 «О. ■о со 1 ы ON 1 СП о НА И* 1 ON ЙЬ н» СП 1 со vO J. (О **. 1 CO 00 s о CO ►u en tO M О i 8 VO 8 i СП Л ,'.,'. 1 JX О ON со tp. en со ю to CO. «4 Hi 1 I 1 en £k со 1 1 i к ё <!n vo <*) en 1 1 ^ ha О ON «-00 ha VK3 VO On J. . *4 О *4 «4 en со I со on en со to м VO ON CO en vo oo S8e W на О 8 & 3 1 CO H* и* VO 00 1 *J 1 1 to vo LI to н* *q en 1 1 00 Ю со to 1 to ha On CO HA en vo О *J to ha s к со hi со en to on со о со en 1 H» HI К 8 1 О на ha to О «4 1 1 CO VO £ g 1 1 H* to H* vO ha 00 vo 1 1 со en *j on en 1 1 03 ць. О со to ha •i i tO CO On en со h* I ha tO о en о ON CO О о и* to 1 CO Hi ha H* HA rfb О ON 1 M О ha ь* Й » й i 1 CO CO VO КВ8 1 1 о к» to § Я 3 1 1 ! t-д СО СП •J-1 t-l оо о to О й*. 00 1-1 1 СО ON VO So en to 1 1 1 со en -о fe V 8 1 1 1 to со .u g & lb lU M 00 1 1 1 So§ 1 1 1 CO rfb. СП £ 3 8 1 1 i »4 vo ha *ь 4^ О M en ^ CO en | CO CO CO 1 CO to to 1 to ON vo 1 en CO en I CO 8 1 s HA en to 1 to vo 1 VO ON vo 1 en en 1. 8 vo О 1 ON Ю 8 1 CO со to oo to 1 1 hi to £ 8 1 1 со en en on о en I | ON VO *>. en *>. en 1 1 en <| "8 £ 1 i CO >b. to to 00 -4 I 1 to to HA «4 6 s 1 1 *b en HL HA S en i 1 HA vo h* Г, 8 ON О 1 1 HI Hi en oo со en ON CO | | HA CO •J 00 00 «4 1 1 ON *4 en en CO 00 to vo ! 1 CO £ь vo en HA HA s s 1 ( «J 00 to to £ £ 1 1 en -j -1 ON 1 CO 6 1 8 1 to & J vo О 1 en к ON I ON _! 8 ^ CO to to £ь 1 а i en 8 1 00 ON I en HA 8 1 vo to S 1 VO J3 о Я «J *t я 43D **" -co .Я TO £ -co -co я -co я TO *"*" Я "CD £ ; -to ^я -co **" я *■». "CD t«K ^Я -CD 1 *». "CD 1 "*" ^ 5° Чис перио о о [ 00 \ -4 1 00 1 VO О НА to •-1 1 со на 1 СП НА ON •-1 -4 1 °° 1 ^ *
Порядковый номер периода о!о»5о\(ла«»омо«оо^л(л^ Я О чэ -С X Я о о о о I I со чо м со ^мЙПУ I I. I I I СП СИ я о ф ■е- К J3 S РЯ ЕС Н Е За 2d *> Я О Ja о X 3 > а > > *з о W > О? Я гй Я Я I I I Д* Soli О >г* СП ЧО \6 и щ ю tO ЧО 4*. <! 8 Ю СП & 2 м > 4" I м ойо«88о^ StSgggfcSSS ! I МММ i-i I-* о 1 v. 00 со о 234 - 1 8* СП rf* ^ о 1 it to -J чо СП 1 СП 1 00 00 ft 00 оо чо 1 СП 1 о 4». СП чо « 1 ю о 1 NO о я о £д to 1 8 1 сп 4*. ON СП о >и. 1 СП <1 00 S to |_1 •сп 1 СП ж to 1 СП *J ON ON »-* * о ю о ON 1 СП ON «55 *° (Л о (О СП о -109 СП I I II I ! I СО >U СП 4=- СО СО -О СПОСПОСНОСПОСП I I I I I I S £5 & £2 22 S у -3 •§ 2 8 Л 1^ Л ОЗ И И и fl\ j^ Со (л и чо чо t-1 Сп н-1 • ' I I a ft Я&?^Зч388$3~ЯЯ > > 01 о Е ,11111, м I м « оз w м I to сп чо cnoocncn^Scot04xi-»coto *.4*t0O000\rf>tOOI04* J, ' ~ ~ ~ ~ - . 1 Ч I I I I I |_l t-k |-Д ц_1 to сп о со »(ь. со I I I I I Г , I ►_! |_1 Ц-1 | | О Ю N3 ЧО . СП J-1 So8S^ £k СП ON СП 4> tO »J ЧО ON tO СП СО ON I I I § § I I I I i I I I I й О О « U О К 8 ,5 О Й
WE ON 1880 28560 7552 15504 67830 87780 О NO 10710 -4029 255 7623 13167 -2973 -4731 00 NO | СП СП oo 2584 -1020 & 5950 -2448 § 2849 -1425 115 *j 1368 -568 & 1268 - 596 fc 1890 -1067 8 -1155 1 00 -J ft ON 5355 -2345 175 684 1 00 »-* К 342 - 229 to CO -1470 4* 00 О -4389 1041 СП Порядковый СП 4* CO to 12376 -5733 455 2499 -1239 105 £ -102 to -494 00 СП -4130 1095 1 to СП -6853 1959 l ON СП 5304 -2834 260 153 1 ft -342 3 и-» -1140 334 -10 -6090 1876 1 3 -8547 2667 -105 -408 - 415 СП -1683 463 1 СП -684 220 1 00 -1596 530 -22 -7350 2457 -105 -9471 3165 -135 -4760 1524 ! -3009 1059 1 о*. СП -912 327 1 сп -1862 699 1 со -7910 2838 -130 -9625 3453 -155 номер "■* О NO -7752 2983 5 —3825 1485 1 -1026 398 -20 1 8 00 751 -37 —7770 3019 -145 -9009 3531 -165 -9384 3962 -220 -4131 1741 1 -1026 433 -23 -1824 776 -40 -6930 3000 -150 -7623 3399 -165 -9656 4461 -265 -3927 1827 1 Эх 1 ЧО »-» to 432 -24 -1520 -40 —5390 2781 -145 -5467 3057 -155 периода 00 -4 On -8568 4480 -280 -3213 1743 -105 1 ON OO 4*. 395 -23 -1026 655 -37 -3150 2362 -130 -2541 2505 -135 —6120 4019 -265 —1989 1489 1 -342 322 -20 -342 60S 1 со >-* -210 1743 -105 1155 1743 -105 -2312 3078 -220 1 to 1065 1 -а СП 114 to со 1 СП 532 306 1 to to 3430 924 1 3 5621 771 1 81 СП 2856 1657 1 4ь СП 1989 471 1 СП 684 ON оо 1 00 1596 ON -10 7770 ! 8 1 ю СП 10857 - 411 1 сп 4ь 9384 - 244 1 О 4743 - 293 1 сп 1368 -113 - 2850 - 271 СП 12810 -1314 со о 16863 -1803 С/1 со 17272 -2625 NO СП 8007 -1227 4>» СП 2166 -330 to 4294 - 645 to 00 18550 -2733 ЧО сп 23639 -3405 Сп КЗ 26520 -5486 092 11781 1 8 3078 -583 to СП 5928 -1076 4*. 24990 -4352 о 31185 -5217 195 *-* 37128 -8827 455 16065 -3605 175 4104 -872 4х О 7752 -1564 £ 32130 -6171 255 39501 -7239 285 Коэффициент ^R to -4 £ -со —1 я ПСО -со «^ (Й, -to ^ —г Число периодов СП Г ON ^i 00 NO 8
5. СУММА ЧЛЕНОВ СТЕПЕННОГО РЯДА Р Р Р 2**: 2**: 2'6: ~Р -Р —Р Число членов ряда п 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 2'а 2<* 2'е Четное число членов 2 20 70 168 330 572 910 1 360 1 938 2 660 3 542 4 600 5 850 7 308 8 990 10 912 13 090 15 540 18 278 21 320 2 164 1 414 6 216 19 338 48 620 10 574-10 20 699-10 37 403-10 63 46810 10 236-102 15 833-102 23 645102 34 274102 48 420102 66 890 102 90 609 10* 12 062-102 ' 15 810-103 20 437-103 2 1 460 32 710 26 801-10 13 309-102 48 740-102 14 528-103 37 309-105 85 584-103 17 96810* 35 121.10* 64 728-10* И 356-105 19 104-105 31 000-105 48 750-105 74 580-105 11 134.10е 16 266-106 23 30310е Число членов ряда п 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 2'* ъ* 2'6 Нечетное число членов 2 10 28 60 ПО 182 280 408 570 770 1 012 1 300 1 638 2 030 2 480 2992 3 570 4 218 4 940 5 740 2 34 196 708 1 958 4 550 9 352 17 544 30 666 50 666 79 948 1 12 142-10 17 854-10 25 53710 35 662-10 48 770-10 65 474-10 86 469-10 11 253-102 14 453102 2 130 1 588 9 780 41 030 13 43410 36 964-10 89 393-10 19 568-10* 39 568-10* 74 999-10* 13 472-10» 23 126-103 38 184.103 60 966-103 94 520-103 14 280 -10* 21 08210* 30 491-10* 43 291 10* 6. ЗНАЧЕНИЯ П Е ** - (S *2)2 и s ^ 51 t° - (Е **)2 Нечетное число членов ряда п 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 Л Е ** — (S /2)2 2 70 588 2 772 9438 26 026 61 880 13 178-10 25 775-10 47 109-10 81 466-10 13 455-103 21 376-10» 32 849-102 49 049-102 71 419-10» 10 171.10я 14 202103 19 484-10» 26 311-10я S /2 S (6 __ (В^)2 0 144 6 048 85 536 67 954-10 37 475.10я 16 039 103 56 927-103 17 498-10* 47 969-10* 11 982-105 27 706105 60 023-Ю5 12 299.10° 24 015-1О» 44 957.10й 81 097 -104 14 155-107 23 989 107 39 593 107 Четное число членов ряда п 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 п S ** - (Stf«)J> 256 3 584 21 504 84 480 25 626-10 65 228 10 14 623-102 29 768 10л 56 179-102 99 743-102 16 840-103 27 256-10з 42 562-103 64 440-103 94 978-103 13 67210* 19 274-105 26 671-105 36 295-10s Е**Е*«— (Sf')a 2 304 29 031 10 63 865-102 65 235-Ю3 42 40310* 20 387-103 78 943-105 25 960-10» 75 123-106 19 614-107 47 058-107 10 51810s 22 138-108 44 243-108 84 531-108 15 525-10» 27 535-10° 47 338-10» 79 144-10'» Показатели таблицы приведены с округлением до единицы (в первом числе). 195,
ЫЙ ТРЕНД) as as ОЯТНОСТИ 0,9 (ЛИ Е ВЕР ПРИ УРОВН ПРОГНОЗА ТЕРВАЛОВ КИ ДОВЕРИТЕЛЬНЫХ ЙН ОЦЕН для ИЯ К* 7. ЗНАЧЕН Период учреждения (L) Число о CS ON 00 VO r-i xn "J CO CS T-t О , ON 00 l> vo »n ^ CO cs lH с « F CQ 4,3749 4,0479 3,7309 3,4271 3,1399 2,8748 2,638 r-< 4,0167 3,7624 3,5154 3,2772 3,0499 2,8361 2,6391 2,4631 00 3,7556 3,5506 3..3513 3,1582 2,9726 2,7964 2,631 2,4786 2,3422 ON 3,3888 3,5526 3,2460 3,3833 3,1067 3,2181 2,9709 3,0578 2,8395 2,903 2,713 2,7548 2,592 8*6 vO" r|« cs""' cs 2,4827 2,3706 2,3614 2,2718 cs cs xn oo ^ -1 cs cs О i-н 3,2539 3,1316 3,0120 2,8953 2,7823 2,6727 2,5676 3,1417 3,0355 2,9317 2,8303 2,7313 2,6356 2,5433 2,4545 cs cs" 2,3724 ^2,2836 2,2017 2,1274 cs 2,2902 ХП xn cs 2,1463 2,0837 CO 3,0441 2,9511 2,8599 2,7706 2,6836 2,599 2,5172 2,4383 2,3627 2,2907 2,2226 2,1590 2,1000 2,0462 -<t ■, 2,8864 cs" cs" 2,8782 2,7404 2,7974 2,6696 So о cs cs 2,6409 2,533 2,5656 2,4673 2,4925 2,4035 00 r-J cs^" cs" As espies oof cs cs »cs 2,2266 2,1723 2,1680 2,1214 2,1131 2,0735 2,0621 2,0292 2,0153 1,9883 u-> vo 2,8214 2,7551 2,6901 2,6265 2,5641 2,5032 2,4438 2,3861 2,3302 2,2762 2,7632 2,7035 2,6446 2,5868 2,5303 2,4751 2,421 2,3684 2,3174 2,2680 2,2203 2,2243 2,1746 2,1747 2,1274 2,0827 2,0406 2,0015 1,9654 c^ 2,1308 2,0890 2,0494 2,0124 1,9776 1,9455 00 2,7112 2,6568 2,6032 2,5506 2,4991 2,4487 2,3994 2,3514 2,3044 2,2592 2,2151 2,1729 2,1321 2,0932 2,0559 2,0210 1,9877 1,9568 1,928 OS ON ON CS CS CO t- VO I- ON VO xn "^ cs" cs" cs" 2,6133 2,5291 2,4565 2,5644 2,4849 2,4165 2,5163 2,4415 2,3772 2,4692 2,3991 2,3389 2,4229 2,3574 2,3011 2,3776 2,3168 2,2644 2,3336 2,277 2,2285 §88 cs cs^ гн cs" cs" cs" VD oo VO CO О On CS CS CS 2,2080 2,1641 2,1265 2,1688 2,129 2,0948 cs" cs" cs" 2,0946 2,0623 2,0344 2,0598 2,031 2,0063 2,0266 2,0011 1,9792 1,9951 1,9727 1,9537 1,9654 1,9461 1,9294 1,9375 1,9210 1,9066 Г- xn Tf i-H OS 00 ON 00 00 cs cs cs 2,4295 2,3925 2,356 2,3204 2,2854 2,2514 2,2178 2,1853 2,1536 2,1228 2,0933 2,0641 2,0362 2,0096 1,9839 1,9593 1,9361 1,914 1,8932 1,8738 8 2,3694 2,3169 2,3356 2,2861 2,3024 2,2557 2,2698 2,2261 2,2381 2,1968 2,207 2,1683 2,1764 2,1406 2,1469 2,1135 2,118 2,0871 2,0899 2,0615 2,0628 2,0369 2,0365 2,0127 2,0112 1,9896 1,9869 1,9673 1,9635 1,946 1,9412 1,9256 1,9199 1,9061 1,8993 1,8876 1,8808 1,8701 1,8631 1,8538 ■*n xn cs cs Л 96
< « О Я и О а С со 3 2 3 5 ш 2 н CD S * в 2 в я 5 «а П Ш со Н о", £2 ° 2 * ? ш ш л- в О ш * * я с £ ш < •я «о 2 се К а> преж ериод у С аонэьт о см оо уг- vo in *4f со см ТЧ - о ON оо t- vo .m .^ CO CM - SMud a i OFDHh 4.СГ46 3,589 3,151 2,741 2,374 m ' 3,528 3,208 2,901 2,608 2,337 2,094 vo 3,205 2,965 2,733 2,510 2,300 2,106 1,932 t- 2,977 2,788 2,605 2,429 2,260 2,102 1,956 1,826 00 804 CM 2,651 2,502 2,358 2,220 2,088 1,965 1,851 1,749 ON 668 CM 541 CM 2,417 ' 2,297 2,180 2,069 1,865 1,774 1,692 o' 557 CM 449 CM 344 CM 2,242 2,142 2,047 vD On 1,869 1,788 1,714 1,647 *-« 464 CM Й CM § CM 192 CM 2,107 2,023 1,944 1,868 g 1,729 1,667 1,611 CM 2,384 304 CM 225 CM 148 CM 073 CM 2,000 1,930 1,863 1,799 1,738 1,682 1,629 1,581 CO 2,317 2,246 176 CM 108 CM 042 CM 2,257 2,194 2,132 072 CM 013 CM 956 00 Q 1,916 1,856 On 1,743*. 1,691 1,643 1,598 1,557 4* 1,846 1,794 1,745 1,697 1,653 1,611 1,572 « m 2,205 2,148 2,093 2,039 986 935 884 836 1,789 1,744 1,700 1,659 1,620 1,584 1,550 ON in vo 2,158 2,108 2,058 2,009 1,962 915 870 825 783 1,741 1,702 1,664 1,628 1,593 1,561 1,531 1,504 t» vo CM 2,070 2,025 1,981 1,938 1,895 854 814 775 737 1,700 1,665 1,632 1,600 1,570 1,541 4* in 1,490 00 2,091 2,048 2,005 1,962 1,920 CM 1,844 807 771 736 702 1,670 1,638 1,609 1,580 1,553 1,528 1,504 1,482 ON cm" 2,004 1,967 1,930 1,894 1,858 1,824 1,790 757 725 694 664 1,635 1,607 1,580 1,554 1,530 80S'X 1,486 1,466 8 1,977 1,943 1,909 1,875 1,843 00 1,780 1,749 719 690 662 635 1,609 1,584 1,560 1,537 m m 1,495 1,476 1,458 CM 1,918 1,887 1,856 1 00 1,768 1,739 1,712 685 659 634 609 1,586 1,563 1,541 1,520 § 1,482 1,465 1,448 CM CM 1,868 1,839 1,811 1,784 1,757 1,731 1,705 1,680 656 632 609 587 1,566 1,545 1,525 90S'X 1,488 1,472 1,456 1,441 CO CM 1,823 1,798 1,771 1,746 1,722 1,698 1,675 1,652 630 608 587 567 1,547 1,5529 1,511 1,494 1,477 1,462 1,447 1,433 ■4» CM Ц. 1,759 1,736 1,713 1,691 699' X 1,647 1,626 606 587 568 549 1,531 1,514 1,498 1,482 1,467 1,453 1,439 1,427 a 197
ОГЛАВЛЕНИЕ Введение ..._.... о 1. Тенденции развития экономически* показателей " ' * ' ' * 15 | 1. Проверка гипотезы о сУ1цествовании тенденций .'."!.' 17 2. Крийые' Ист!™6 ПРИеМЫ ЗНаЛИЗа тендеш*ий Развития 23 § 1'м!т^[£Г:Т^ ФУНКЦИИ> Применяемых при выравнивании 'дц- § 2. Выб>ор формы кривой " 52 3. Регрессионный . анализ и прогнозирование 62 § 1. Метод наименьших квадратов " 64 § 2. Парная регрессия ....!...' 67 § 3. Множественная регрессия 74 § 4*-->Рерребеия и прогнозирование [ 95 § 5.-3*ошметрические модели . ' ~ 9S 4. Оценивание параметров при подбор уравнений трендов ! ! 109 § 1. Метод ^ наименьших квадраТов при оценивании параметров полиномов.л •••..'. • 109 § 2. Оценивание параметров эКСп0^нцйальной кривой и логарифмической параболы 120 § 3. Упрощенное оценивание Параметров модифицированной экспо- ненты, кривой Гомперца * логистической кривой . . . . 123 . § 4. Использование метода Наименьших квадратов для оценки параметров кривых, имеющих асимптоты .133 § 5.« Дисконтированный метод наименьших квадратов . . . .146 о. Экстраполяция трендов А 151 § 1. Простейшие приемы экстрап0ЛЯцИи !!!!*!!! 154 I о* Экстраполяция тренда и доверительные интервалы прогноза 159 § 3. Доверительные интервал** аддитивных и мультипликативных моделей 176 § 4. Критерии точности и надежности'прогнозов ! .' '. '. ] ! 177 , Приложения . . . -. . . % в 183 библиография ......!.! .' .' 199 Евгений Михайлович Четыркин СТАТИСТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ Редактор л. Д. Сергеева Мл. редактор £. в. Ермолова Техн. редактор В. Л. Чуракова Корректоры Я. Б. ОСТр0вский, Н. П. Сперанская Худ. редактор Т< В. Стихно Переплет художцика Г. Я. Погореловой ИЬ № 391 Сдано в набор 19/VII 1976 г. Подписано к печати 20/XII 1976 г. Формат бумаги 60 X 90Vie. Бумага кн. журн. № 2. Объем 12,5 печ. л. Уч. изд. л. 13,77 Усл. печ. л. 12,5. Тираж 11000 экз. А15061. (Тематич. план 1977 г. JSfe 21) , Цена 1 р. и к. Заказ № 481. • * Издательство «СтатистИКа», Москва, ул. Кирова, 39 Типография им. Котлякова издательства «Финансы» Государственного комитета Совет* Министров СССР по делам издательств, полиграфии и книжной торговли. 191023, Ленинград, Д-23, Садовая, 21.