Текст
                    Э.К.Васильева, М.М.Юзбашев
ВЫБОРОЧНЫЙ
МЕТОД
В СОЦИАЛЬНО-
ЭКОНОМИЧЕСКОЙ
СТАТИСТИКЕ
Рекомендовано
Учебно-методическим объединением
по образованию в области статистики
в качестве учебного пособия для студентов
высших учебных заведений,
обучающихся по специальности
"Статистика" и другим экономическим
специальностям
МОСКВА ИЗДАТЕЛЬСКИЙ ДОМ
"ФИНАНСЫ И СТАТИСТИКА" "ИНФРА-М"
2010


УДК [31:36](075.8) ББК 65.051в6318я73 В19 РЕЦЕНЗЕНТЫ: Кафедра статистики Государственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский торгово-экономический институт» (заведующая кафедрой - Т.Г. Максимова, доктор экономических наук, профессор); П.Я. Октябрьский, доктор экономических наук, профессор (Санкт-Петербургский государственный университет) Васильева Э.К. В19 Выборочный метод в социально-экономической статистике: учеб. пособие / Э.К. Васильева, М.М. Юзбашев. — М: Финансы и статистика; ИНФРА-М, 2010. - 256 с: ил. ISBN 978-5-279-03334-8 (Финансы и статистика) ISBN 978-5-16-003911-4 (ИНФРА-М) Представлено развернутое изложение комплекса теории и практики применения выборочного метода в социально-экономической статистике. Детально рассмотрены основные методологические подходы и принципы организации выборочного наблюдения. Раскрыты математические основы выборочного метода и показаны конкретные инструменты и технологии работы с выборочной информацией. Даны систематизированные материалы по основным направлениям современных выборочных обследований в системе Росстата. Для студентов, аспирантов, преподавателей экономических вузов и факультетов, для широкого круга специалистов, осуществляющих формирование, переработку и использование социально-экономической информации. в 0702000000 - 032 90-2009 УДК [31:361(075.8) 010(01) - 2010 ББК 65.051в6318я73 © Васильева Э.К., Юзбашев М.М., 2010 ISBN 978-5-279-03334-8 © Издательство «Финансы ISBN 978-5-16-003911-4 и статистика», 2010
ПРЕДИСЛОВИЕ Цель изучения дисциплины «Выборочный метод в социально-экономических исследованиях» - овладеть основами теории и практики выборочных обследований. Ключевые задачи освоения курса: • уяснение места выборочного метода в системе приемов и методов статистического исследования; • познание общих принципов организации выборочного обследования; • умение различать основные виды несплошного и выборочного наблюдения, познание сильных и слабых сторон каждого из них; • овладение техникой формирования выборочной совокупности и методами расчета выборочных показателей. В современной общедоступной учебной экономико-статистической литературе, при всей значимости и широком диапазоне практического применения выборочного метода, информация об этом методе представлена в предельно кратком изложении либо рассредоточена по ряду публикаций фрагментарного характера. Обычно это одна из глав в учебниках по дисциплинам «Теория статистики», «Статистика». Частные аспекты выборочного метода и его практического использования рассматриваются в статьях, публикуемых в журнале «Вопросы статистики». Существует также достаточно обширная отечественная и зарубежная ранее изданная научная литература, глубоко освещающая методологические основы выборочного метода. В данном учебном пособии изложен комплекс теоретических, методологических и организационных вопросов выборочных наблюдений с учетом как накопленных статистической наукой знаний, так и современной практики проведения Федеральной службой государственной статистики выборочных наблюдений. Значительное внимание уделено вопросам, актуальным с точки зрения пользователя, применяющего на практике методологический аппарат выборочного метода и работающего с массивами числовой информации, полученной на основе выборочных наблюдений. Меньше внимания уделено математическим доказательствам и выводам формул, восприятие которых потребовало
бы более глубокого владения теорией вероятностей и математической статистики, не столь обязательного в повседневной практике социально-экономических выборочных обследований. Вся информация по выборочному методу в пособии представлена в трех разделах. Вразделе I рассмотрены теоретико-методологические и организационные основы выборочного наблюдения, описаны особенности различных способов формирования выборочной совокупности, показано, при каких условиях следует отдавать предпочтение каждому из них. Дан краткий обзор исторических корней выборочного метода в России, раскрыта роль русских ученых и статистиков-практиков в развитии научных основ выборочного метода. Вразделе II показано, из каких элементов сформирована система математического обеспечения выборочного метода и каков порядок его прикладного использования в социально-экономической статистике. Раскрыты особенности комплекса операций и расчетных процедур, выполняемых на двух разных этапах работы — проектирования выборочного обследования и разработки его итогов. Приведены конкретные примеры расчетов выборочных показателей. Раздел III посвящен систематизированному обзору выборочных обследований в современной практике российской государственной статистики. Раскрыты перспективы выборочных наблюдений на период до 2011 г. в соответствии с Федеральной целевой программой развития государственной статистики. Впервые дается сравнительный анализ принципов выборки в социально-экономической статистике и таких нестатистических областях знания, как аудит, налоговый контроль, менеджмент качества, социология. В приложениях приведены математические таблицы, необходимые в практике расчета и оценивания выборочных параметров. Представлены библиографический список и краткий словарь основных понятий теории и методологии выборочного метода. Главы 1, 2, 4 (разд. 4.2, 4.3 и 4.4), 5, 6, 7 и 8 написаны доктором экономических наук, профессором Э.К. Васильевой, а главы 3 и 4 (разд. 4.1) — доктором экономических наук, профессором М.М. Юзбашевым.
Выборочное исследование дает благодарную возможность заглянуть в далекие тайники статистики не только как метода исследования, но и как своеобразного способа мышления и миропонимания. Н.С. Четвериков ТЕОРЕТИКО- МЕТОДОЛОГИЧЕСКИЕ И ОРГАНИЗАЦИОННЫЕ ОСНОВЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ Раздел I Глава 1 ВЫБОРОЧНЫЙ МЕТОД В СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙ СТАТИСТИКЕ Важнейшим принципом исследования в социально- экономической статистике является полнота охвата всей совокупности выделенных во времени и в пространстве явлений и материальных объектов, в которых протекает исследуемый процесс, являющийся носителем изучаемой закономерности. Только при этом условии в полученном массиве информации будут воспроизведены реальная структура и реальные количественно измеряемые характеристики исследуемой совокупности. Вместе с тем на практике нередко складывается ситуация, когда нецелесообразно, а подчас и практически невозможно последовательное соблюдение принципа полноты охвата всей (генеральной) совокупности. Тогда в системе статистических приемов используют выборочный метод. 5
1.1. Несплошные наблюдения в современной статистике Методом сплошного наблюдения нельзя, например, при экологическом контроле провести химический или иной анализ воздушного или водного бассейна. Невозможно также провести лабораторный анализ качества всей массы полезных ископаемых в разведанном месторождении. В таких случаях отбираются пробы, составляющие бесконечно малую величину по отношению к общему объему изучаемой субстанции. Абсурдным было бы требование о проведении на предприятиях сплошного разрушающего контроля качества продукции, деталей и узлов. Ограничиваются лишь проверкой незначительной части продукций с учетом того, какую долю продукции надо подвергнуть разрушающему контролю, чтобы с необходимым уровнем достоверности гарантировать соблюдение заданных параметров качества. При изучении бюджетов домашних хозяйств также ограничиваются минимальным числом наблюдаемых хозяйств, чтобы оставались в разумных пределах затраты труда, времени и финансовых ресурсов на сбор исходной информации, но без существенного ущерба для достоверности получаемых данных. К настоящему времени в мировой практике сложилась обширная сфера применения несплошных обследований. Они используются при изучении занятости и безработицы, инвестиционной активности предприятий, оптовых и розничных цен, доходов и расходов семей, состояния здоровья населения, общественного мнения по вопросам государственной политики, сельскохозяйственного производства, транспортного обслуживания населения, развития сферы услуг, обеспеченности населения предметами длительного пользования и т.д. В современной российской практике крупные и средние организации охвачены сплошной отчетностью. В отношении субъектов малого предпринимательства регулярный сбор сплошной обязательной статистической отчетности неэффективен, поэтому применяется сочетание сплошного и выборочного наблюдения. По ряду направлений социально-экономической статистики выборочный метод доминирует при организации сбора первичных данных. К таким областям относятся статистика роз-
ничных цен и тарифов, статистика бюджетов домашних хозяйств, статистика общественного мнения. В перспективе следует ожидать создания и внедрения в практику социально-экономической статистики все более тонких научно обоснованных приемов выборочного наблюдения и расширения сферы их применения. Этот процесс активно протекает в течение всего периода становления и совершенствования в России рыночных отношений. Планомерный и последовательный характер расширения поля действия выборочного метода обеспечивается федеральными целевыми программами реформирования и развития системы государственной статистики в Российской Федерации. Уже реализованы две долгосрочные федеральные целевые программы. Постановлением Верховного Совета Российской Федерации от 23 октября 1992 г. была утверждена Государственная программа перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики (1992-1996 гг.). Правительство Российской Федерации своим постановлением от 23 ноября 1996 г. утвердило Федеральную целевую программу «Реформирование статистики в 1997—2000 годах». Ряд принципиально новых задач по дальнейшей научной разработке и практическому применению выборочного метода в социально-экономической статистике предстоит решать в течение ближайших лет. Содержание этих задач определено утвержденной постановлением Правительства Российской Федерации от 2 октября 2006 г. № 595 Федеральной целевой программой «Развитие государственной статистики России в 2007-2011 годах». Основными целями расширения сферы применения выборочного метода в современной статистике являются: сокращение затрат, сокращение сроков проведения статистических работ, уменьшение информационной нагрузки на респондентов. К 2011 г. выборочные наблюдения будут проводиться во всех секторах экономики и по сравнению с 2005 г. их количество увеличится на 15—20%. Росстат осуществляет сбор информации по более чем 250 формам федерального государственного статистического наблюдения. При проведении этих наблюдений готовится и доводится до отчитывающихся хозяйствующих субъектов порядка
100 млн листов статистического инструментария. Всего же ежегодно осуществляется сбор и обработка более 12 млрд статистических показателей. Статистическая наука располагает обширным арсеналом средств для достаточно полноценной замены сплошного наблюдения несплошным (частичным) обследованием изучаемой генеральной совокупности. Но при обращении к несплошному наблюдению крайне опасно необоснованное, чисто механическое применение произвольно выбранного метода. Прием, оптимальный при одних целях и условиях исследования, может оказаться принципиально непригодным в иной ситуации. Каждому, видимо, приходилось, и притом неоднократно, отвечать на вопросы социологов, корреспондентов, маркетологов, изучающих общественное мнение по определенной актуальной проблеме, структуру потребительского спроса на какие- либо товары и услуги. Регулярно в программах телевидения предлагается выразить свое отношение к некоему явлению, выбрав один из предложенных вариантов ответа и сообщив его по ходу передачи в телецентр. На экране высвечивается динамика результатов этого своеобразного голосования. Подобный живой диалог дает эффект обратной связи и повышает интерес к программе и обсуждаемой проблеме. Но попытаемся оценить данную методику сбора информации с точки зрения достоверности результатов. Материалы такого опроса не могут быть представительными для всей аудитории телезрителей в силу того, что не все категории зрителей пропорционально представлены в совокупности ответивших на заданный вопрос. Периодический показ на экране распределения уже поступивших ответов оказывает психологическое воздействие на дальнейший ход «голосования», что также способствует искажению информации. Следовательно, результаты опроса представляют оценку, смещенную по отношению к мнению всех телезрителей. Значит, полученные итоги неправомерно принимать в качестве оценок истинного отношения всех участвовавших в просмотре программы зрителей к обсуждаемой проблеме, так как они могут содержать значительную погрешность. Но представленная информация не предназначена для принятия решений по принципиально значимым вопросам, поэтому нет веских оснований считать неприемлемым подобный способ исследо- 8
вания общественного мнения, хотя и безоговорочно одобрять его также вряд ли было бы правильным. Хорошо известно, насколько велика роль телевидения в формировании психологических установок личности, особенно в детском и подростковом возрасте. Вполне понятно, что если из-за несоответствия состава ответивших действительной структуре зрителей какая-либо неприглядная в нравственном отношении позиция окажется поддержанной большинством ответивших, это даст негативный воспитательный эффект, потому что она может быть воспринята как общепринятая норма поведения. Другим примером несплошного наблюдения может служить обследование занятости населения. По его результатам оцениваются уровень безработицы, длительность периода безработицы у разных категорий населения, состав безработных по полу, возрасту, образованию и ряд других параметров. Полученные материалы используются государственными органами в их текущей работе и при выработке мер социально-экономической политики. К этой информации предъявляются высокие требования: она должна отображать реальную ситуацию без сколько- нибудь существенных искажений. При сборе информации применяются научно обоснованные методы, обеспечивающие надлежащее качество получаемых результатов. Вопросы о методах несплошного наблюдения и его наиболее строгого в научно-методологическом отношении вида — выборочного метода — составляют один из основных разделов теории статистики. Методология несплошного наблюдения включает ряд понятий и научных категорий. Для предварительного знакомства с понятийным аппаратом выборочного метода ниже приводится несколько терминов и их определений. 1. Генеральная совокупность — полный круг единиц исследуемой совокупности, из состава которой отбирается некоторая часть единиц и по их характеристикам судят о свойствах генеральной совокупности. 2. Обследуемая часть, выборочная совокупность — часть генеральной совокупности, которая включена в обследование. 3. Несплошное статистическое наблюдение — статистическое наблюдение, при котором обследуется только часть генеральной совокупности. В зависимости от способа формирования этой обследуемой части определяется вид несплошного наблюдения.
4. Выборочное наблюдение — вид несплошного статистического наблюдения, основанного на принципе случайного (вероятностного) отбора, проводимого с целью последующего распространения полученных данных на генеральную совокупность. 5. Выборочные показатели — обобщающие числовые характеристики, получаемые при разработке итогов выборочного обследования. Различают два основных вида выборочных показателей: 1) среднее значение какого-либо признака единиц совокупности (например, средний душевой доход населения); 2) показатель доли единиц в составе выборочной совокупности, отвечающих установленному критерию по какому-либо признаку (например, доля лиц, имеющих душевой доход ниже прожиточного минимума). Кроме того, при обобщении материалов выборочного наблюдения, как и сплошного наблюдения, могут быть получены и другие виды статистических показателей - суммарное значение признака по всему кругу единиц, характеристики вариации, связи, динамики и т.д. 6. Основа выборки — полный перечень единиц генеральной совокупности с указанием адресных данных и некоторых признаков. Используется при формировании выборочной совокупности методом случайного или систематического (механического) отбора. 7. Ошибка репрезентативности (представительности) выборочных оценок — различие между выборочной оценкой и тем значением параметра генеральной совокупности, который был бы получен при сплошном наблюдении всех единиц генеральной совокупности. 8. Ошибки наблюдения {регистрации) — погрешности, возникающие вследствие неправильной записи ответов в формулярах наблюдения. Могут носить случайный и систематический (направленный) характер. Встречаются как при сплошном, так и при несплошном наблюдении. Но в условиях несплошного наблюдения при относительно малых объемах наблюдаемой совокупности имеется возможность более эффективно осуществлять профилактические меры по предупреждению ошибок наблюдения. При планировании статистического наблюдения одним из первых возникает вопрос о том, будет обследование сплошным или частичным (несплошным). Необходимо взвесить все преимущества и слабые стороны этих двух видов наблюдения. 10
Основные преимущества несплошного наблюдения состоят в возможности: 1) значительной экономии затрат труда, материальных и финансовых ресурсов при проведении обследования; 2) проведения углубленного исследования проблемы, получения более подробных сведений на основе расширения программы наблюдения и усложнения включаемых в программу вопросов; 3) сокращения количества ошибок регистрации, так как при уменьшении объема наблюдаемой совокупности к работе можно привлечь профессионально более подготовленные кадры, можно тщательнее контролировать их деятельность; 4) значительно ускоренного, по сравнению со сплошным обследованием, получения результатов исследования; 5) привлечения к работе высококвалифицированного персонала. Слабая сторона несплошного наблюдения — неизбежность появления ошибок репрезентативности. Следует различать два разных понятия — ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают при заполнении бланков обследования из-за описок, небрежности, непрофессионализма лиц, проводящих обследование, а также из-за преднамеренных и непреднамеренных искажений информации со стороны тех, кого обследуют. Причиной появления ошибок могут быть также погрешности, допущенные при проектировании и тиражировании формуляров, заполняемых при статистическом наблюдении. Могут сказаться и такие факторы, как плохая организация работ, необеспеченность необходимыми канцелярскими принадлежностями и т.п. При всем многообразии характера ошибок регистрации и причин, приводящих к ним, общей тенденцией является большая распространенность таких ошибок при проведении массовых обследований. Очевидно, что в условиях сплошного наблюдения ошибки регистрации встречаются чаще, чем при несплошных обследованиях. Ошибки регистрации могут носить случайный или систематический характер. Случайные ошибки менее опасны, так как ошибки разной направленности при достаточно большом числе наблюдений частично взаимопогашаются при расчете итоговых показателей. Систематические ошибки дают эффект накопления и могут существенно исказить итоговые данные. 11
Случайные ошибки регистрации возникают обычно из-за описок, невнимательности, небрежности. Например, при переписи населения может оказаться, что возраст человека, являющегося отцом семейства, имеющего высшее образование и работающего юрисконсультом, указан - 14 лет. Скорее всего переписчик написал число 14 вместо числа 41. Материалы переписи предварительно, до подсчета итоговых показателей, подвергаются автоматизированному контролю, при котором подобные ошибки обычно легко обнаруживаются и исправляются. С учетом особой ценности информации о возрастных характеристиках населения в программе переписи предусмотрена двойная система записи ответа на вопрос о возрасте - «дата рождения» и «число исполнившихся лет». При сопоставлении двух вариантов ответа выявляются допущенные ошибки. Систематические ошибки регистрации появляются чаще всего в связи с преднамеренным искажением информации либо с неправильно понятым смыслом вопроса или с нарушением правил записи ответа. Так, в своей отчетности предприятия могут занизить данные об объемах выпуска товаров в целях уменьшения суммы подлежащих уплате налогов. Для выявления и предупреждения преднамеренных искажений статистической, бухгалтерской и финансовой отчетности организаций действует специальная система государственных контрольно-ревизионных органов. Риск появления случайных и систематических ошибок регистрации тем ниже, чем меньше объем наблюдаемой совокупности. При меньших масштабах работы можно обеспечить более квалифицированный состав исполнителей, более тщательно организовать и контролировать их работу и, наконец, применить корректные научные приемы восстановления пропущенных или ошибочных записей в материалах наблюдения. Таким образом, в условиях несплошного наблюдения ошибок регистрации меньше, чем при сплошном наблюдении. В статистике существует специальное направление методологических разработок - восстановление отсутствующих или некорректных сведений в материалах статистического наблюдения, известное под названием метода импутации. Современные технологии обработки первичных статистических данных предусматривают обязательное их редактирование, под которым понимается обнаружение и обработка (восстановление) оши- 12
бочных или пропущенных данных. Для восстановления информации применяются методы импутации, описанные в статье Т.М. Чернышевой и Г.Е. Шевердовой и включающие «широкий класс простых и сложных математических, математико-ста- тистических и экономико-математических моделей, предназначенных для определения новых значений переменной вместо пропущенных или несостоятельных полей в анкете или переписном листе. Новое значение переменной должно полностью удовлетворять всем установленным правилам редактирования»1. Наиболее широко применяются такие методы импутации, как методы донора, методы оценок, детерминистские методы. Метод донора состоит в замещении отсутствующей или неправильной записи другими данными путем случайного выбора или выбора «ближайшего соседа». Метод оценок заключается в вычислении необходимой величины на основе материалов того же или предыдущих обследований с использованием средних величин, показателей трендов, регрессии и др. Детерминистские методы импутации основаны на применении системы Филлед- жи—Хольта. Для осуществления редактирования и импутации данных применяется сложный математический аппарат, требующий универсального программного обеспечения2. Ошибки репрезентативности имеют принципиально иную природу, чем ошибки регистрации. Их появление никак не связано с качеством заполнения формуляров наблюдения. Ошибки репрезентативности возникают только при нёрплошном статистическом наблюдении и выражаются в том, что обследованная совокупность по своей структуре отличается от генеральной совокупности. Величина ошибки репрезентативности зависит от степени однородности генеральной совокупности, объема обследуемой части генеральной совокупности и от вида несплошного наблюдения. Основной причиной возникновения ошибок репрезентативности является неоднородность генеральной совокупности. Если бы генеральная совокупность состояла из совершенно идентичных по своим свойствам единиц, то достаточно было бы изу- 1 Чернышева Т.М., Шевердова Г.Е. Использование методов восстановления отсутствующих сведений при обработке материалов переписей и обследований населения // Вопросы статистики. - 2007. - № 2. - С. 17. 2 Более детальная характеристика методов импутации представлена в указанной выше статье Т.М. Чернышевой и Г.Е. Шевердовой. 13
чить лишь одну единицу, чтобы получить полное представление о совокупности в целом. Так, например, для получения информации о биохимических параметрах крови человека достаточно подвергнуть анализу всего несколько капель крови. Если фирма закупает партию производственного оборудования, то для изучения его качественных параметров можно ограничиться ознакомлением с отдельно взятым образцом этого вида оборудования. В социально-экономической сфере функционируют объекты, крайне неоднородные по своим характеристикам, будь то человеческие личности, предприятия, банки, торговые центры, населенные пункты. Чтобы исследовать свойства таких совокупностей, необходимо либо опираться на сплошные учетные данные, либо, обследуя только их некоторую часть, гарантировать представительность (репрезентативность) информации, полученной при неполном охвате всей совокупности. Особенно велики ошибки репрезентативности, имеющие явно направленный характер и обусловленные использованием упрощенных способов формирования обследуемой части единиц генеральной совокупности. Таково, например, анкетное обследование. При анкетном методе формуляры наблюдения заполняет некоторая часть объектов, изъявивших желание участвовать в обследовании. Например, если провести анкетное обследование населения в целях анализа степени удовлетворенности жителей микрорайона качеством услуг местного отделения связи, то итоговые показатели будут сильно смещены в сторону негативных оценок. Такое искажение возникнет в силу того, что большую активность проявят люди, недовольные качеством оказываемых услуг. Наименьшими являются масштабы ошибок репрезентативности при проведении выборочных обследований. Выборочный метод основан на принципе случайного отбора, при корректном применении которого исключается появление направленных смещений в структуре выборочной совокупности. Исключительно актуальной является проблема методологического обеспечения обследований, при проведении которых имеют место так называемые неответы, т.е. когда не удается осуществить запланированный сбор информации в полном объеме. Если участие в обследовании является добровольным, как, 14
например, при переписи населения, отдельные лица могут отказаться предоставить информацию о себе. Некоторые намеченные к обследованию объекты окажутся недоступными для переписчиков, например в случае болезни. Может возникнуть ситуация, когда отдельные вопросы программы наблюдения частично останутся без ответа либо из-за нежелания некоторых респондентов отвечать, либо из-за отсутствия у них необходимой информации. Следует различать отсутствие ответов на отдельные вопросы программы и полное выпадение из обследования единиц выборочной совокупности. В первом случае информация восстанавливается методами редактирования и импутации. Во втором случае могут приниматься следующие варианты решений. Возможно использование разных способов устранения искажений общих итогов обследования, вызванных неответами: 1) заменить выпавшие из обследования единицы наблюдения другими единицами, приняв за основу какой-либо единый принцип замены; 2) произвести операцию «досчета», т.е. осуществить корректировку итоговых данных тем или иным способом, сохранив без изменения полученный массив данных по выборочной совокупности. Методическим аспектам проблемы «неответов» большое внимание уделяется в зарубежной статистике в последние 30—40 лет. В отечественной науке также предпринимаются определенные усилия по решению этого вопроса. В целом эффективность несплошного наблюдения определяется уровнем его методологического сопровождения, охватывающего весь комплекс вопросов планирования обследования, сбора информации и обработки полученных статистических данных. На этапе планирования определяются вид несплошного наблюдения, его границы во времени и в пространстве, объем выборочной совокупности, формируются программа регистрации данных и программа разработки итогов обследования. Если планируется использование наиболее совершенного вида несплошного наблюдения — выборочного, то возникает ответственная операция по его математическому обеспечению. Теория выборочного метода является областью математической статистики, основанной на таких понятиях теории вероятностей, как случайное событие, случайная величина. 15
1.2. Виды несплошных наблюдений Как уже было сказано, несплошным является любое наблюдение, при котором сбор информации производится только по части генеральной совокупности. Полученные результаты обычно рассматриваются как более или менее точная оценка характеристик генеральной совокупности. Степень приближения данных несплошного наблюдения к соответствующим показателям генеральной совокупности может колебаться в очень большом диапазоне. Для различных видов социально-экономических исследований существуют свои критерии точности статистической информации. Большая ответственность лежит на лицах, проектирующих наблюдение и реализующих проект. Требуются творческий подход, глубокие научные знания и практический опыт, чтобы из множества возможных методических решений выбрать то, которое является оптимальным с точки зрения целей и условий проведения конкретного обследования. Прежде всего необходимо иметь четкое представление об особенностях каждого вида несплошного наблюдения, о его преимуществах и недостатках. Существует ряд общих требований, предъявляемых к результатам статистических исследований. Немецкий статистик Г. Шварц еще в 1970-е годы сформулировал четыре таких требования: 1) результаты наблюдения каждой обследуемой единицы должны быть достоверны. Это значит, что они должны точно отражать свойства этих единиц; 2) наблюдения должны проводиться в такие сроки, чтобы полученная информация не успела устареть; 3) затраты на проведение исследования должны находиться в приемлемом отношении к ценности полученной информации; 4) людские и материальные ресурсы для проведения исследования должны соответствовать трудности исследования1. Возникает вопрос: при каком виде обследования — сплошном или несплошном - можно обеспечить более строгое соблюдение этих требований? 1 См.: Шварц Г. Выборочный метод. Руководство по применению статистических методов оценивания: пер. с нем. / под ред. И.Г. Венецкого и В.М. Ивановой. - М: Статистика, 1978. - С. 7, 8. 16
Если проводится сплошное наблюдение совокупности значительного объема, то требуется привлечение большого числа сотрудников. Невозможно так подобрать этих людей, чтобы все они имели достаточно высокую квалификацию. Будут трудности с их обучением. Неизбежным результатом недостаточной квалификации персонала будет значительное число ошибок регистрации. Чтобы оценить характер и количество ошибок регистрации, потребуется проведение контроля формуляров наблюдения и повторного частичного обследования. В результате сплошного наблюдения могут быть получены большие массивы первичной информации, обработка которых, даже при современной вычислительной технике, в краткие сроки невыполнима. Примером этого может служить перепись населения 2002 г. Лишь к 2004 г. были опубликованы все 14 томов итогов переписи. Очевидно, что при несплошном наблюдении за счет сокращения ошибок регистрации данные по каждой единице наблюдения будут более достоверными, чем при сплошном обследовании. Несплошное наблюдение, благодаря меньшему объему работ, можно провести в более краткие сроки, чем сплошное. Следовательно, меньше риск того, что полученная информация окажется устаревшей. При несплошном наблюдении имеет место экономия затрат, поэтому легче соблюсти требование о соответствии затрат уровню ценности получаемой информации. Таким образом, первым трем требованиям легче следовать в условиях несплошного наблюдения. Несмотря на очевидные преимущества несплошного наблюдения, оно не всегда может быть применено. Так, полный охват обследованием всех единиц генеральной совокупности необходим, если при разработке итогов требуется получение представительных данных в детальном территориальном разрезе, включая уровень отдельных населенных пунктов, как, например, при всеобщей переписи населения. Сплошное наблюдение требуется и в тех случаях, когда на основании полученных итогов принимаются ответственные решения, выраженные в количественных параметрах (например, начисление налогов), или формируются итоговые финансовые документы (например, платежный баланс, государственный бюджет). Если признано целесообразным для исследования какой-либо проблемы проведение несплошного обследования, то существен- 2-2394 17
ное значение имеет вопрос о том, какому виду несплошного наблюдения надо отдать предпочтение, чтобы результаты обследования не обесценились из-за большой ошибки репрезентативности. Отдельные виды несплошного наблюдения различаются способами формирования обследуемой части, величиной ошибки репрезентативности, возможностью исследователя регулировать процесс отбора единиц, включаемых в обследование, величиной затрат времени, труда и материальных ресурсов на проведение обследования. Имеются следующие основные виды несплошного наблюдения: монографическое обследование, анкетное обследование, квотный отбор, типический отбор, цензовый (метод основного массива) отбор, выборочный метод. Эти базовые виды наблюдения могут в разных сочетаниях комбинироваться, образуя более сложные способы построения схемы обследования. Монографическое обследование охватывает несколько единиц или серий из генеральной совокупности, которые подлежат детальному изучению. Обычно монографический метод применяется в целях апробации проекта предстоящего статистического наблюдения, включая методику, организацию, программу наблюдения. Полученные материалы не могут быть представительными для генеральной совокупности. Монографическим обследованием является, например, пробная перепись населения. Анкетное обследование предполагает, что участие единиц наблюдения в нем определяется волеизъявлением самих обследуемых. Особенностями анкетного метода являются: • невозможность исследователя влиять на формирование объема и состава обследованной части генеральной совокупности; • систематическая ошибка в виде смещения структуры совокупности, имеющего позитивную или негативную направленность; • процент охвата генеральной совокупности обследованием, как правило, не превышает 30%; • преобладающая область применения - изучение общественного мнения населения. Квотный отбор представляет усовершенствованную разновидность анкетного метода. Предварительно генеральная совокупность подразделяется на ряд групп (слоев, страт, типов), по 18
сочетанию наиболее существенных с точки зрения исследуемой проблемы признаков, и определяется доля каждой группы. Далее намеченное к обследованию число единиц необходимо распределить по группам. При этом возможны два пути. Первый способ— подлежащее обследованию число единиц распределяется на группы (квоты) в строгом соответствии со структурой генеральной совокупности. Отбор единиц для каждой группы осуществляется в произвольном порядке (либо по волеизъявлению респондентов, как при анкетном обследовании, либо отбираются единицы наблюдения по усмотрению переписчика). Полученные при таком обследовании материалы являются достаточно представительными для генеральной совокупности по тем признакам, на основе которых формировались группы. Любые другие характеристики могут иметь существенное смещение оценок. Смещение окажется тем большим, чем меньше взаимосвязь этих характеристик с признаками, по которым выделялись группы при квотировании. Реже применяется второй способ, при котором подлежащее обследованию число единиц распределяется поровну между выделенными группами. Преимуществом такого подхода является возможность изучения малочисленных категорий единиц, число которых при пропорциональном распределении квот было бы недостаточным для получения надежных обобщающих показателей по отдельным группам единиц совокупности. Неудобство этого способа состоит в необходимости пересчета всей полученной числовой информации для восстановления фактических пропорций между всеми группами единиц при формировании сводных итогов по генеральной совокупности в целом. При использовании электронных технологий обработки информации система введения весовых коэффициентов реализуется вполне успешно. При квотном отборе формирование состава единиц, включаемых в каждую группу, осуществляется в ходе обследования. Переписчики в процессе сбора информации контролируют только степень заполнения групп. По тем группам, которые укомплектованы необходимым числом единиц, отбор прекращается. Чем меньше остается незаполненных групп, тем чаще приходится отказываться от обследования встретившихся объектов, так как по своим характеристикам они принадлежат к группам, по которым обследование уже завершено. Поскольку на обсле- 2* 19
довании работает достаточно большое число переписчиков, то их деятельность необходимо постоянно координировать в целях предотвращения избыточного числа обследованных единиц по группам. Квотный отбор целесообразно применять в случаях, когда не представляется возможным реализовать выборочный метод и если не предусмотрены жесткие требования относительно точности итоговых данных. Наиболее широкое применение квотный отбор находит при изучении общественного мнения, при анализе потребительского спроса населения. Точность результатов обследования при использовании квотного отбора зависит от тщательности проведенной группировки единиц генеральной совокупности — от полноты охвата наиболее существенных признаков и обоснованности решения о числе и границах интервалов по каждому признаку. Типический отбор — метод несплошного наблюдения, при котором обследуемая совокупность формируется на основании экспертных оценок специалистов, определяющих, какие единицы являются наиболее типичными для конкретных групп единиц генеральной совокупности. Основным недостатком данного метода является субъективизм исследователя. В настоящее время типический отбор применяется редко. В прошлом типический отбор широко использовался в России земскими статистиками для отбора крестьянских хозяйств и сельских населенных пунктов. Цензовый отбор (метод основного массива) применим лишь в случае значительной дифференциации единиц генеральной совокупности по своим размерам. Обследованию подлежат только достаточно крупные единицы. Устанавливается критерий отбора (ценз) — числовые значения одного или нескольких признаков. Обследуются те единицы совокупности, за счет которых формируется основная часть совокупного итога по генеральной совокупности в разрезе каждого показателя. Недоучет информации компенсируется корректировкой итоговых показателей с помощью поправочных коэффициентов. Более точные результаты можно получить, если малые единицы совокупности обследовать с применением выборочного метода. Метод цензового отбора практикуется при обследовании населенных пунктов, хозяйствующих единиц. Результаты цензового отбора нельзя непосредственно распространять на всю генеральную совокуп- 20
ность. Они представительны только для той ее части, которая соответствует установленному цензу. В современной практике цензовый отбор часто комбинируется с выборочным обследованием, которому подвергается та часть генеральной совокупности, что осталась неохваченной цензовым обследованием. Интегрируя данные двух обследований, получают итоги по всей генеральной совокупности. Характерным примером может служить обследование субъектов хозяйственной деятельности. Средние и крупные организации обязаны представлять статистическую отчетность в порядке сплошного наблюдения. Малые предприятия обследуются по сокращенной программе в выборочном порядке. Направленный отбор — отбор единиц из генеральной совокупности по какому-либо заранее установленному принципу. Направленный отбор - достаточно широкое понятие, охватывающее ряд различных видов несплошного наблюдения. Примером направленного отбора может быть цензовый отбор, типический отбор, метод механического отбора при выборочном наблюдении. Выборочный метод является основным научно обоснованным методом несплошного наблюдения. Его отличительные особенности состоят в следующем: • обеспечивается строгое соблюдение принципа случайности отбора; • используется математический аппарат теории вероятностей для определения теоретических значений ошибок репрезентативности или для расчета объема выборки, при котором гарантируется необходимая мера точности итоговых показателей; • при распространении выборочных данных на генеральную совокупность можно с заданной вероятностью установить границы, в которых находятся вычисляемые показатели по генеральной совокупности; • имеется возможность на стадии проектирования выборочного обследования заранее предусмотреть такие условия формирования выборочной совокупности, при которых обеспечивается необходимая точность результатов обследования; • существует возможность получения более точных результатов, чем при сплошном обследовании, так как резко сокращаются ошибки наблюдения и минимизируется величина ошибки репрезентативности; 21
• достигается максимальное приближение структуры выборочной совокупности к структуре генеральной совокупности. В математической статистике дается следующая формулировка выборочного метода: «Выборкой из совокупности объема N называется подмножество из п элементов этой совокупности, которые отобраны случайным образом. Каждый элемент совокупности имеет определенную фиксированную вероятность быть отобранным»1. Из данного определения следует, что основным и строго обязательным признаком выборочного метода является случайный порядок отбора единиц выборочной совокупности. На это положение следует обратить особое внимание в связи с распространенной практикой расширительного толкования сущности выборочного метода. При недостаточной компетентности в вопросах статистической методологии нередко полностью отождествляются несплошное и выборочное наблюдение. В статистической практике не всегда строго следуют положениям математической статистики, лежащим в основе применения выборочного метода. Терминология, научные положения математической статистики и прикладной статистики не всегда совпадают. Следует различать два понятия: «теория выборочного метода» и «теория выборочных обследований». Первое относится к математической статистике, второе — к общей теории статистики. Эти два понятия не тождественны. Классическая теория выборочного метода предполагает, что отбор производится из бесконечной совокупности единиц. В практике социально-экономических обследований исследователь всегда имеет дело с совокупностями, состоящими из конечного числа единиц. При этом доказательства теорем становятся более сложными. В теории выборочного метода предполагается, что действует закон нормального распределения. Распределение единиц в реальных обследуемых совокупностях редко полностью соответствует модели нормального распределения. Кроме того, в математической статистике предполагается возможность неоднократного извлечения выборочной совокупности, в статистической практике при организации конкретного обследования извлечение выборочной совокупности из со- 1 Шварц Г. Выборочный метод. Руководство по применению статистических методов оценивания. — С. 10. 22
става генеральной производится в подавляющем большинстве наблюдений однократно. В специальной статистической литературе можно обнаружить примеры расширительного толкования сущности выборочного метода. Например, в книге «Методологические положения по статистике» находим такие высказывания: «Широко известен метод основного массива, при котором в выборку включаются наиболее крупные (существенные) единицы наблюдения, обеспечивающие основной вклад в показатель, например суммарное значение признака, представляющего основной интерес обследования»1 (курсив наш. - Э.В.). Здесь совокупность, сформированная путем цензового отбора, названа выборкой. В этой же работе отбор типических представителей назван авторами квазислучайной выборкой: «Примером квазислучайной выборки в статистической практике является "Выборочное обследование малых предприятий по изучению социальных процессов в малом предпринимательстве", проведенное в 1996 г. в некоторых регионах России. Единицы наблюдения (малые предприятия) отбирались экспертно с учетом представительства отраслей экономики из уже сформированной выборки обследования финансово-хозяйственной деятельности малых предприятий (форма № МП "Сведения об основных показателях финансово-хозяйственной деятельности малого предприятия")». В строго математическом понимании выборкой является вся совокупность отобранных в выборочном порядке малых предприятий. Если же затем из этой выборки некоторые предприятия отбираются «экспертно», «квазислучайно», то в математическом смысле это не выборочный метод, а типический отбор. Подобное разночтение в употреблении терминов «выборка», «выборочный метод» в математической статистике и прикладной статистике надо учитывать при работе со специальной литературой. В данном учебном пособии мы стремились по возможности придерживаться более строгого подхода к использованию основных научных понятий и категорий выборочного метода. Чтобы не вступать в противоречие с основными положениями математической статистики и сохранить право применения ее 1 Методологические положения по статистике. - Вып. 3. - М.: Госкомстат России, 2000. - С. 22-23. 23
вычислительного аппарата, будем относить к выборке только такие способы извлечения обследуемой части из генеральной совокупности, которые являются вероятностными по своей природе и осуществлены методом собственно случайного отбора либо адекватного ему систематического (механического) отбора. Отбор единиц не является вероятностным и обследование неправомерно считать выборочным, если имеет место какое- либо из перечисленных ниже условий: • отбор ограничен наиболее доступной для наблюдения частью генеральной совокупности; • отбор производится беспорядочно, наугад; • отбираются единицы, наиболее «типичные» для данной совокупности (по мнению эксперта или исполнителя); • отбираются единицы с некоторым заранее заданными свойствами; • в число обследуемых включаются единицы, изъявившие согласие участвовать в проводимом исследовании. В социально-экономической статистике или в других сферах деятельности каждый из невероятностных способов отбора может оказаться уместным и эффективным при определенных условиях и для достижения определенных целей. Существует лишь одно ограничение: если не имеет места вероятностный (случайный) отбор, обеспечивающий всем единицам генеральной совокупности равную вероятность быть отобранными, то некорректным с научной точки зрения является использование математического аппарата выборочного метода. Выборочный метод находит широкое применение в различных областях прикладных исследований и в теоретических разработках. Теоретическое значение выборочного метода заключается в его использовании для решения вопроса об отклонении или принятии статистических гипотез по обширной проблематике эконометрических исследований. Под статистической гипотезой понимается некоторое предположение о свойстве генеральной совокупности, истинность которого проверяется на основе применения аппарата выборочного метода. Гипотезы могут формироваться как в отношении реальных, так и гипотетических совокупностей. Гипотезы могут быть простыми и сложными, параметрическими и непараметрическими. Примерами статистической проверки гипотез мо- 24
гут служить: оценка существенности расхождений двух средних или относительных величин, проверка гипотезы о законе распределения генеральной совокупности, проверка гипотезы об уровне значимости связи переменных величин. Применение теории выборочного метода для проверки статистических гипотез не относится к области его использования в качестве инструмента статистического наблюдения. Поэтому данный аспект применения выборочного метода не рассматривается в нашем пособии, посвященном именно статистическому наблюдению (сбору первичной информации) в социально- экономической сфере. Выборочный метод широко применяется в инженерно-технологических разработках как один из инструментов при организации управления качеством и в целях регулирования производственных процессов. Управление качеством распространяется, прежде всего, на выборочный контроль качества изготавливаемых деталей, полуфабрикатов, готовой продукции. Если визуальный контроль качества продукции и элементарные измерительные процедуры могут быть сплошными, то более глубокий контроль должен быть выборочным. Это относится к дорогостоящим проверкам с помощью специальных контрольно-измерительных приборов, особенно если при таких проверках продукт разрушается. Выборочный метод применяется на предприятиях при анализе использования фонда рабочего времени, при оценке эффективности различных моделей организации труда. Осуществляется также выборочная проверка качества работы различных видов технологического оборудования. Широкое применение находит выборочный метод как инструмент экспериментальных разработок в самых различных областях научных исследований - медицине, агрономии, технике, биологии, физике, химии и т.д. Такой аспект использования выборочного метода связан, главным образом, с теорией выборочного метода как раздела математической статистики. Эти вопросы не относятся к предмету изучения в нашем пособии и рассматриваться не будут. Существует принципиальное отличие в использовании выборочного метода в социально-экономических исследованиях и в его применении в эконометрике, технике. Если в эконометрике и производственно-технической сфере применение выборочного метода связано, главным образом, с соблюдением тре- 25
бования корректного использования аппарата математической статистики, то в социально-экономической статистике использование выборочного метода сопряжено с необходимостью решения сложного комплекса вопросов методологического и организационного характера. К числу таких вопросов относятся: • выбор, обоснование и построение оптимальной схемы формирования выборочной совокупности; • установление обоснованных критериев достоверности выборочных показателей, степени их соответствия данным по генеральной совокупности; • определение необходимого объема выборочной совокупности; • создание надежной базы данных (основы выборки) о составе генеральной совокупности как исходной информации для извлечения единиц из генеральной совокупности; • разработка специального инструментария и системы мероприятий по профилактике отклонений от принятого порядка формирования выборочной совокупности; • принятие решений о способах корректировки состава и объема выборочной совокупности, если заведомо известно, что в силу объективных причин в ходе проведения обследования неизбежны отклонения от установленных правил отбора единиц наблюдения; • определение цикла расчетных процедур, необходимых для оценки репрезентативности материалов проведенного выборочного обследования и для распространения выборочных данных на генеральную совокупность. Каждая числовая характеристика, полученная при выборочном наблюдении, является оценкой соответствующего показателя генеральной совокупности. Масштаб смещения этих оценок измеряется с помощью специального аппарата математической статистики. Это возможно потому, что в условиях случайного отбора его результаты удовлетворяют требованиям теории вероятностей. Математическая статистика дает возможность рассчитать степень точности, с которой в выборочных данных отражаются характеристики генеральной совокупности. При помощи выборочного метода могут быть получены оценки таких показателей генеральной совокупности, как средние значения признаков, их суммарные значения, относительные величины, показатели доли единиц с определенными свойствами, меры рассеяния значений признака (среднее квадратическое 26
Виды статистического наблюдения По организационным формам По охвату генеральной совокупности По времени наблюдения По способу регистрации отчетность специально организованное несплошное монографическое анкетное текущее периодическое единовременное квотное типическое цензовое (основного массива) выборочное опрос интервью саморегистрация непосредственное наблюдение наблюдение с помощью специальной регистрирующей аппаратуры телефонный опрос Рис. 1.1. Общая схема классификации видов статистического наблюдения отклонение, размах вариации, коэффициент вариации, асимметрия, эксцесс), коэффициенты регрессии, коэффициенты корреляции и др. Комбинированное обследование — это обследование, при котором: а) совмещаются сплошное и несплошное обследование; б) сочетаются несколько видов несплошного наблюдения, например цензовый и выборочный методы. Использование комбинированного метода достаточно широко практикуется в социально-экономической статистике и продиктовано сложностью и территориальной рассредоточенностью генеральной совокупности. 27
Мы рассмотрели виды несплошного статистического наблюдения, разграниченные только с точки зрения способов отбора единиц наблюдения. В теории статистики виды наблюдения классифицируются также по ряду других признаков. Рассмотрим схему, представленную на рис. 1.1. В схеме показаны четыре относительно независимых направления классификации видов статистического наблюдения. Одно и то же конкретное обследование идентифицируется по каждому классификационному признаку. Особый интерес представляет выявление наиболее распространенных сочетаний принадлежности конкретных обследований к определенным видам с позиций разных классификационных признаков. Например, статистическая отчетность является, как правило, одновременно сплошным, периодическим, корреспондентским наблюдением, но при этом не исключены и другие варианты их сочетаний в признаковом пространстве. Так, организации малого предпринимательства периодически представляют отчетность на выборочной основе, но в 2001 г. в единовременном порядке все малые предприятия обязаны были представить статистическую отчетность на сплошной основе. 1.3. Выбор вида выборки Многообразие видов выборочного наблюдения обусловлено особенностями решаемой проблемы, своеобразием генеральной совокупности и оптимальным при конкретных условиях выбором организационно-методологических принципов обследования. Различные виды выборочного наблюдения классифицируются по семи признакам, как показано в схеме на рис. 1.2. Каждое конкретное статистическое обследование идентифицируется одновременно по всем признакам. Следовательно, при проектировании обследования можно выбрать наиболее рациональное сочетание позиций в признаковом пространстве с точки зрения реальных условий выполнения работ и требований к качеству получаемых материалов. В зависимости от определения единицы отбора различают выборку единицами и сериями {гнездами). В первом случае совпадают единица совокупности и единица отбора - применяемый метод называется простой случайной выборкой. Математической 28
Виды выборочного наблюдения по признакам I 1 Единица отбора Повторность отбора Способ отбора единиц Тип (страта) Число ступеней наблюдения Фазы выборки Взаимопроникновение наблюдений Единица совокупности Серия (гнездо) единиц совокупности Бесповторный Повторный Случайный Систематический цированный Нестрати- фициро- ванный Одноступенчатое наблюдение Многоступенчатое наблюдение Однофазная Многофазная Наблюдение без проникновения проникающее наблюдение Рис. 1.2. Виды выборочного наблюдения в социально-экономической статистике го со
моделью простого случайного отбора является отбор шаров из урны случайным образом. После отбора каждой единицы шары в урне тщательно перемешиваются. Эта модель может быть реализована в двух вариантах — повторного и бесповторного отбора в зависимости от того, возвращаются ли в урну отобранные шары. В практике социально-экономических обследований применяется главным образом бесповторный отбор. При этом доля отбора составляет частное от деления объема выборочной совокупности п на объем генеральной совокупности N. Математическая модель с шарами и урной не может быть в чистом виде реализована в экономической практике из-за большого объема генеральной совокупности. Поэтому применяются специальные технологии случайного отбора (собственно случайный отбор, систематический отбор), которые будут описаны в разд. 3.3. При серийной (гнездовой) выборке единицей отбора является серия (гнездо), представленная группой единиц совокупности, составляющих некоторое единство, - семья, школьный класс, студенческая группа и т.д. Преимущество отбора сериями состоит в том, что достигается значительная экономия затрат на обследование благодаря более компактному размещению обследуемых объектов в пространстве. Существенным достоинством отбора сериями является возможность исследования взаимосвязей и процессов, действующих в пределах серии. Например, уровень жизни населения можно изучить более глубоко на основе информации о домохозяйствах (семьях), в которых происходят перераспределение доходов и совместное пользование ресурсами семьи. Ценность отбора сериями значительно снижается из-за резкого увеличения по сравнению с отбором единицами величины ошибки репрезентативности, что приходится компенсировать увеличением объема выборки. В некоторых случаях серии формируются искусственно — специально в целях проведения отбора сериями. Такие серии обычно бывают равновеликими. Если же сериями — единицами отбора — служат фактически существующие сообщества единиц совокупности, то они, как правило, имеют в своем составе разное число единиц, что должно быть учтено при выполнении расчетов выборочных показателей. С позиций математической статистики понятие серии имеет несколько иное содержание, чем в социально-экономической 30
статистике. В математической статистике предполагается, что серии формируются самим исследователем путем объединения единиц совокупности в некоторые группы. Причины, по которым гнездовая выборка может оказаться предпочтительней, чем выборка единицами, таковы: • особенности размещения единиц генеральной совокупности в пространстве. В случае значительной дисперсности размещения единиц совокупности по территории выборка единицами была бы малоэффективной из-за больших затрат средств и времени на территориальные перемещения переписчиков; • особенности основы выборки. Отсутствует в готовом виде основа выборки с данными о единицах совокупности. Ее создание потребовало бы больших материальных и трудовых затрат. Существует доступная и качественная основа выборки с информацией обо всех сериях, составляющих генеральную совокупность; • особый характер единиц совокупности. Если единицы совокупности невозможно идентифицировать из-за неопределенности границ между отдельными единицами, то при выборке единицами трудно избежать получения смещенных оценок. В этих условиях отбор сериями позволяет снизить риск получения смещенных оценок; • необходимость (в соответствии с задачами исследования) проведения статистического наблюдения с использованием двух единиц наблюдения — единиц совокупности и серий. Если серии представлены естественными сообществами единиц (семья, бригада рабочих и т.п.), то предметом исследования, наряду с поведением и свойствами совокупности единиц, могут быть процессы и взаимосвязи, имеющие место в сериях. В современной практике выборочных обследований широко применяется метод стратифицированной (типической, районированной, расслоенной) выборки, при которой генеральная совокупность подразделяется на качественно различные страты (типы) и отбор производится строго самостоятельно из каждого типа. Группировка на типы обычно производится по нескольким существенным признакам с таким расчетом, чтобы разграничить особенно сильно различающиеся между собой типы (страты, слои) единиц. В пределах каждого из выделенных типов желательно иметь высокую степень однородности единиц. 31
В социально-экономической статистике стратификация может производиться по территориальному принципу, по формам собственности, по сферам деятельности, по уровню доходов и другим признакам, а также по их сочетанию. Важным условием является четкое и однозначное установление границ между стратами. Причинами применения этого распространенного вида выборки могут быть: • стремление получить выигрыш в точности результатов по изучаемой совокупности в целом как основной мотив; • получение преимуществ организационного характера, когда, например, предпочтительнее поручить сбор информации нескольким обособленным ведомствам или иным структурным образованиям при сохранении централизованного общего руководства работами; • необходимость получения материалов разной степени точности по отдельным крупным частям, сегментам изучаемой совокупности, что связано с особенностями задач исследования; • необходимость проведения сравнительного анализа в разрезе страт. При этом стоит задача обеспечения репрезентативности не только по совокупности в целом, но и на уровне каждой страты. Стратифицированный отбор обеспечивает повышенную точность разграничения страт, что позволяет получить более достоверные сравнительные оценки; • некоторое сочетание ранее названных причин. По стратифицированной выборке величина случайной ошибки выборки определяется только вариацией признака внутри слоев (поэтому слои надо формировать по возможности более однородными). Влияние вариации признака между слоями на ошибку выборки исключено, так как при формировании слоев учитывается фактическая структура генеральной совокупности. Невозможно установить какие-либо единые рекомендации об оптимальном числе выделяемых типов при стратифицированной выборке. Каждый конкретный проект выборки требует своего подхода. Общий принцип заключается в том, чтобы в результате стратификации были достигнуты: а) наибольшее различие средних величин между стратами и б) максимальная однородность единиц внутри страт. Главным преимуществом стратифицированной случайной выборки является значительное сокращение величины ошибки 32
репрезентативности по сравнению с простой случайной выборкой при одном и том же объеме выборочной совокупности. В случае наличия исходной информации по некоторым признакам на стадии проектирования выборки можно предварительно оценить ожидаемую эффективность применения стратифицированной выборки путем сравнения дисперсий. Известный российский статистик Н.К. Дружинин приводит следующий пример1. Общая дисперсия составляет величину 118,92, дисперсия между стратами — 6544,05, дисперсия внутри страт — 67,00. При использовании стратифицированной выборки дисперсия оказывается почти в два раза меньше, чем при простой случайной выборке. Применение стратифицированной выборки позволит соответственно снизить ошибку репрезентативности. Такой результат достигается без сколько-нибудь заметного роста затрат на проведение работ. Но эффект незначителен, если отсутствуют существенные качественные различия между типами (стратами). Сложность и ответственность решения вопроса о применении стратифицированной выборки обусловлены тем, что возможно выделение разного числа и вида страт, использование разных признаков для разграничения единиц совокупности по стратам. Основным критерием при принятии решения является цель исследования. Следует также принимать во внимание ряд конкретных условий — наличие и содержание основы выборки, характер структуры выборки по территориальному или административному признакам, приоритетность тех или иных решений по организационным вопросам, возможные способы осуществления контрольных мероприятий и др. Препятствием к использованию стратифицированной выборки может явиться отсутствие по генеральной совокупности необходимой для разграничения страт информации. По каждой единице генеральной совокупности требуются данные о значениях признаков, по которым будет определяться принадлежность единицы к определенной страте. Особенно высоки требования к информационному обеспечению на стадии проектирования выборки при использовании оптимального размещения выборочной совокупности по стратам. 1 См.: Дружинин Н.К. Выборочное наблюдение и эксперимент. - М: Московский институт народного хозяйства им. Г.В. Плеханова, 1977. — С. 75. 3 - 2394 33
Различают три вида стратифицированной выборки в зависимости от способа определения количественных пропорций между стратами в выборочной совокупности: 1) структура выборки пропорциональна структуре генеральной совокупности; 2) равномерное размещение единиц выборочной совокупности по слоям и 3) отбор с долями, пропорциональными величине дисперсии (оптимальная выборка) по каждому слою. Пропорциональный отбор означает, что в выборочной совокупности сохраняются те же соотношения между стратами, какие имеют место в генеральной совокупности. Например, если производится пятипроцентная выборка, то в каждом слое (страте) также отбор единиц должен быть пятипроцентным. При равных по всем слоям долях отбора обеспечивается точное воспроизведение структуры генеральной совокупности, что существенно снижает ошибку репрезентативности. Слабой стороной такого метода является невозможность дифференцированного и сравнительного анализа материалов обследования по отдельным стратам в тех случаях, когда имеются малочисленные типы, по которым объем выборочной совокупности слишком мал и вычисленные по ним выборочные показатели не являются достаточно достоверными. Отбор с равными объемами выборки по каждому типу, т.е. равномерное размещение единиц выборки. Например, если общий объем выборки должен составить 3560 единиц и генеральная совокупность разделена на 8 слоев, то объем выборки в каждом слое должен составить по 445 единиц. Равномерное размещение выборки является предпочтительным при резкой дифференциации слоев по числу входящих в их состав единиц генеральной совокупности. При равномерном отборе все типы в выборочной совокупности имеют равную и достаточную наполненность, поэтому вычисленные по ним выборочные показатели достоверны на уровне каждого слоя (при достаточно большом числе единиц происходит погашение случайных отклонений от основной тенденции). Применение равномерного размещения единиц выборки по стратам может быть вынужденным, если на стадии проектирования выборки неизвестно число единиц генеральной совокупности в каждой страте. Недостаток равномерного размещения стратифицированной выборки состоит в неудобстве получения сводных итогов по всей 34
совокупности, так как приходится производить перевзвешивание выборочных данных, чтобы воспроизвести реальную структуру совокупности. Возможны случаи, когда число единиц генеральной совокупности в слое меньше необходимого объема выборки в данном слое. В таких случаях проводят сплошное обследование в этих малочисленных слоях. Оптимальное размещение выборки, т.е. отбор с долями, пропорциональными величине дисперсии исследуемого признака в каждом слое, с научно-методологической точки зрения наиболее корректно. Данный метод формирования стратифицированной выборки называют методом Неймана, который предложил его в 1934 г. В действительности впервые этот метод был сформулирован и опубликован русским статистиком А.А. Чупровым еще в 1923 г. Метод оптимального размещения выборки был описан также в книге А.Г. Ковалевского «Основы теории выборочного метода», опубликованной в Саратове в 1924 г. Теоретическая предпосылка принципа оптимального размещения стратифицированной выборки состоит в следующем. Ошибка репрезентативности имеет тем большую величину, чем значительнее неоднородность генеральной совокупности. Следовательно, для выравнивания по стратам величины ошибки репрезентативности необходимо увеличить в составе выборочной совокупности объем тех страт, в которых выше дисперсия, являющаяся мерой неоднородности совокупности. В этом случае, как и при отборе с равными объемами по стратам, определение итогов по всей совокупности требует процедуры взвешивания для восстановления фактической структуры совокупности. Практическая реализация данного вида стратифицированной выборки нередко оказывается невозможной из-за отсутствия на стадии проектирования обследования (когда надо рассчитать объем выборки по каждой страте) данных о дисперсии изучаемых показателей по каждой отдельной страте. Косвенные методы оценки дисперсии дают приближенный результат. Лишь после получения результатов обследования появляется возможность сделать заключение о том, насколько оправданным было применение оптимального размещения единиц при стратифицированной выборке. Задача облегчается в тех случаях, когда подобное обследование проводилось ранее и его материалы могли быть использованы для приближенной оценки дисперсии. з* 35
Другая сложность применения оптимального размещения стратифицированной выборки связана с отсутствием однозначного решения о доле отбора по каждой страте, так как показатели дисперсии определяются для каждого отдельно взятого признака. При проведении социально-экономических исследований исходная информация собирается по большому кругу признаков единиц совокупности. Дисперсии этих признаков различны, следовательно, для каждого признака существует свое оптимальное размещение выборки по стратам, а для обследования необходимо выбрать один вариант оптимального размещения. Компромиссное решение находят разными путями. Можно ограничиться рассмотрением лишь нескольких наиболее важных для целей исследования признаков. Для нескольких оставшихся признаков производят ряд специальных расчетов, чтобы принять за основу некоторый принцип предпочтения в выборе единого оптимального размещения выборки1. При проектировании стратифицированной выборки для решения вопроса о том, какому из трех ее видов отдать предпочтение, следует произвести предварительные расчеты и определить, в каких размерах повысится точность выборочных данных в каждом случае по сравнению с простой случайной выборкой. Можно также подсчитать, насколько пришлось бы увеличить объем простой случайной выборки, чтобы достичь такой же степени точности, как при стратифицированной выборке. Возможно проведение стратифицированной серийной (гнездовой) выборки, позволяющей снизить затраты, но приводящей к увеличению ошибки репрезентативности. Для этого варианта также необходимо произвести расчет ожидаемой ошибки выборки. Подобные оценки позволяют принять взвешенное решение с учетом соотношения таких факторов, как величина затрат на выполнение работ и степень точности выборочных данных при разных видах выборки. Многоступенчатая выборка. Этот тип выборки получил значительное распространение в современной практике выборочных обследований, что обусловлено большими объемами, слож- 1 Конкретные способы расчетов при выделении двух слоев и наличии двух признаков см.: Кокрен У. Методы выборочного исследования. — М., 1976. — С. 137—143; Йейтс Ф. Выборочный метод в переписях и обследованиях. - М., 1965. - С. 362-367. 36
ной структурой и территориальной рассредоточенностью генеральной совокупности. Существенным преимуществом многоступенчатой выборки является возможность применения гибких схем отбора с учетом особенностей размещения генеральной совокупности и ее естественного деления на секторы, группы, категории. При многоступенчатой выборке удается сосредоточить работу по сбору информации в относительно небольшом числе точек, что снижает уровень затрат, облегчает организацию наблюдения и проведение контрольных мероприятий. При многоступенчатой выборке в целях сокращения затрат на проведение работ и обеспечения удобства обследования выборочная совокупность формируется поэтапно. На всех ступенях, кроме последней, отбор производится сериями. На каждой последующей ступени единицей отбора выступает более мелкая серия, а на последней ступени единицей отбора может быть единица совокупности либо серия более мелкая, чем на предыдущей ступени. Например, выборочная совокупность населения может быть сформирована в следующей последовательности: • первая ступень — отбор субъектов РФ (единицей отбора является серия - субъект РФ); • вторая ступень — в каждом отобранном субъекте РФ производится отбор муниципальных образований, т.е. административных районов (единицей отбора выступает более мелкая серия — район); • третья ступень — в каждом отобранном районе производится отбор населенных пунктов (в сельской местности) или микрорайонов в крупных городах (единицей отбора является еще более мелкая серия — населенный пункт, микрорайон); • четвертая ступень - отбор необходимого числа жителей в намеченных для обследования населенных пунктах (единица отбора соответствует единице совокупности - человек). Учитывая возможность построения большого числа вариантов многоступенчатой выборки, необходимо сделать обоснованный выбор в пользу конкретного варианта, обеспечивающего наибольшую точность результата при минимальных затратах. При многоступенчатом отборе часто производится стратификация, т.е. типологическая, территориальная или иная группировка единиц генеральной совокупности. Применение таких комбинированных видов выборки обусловлено сложностью исследуемых совокупностей и комплексным характером задач 37
исследования, что весьма характерно для социально-экономической статистики. Проектирование и организация многоступенчатой выборки представляют сложный комплекс научно-практических мероприятий и требуют большой предварительной работы по следующим направлениям: • ознакомление с характером, размерами и основными свойствами единиц отбора на каждой ступени; • определение наличия, доступности и надежности возможных источников информации о единицах отбора на каждой ступени; • оценка наличия и качества основы выборки на каждой ступени; • оценка объективных предпосылок (организационных, информационных, затратных, методологических) в пользу или против применения стратификации на каждой ступени выборки. Принцип многоступенчатого отбора находит широкое применение также за пределами социально-экономической статистики. Например, в химии, биологии, физике часто требуется провести исследование в условиях ограниченного объема материала для эксперимента. Для получения возможности проведения многочисленных повторных опытов и апробации разнообразных методик осуществляют подвыборку из основной выборки, на основе этой подвыборки получают подвыборку второго порядка и т.д. Такая схема отбора близка к модели многоступенчатой выборки, следовательно, имеется возможность оценивания на основе математической теории выборочного метода. Многофазная выборка. Принцип многофазной выборки состоит в своеобразном совмещении нескольких наблюдений по одной проблеме в рамках одного обследования. На первой фазе предусматривается большой объем выборки при краткой программе обследования. На второй фазе из отобранных на первой фазе единиц проводится «подвыборка» и предусматривается существенное расширение программы наблюдения, которая обязательно включает вопросы программы первой фазы. Подобным же образом формируются последующие фазы. При такой методике удается совместить два альтернативных принципа — детализации программы обследования и экономии затрат на проведение работ. Компромисс достигается благодаря тому, что детальная информация, полученная на последних фазах, после- 38
довательно распространяется на более широкую совокупность единиц, обследованных на предшествующих фазах. Принцип многофазной выборки Ф. Йейтс определяет следующим образом: «Иногда бывает удобно и экономично собирать одни данные на основании изучения всех единиц выборки, а другие - только по некоторым из этих единиц, отобрав последние так, чтобы они составили подвыборку из единиц первоначальной выборки. Этот способ можно назвать двухфазным отбором. При необходимости можно добавить следующие фазы»1. Многофазную выборку , как указывает Ф. Йейтс, применяют, если: • число единиц, необходимое для определения отдельных показателей с заданной точностью, весьма различно; • различна степень изменчивости подлежащих изучению взаимосвязанных переменных; • для различных показателей требуется разная точность; • данные, полученные на первой фазе, необходимы в качестве дополнительной информации для того, чтобы повысить точность данных последующих фаз; • материалы первой фазы используются в качестве основы выборки для извлечения простой или стратифицированной под- выборки, по которой позже будет проведена вторая фаза обследования. Примером широкомасштабной многофазной выборки могут служить переписи населения в США. Впервые в 1940 г. в программу переписи населения США были включены дополнительные вопросы для 5% населения. Строго говоря, это еще не многофазная выборка, так как на первой фазе наблюдение является сплошным и только на второй фазе — выборочным. В 1960 г. в США была действительно применена многофазная выборка при переписи населения. В программу сплошной переписи были введены дополнительные вопросы (доход, число лет обучения, миграция, служба в вооруженных силах) для 20% населения. Затем из состава лиц, попавших в эту 20-процентную выборку, отбирался каждый шестой человек для дальнейшего расширения программы переписи за счет вопросов о браках и числе рожденных детей. Таким образом, на базе сплошной переписи была применена двухфазная выборка. 1 Йейтс Ф. Выборочный метод в переписях и обследованиях. — С. 67. 39
С большой долей условности к типу многофазной выборки можно отнести современные всероссийские переписи населения, в которых применяются два вида переписных листов — с кратким (для 75% населения) и более детальным перечнем вопросов (для остальных 25% населения). Многофазную выборку не следует смешивать с многоступенчатой выборкой. В многоступенчатой выборке, а) на каждой ступени представлены единицы отбора разных порядков с переходом к единицам меньшего масштаба на каждой последующей ступени; б) статистическое наблюдение производится на последней ступени, а на предыдущих - только отбор единиц. В многофазной выборке, а) наблюдение осуществляется на всех фазах; б) сохраняется единая единица наблюдения на всех фазах; в) на каждой последующей фазе сокращается объем выборки и расширяется программа наблюдения; г) наблюдение может быть проведено либо по всем фазам одновременно, либо последовательно в разные сроки в зависимости от задач и удобства организации исследования. Иногда многофазная выборка сочетается с многоступенчатой выборкой. Взаимопроникающие выборки. Эти выборки могут быть получены делением общего объема выборки на равновеликие под- выборки путем проведения нескольких циклов механического отбора из уже сформированной выборки. Например, необходимо выборку объемом в 500 единиц разделить на 10 подвыборок. Объем каждой подвыборки составит 50 единиц. В первую под- выборку попадут единицы с порядковыми номерами: 1, 11, 21, 31,... ,491. Вторая подвыборка будет сформирована из единиц с порядковыми номерами: 2, 12, 22, 32, ... ,492. Последняя, десятая подвыборка будет состоять из единиц с порядковыми номерами: 10, 20, 30, ... ,500. Все подвыборки являются полноценными взаимно независимыми выборками, итоги по которым можно сравнивать между собой. Взаимопроникающие выборки удобно использовать, если обследование надо провести в несколько последовательных во времени этапов. Формирование взаимопроникающих выборок может быть применено, если, например, необходимо годовой объем выборки распределить на 12 равных по объему подвыборок с тем, чтобы проводить наблюдение ежемесячно, каждый раз по новому кругу единиц. Аналогичным образом можно сфор- 40
мировать четыре подвыборки для проведения ежеквартальных обследований. Две взаимопроникающие выборки позволяют быстро получить предварительные итоги: первую подвыборку обследуют для разработки предварительных итогов, вторая подвыборка обследуется позже и по ней получают основные итоги. Сопоставление итогов по разным подвыборкам позволяет оценить степень достоверности данных. Если значения показателей по разным подвыборкам не имеют существенных различий, то это подтверждает надежность результатов. Другое удобство использования взаимопроникающих выборок состоит в том, что есть возможность поручить обследование подвыборок разным независимым исполнителям. Повторная и бесповторная выборка. Эти понятия преимущественно математические, в практической статистике представлена, как правило, бесповторная выборка. Повторная выборка является математической моделью выборки, при которой каждая отобранная единица возвращается в исходную генеральную совокупность и существует потенциальная возможность повторного отбора одних и тех же единиц. Применительно к практике социально-экономических исследований проведение повторного отбора одних и тех же единиц в подавляющем большинстве случаев экономически нецелесообразно, и модель повторного отбора не используется. Однако математический аппарат повторной выборки, позволяющий производить расчеты в несколько упрощенной форме, при определенных условиях использовать правомерно. Малая выборка. Это понятие не связано с какими-либо особенностями технологии формирования выборочной совокупности и отличается лишь небольшим объемом выборочной совокупности. Границы малой выборки не установлены однозначно, обычно малой считается выборка объемом менее 30 единиц, иногда — менее 100 единиц. Выделение малой выборки как особой разновидности выборочного наблюдения продиктовано тем, что в условиях ограниченного числа единиц наблюдения использование таблицы интеграла вероятности Лапласа приводит к значительной погрешности при расчете ошибки репрезентативности. В связи с этим для расчета ошибки репрезентативности по малой выборке необходимо обращаться к таблице распределения Стьюдента. 41
1.4. Применение выборочного метода на разных этапах статистического исследования Выборочный метод может применяться на разных стадиях статистического исследования. В научном обиходе утвердилось понятие о выборочном методе как об одном из видов несплошного наблюдения, применяемого для получения достоверной информации о генеральной совокупности. При более строгом научном определении понятия «выборочный метод» следует признать, что: во-первых, основная область применения выборочного метода в социально-экономической статистике - это сбор первичной информации в выборочном порядке в целях последующего ее распространения на генеральную совокупность. Особой разновидностью данного направления применения выборочного метода являются выборочные контрольные обследования, проводимые непосредственно после сплошного наблюдения в целях выявления величины ошибок наблюдения. На основе этих данных определяются поправочные коэффициенты, по которым корректируются материалы сплошного обследования. Типичным примером могут служить проводившиеся в СССР контрольные обходы дворов, следовавшие за сплошной переписью скота в сельском хозяйстве. В современной социально-экономической статистике выборочный метод также применяется в целях проверки полноты и качества материалов сплошного учета. В частности, выборочный контроль используется в таможенной статистике для оценки масштабов теневого импорта и выполнения на основе таких оценок «досчета» данных до фактического уровня показателей. Для выборочного контроля отобрано 196 конкретных товаропотоков импорта. Выборочными проверками выявляются тенденции широко распространенной практики занижения таможенной стоимости путем манипулирования товарными кодами и ввоза больших партий товаров без оформления на таможне. В некоторых случаях импортеры завышают цены при занижении объема, что выгодно в отношении таких товаров, по которым таможенные сборы зависят не от стоимости, а от веса груза. При анализе выборочных данных по импорту потребительских товаров обнаружено, что самый высокий процент нелегаль- 42
ных поставок в Россию по «черным» (нелегальным, контрабандным) схемам характерен для товарной группы «одежда, обувь, трикотаж», где этот показатель составляет по обуви 82% от всего объема импорта обуви, по трикотажу - 79%, по одежде - 78%. В товаропотоках с преобладанием «серых» (полулегальных) схем импорта работа в правовом поле, т.е. «белый импорт», составляет от 2 до 14% по таким товарам, как лекарственные средства и препараты (12%), галантерейные товары из кожи (13%), посудомоечные машины и кондиционеры (2%)!. В целом по группе потребительских товаров теневой импорт превышает по стоимости официально зарегистрированный объем импорта. Применение выборочного метода на этапе сбора первичной информации по исследуемой проблеме сопряжено с задачей минимизации трех типов ошибок: а) случайных ошибок репрезентативности, величина которых может быть определена на основе методов математической статистики; б) ошибок регистрации, которые могут быть минимизированы благодаря более тщательной организации работ и более строгому контролю при ограниченной величине наблюдаемой выборочной совокупности; в) смещения структуры выборочной совокупности, которое может произойти при отступлении от установленного порядка отбора единиц из генеральной совокупности; во-вторых, выборочный метод может быть использован на этапе проектирования предстоящего статистического наблюдения в целях сбора первичной информации, не предназначенной и непригодной для последующего ее распространения на генеральную совокупность. Такой выборочный метод предназначен для подготовки к проведению в последующем статистического наблюдения и применяется обычно в сочетании с монографическим наблюдением. Типичными примерами подобного способа использования выборочного метода могут служить различного рода пилотные (пробные) обследования. Например, проведено выборочное об- 1 См.: Королев И.С, Жуковская В.М., Трофимова И.Н., Чертко Н.Т. «Зеркальная» статистика импорта потребительских товаров // Вопросы статистики. - 2007. - № 2. - С. 30. 43
следование в одном населенном пункте. Его материалы репрезентативны только для данного населенного пункта и не могут быть распространены на весь регион или всю страну. Цель пилотных (пробных) обследований состоит в предварительном ознакомлении с объектом будущего обследования или в апробации проектных разработок по вопросам организации и методики проведения планируемого обследования. Классический пример — пробные переписи населения. Крупной работой такого характера будет запланированное на 2009—2010 гг. пилотное обследование природоохранных расходов в отдельных субъектах РФ, на методологическую подготовку и проведение которого предусмотрено финансирование в объеме 1,8 млн руб.; в-третьих, выборочный метод может быть использован на этапе разработки итогов проведенного статистического наблюдения (сплошного или несплошного) в форме извлечения из уже собранных материалов наблюдения некоторой подвы- борки. Главная особенность данного варианта применения выборочного метода состоит в том, что: 1) его использование не связано с организацией статистического наблюдения; 2) сформированная выборочная совокупность может быть а) репрезентативной для генеральной совокупности, и результаты разработки данных распространяются на генеральную совокупность, разработка материалов проводится по сокращенной (при получении предварительных итогов) или более детальной программе, чем разработка всего массива единиц совокупности; б) репрезентативной для некоторой части генеральной совокупности, по которой требуется провести углубленный анализ, но материалы нерепрезентативны относительно всей генеральной совокупности. При данном способе использования выборочного метода задача заключается в том, чтобы из всего массива полученных при обследовании первичных данных в выборочном порядке сформировать некоторую совокупность единиц для проведения разработки итогов по особой программе. При формировании такой выборочной совокупности нет необходимости применять усложненные схемы отбора. Используется простой случайный или систематический отбор. Выборочная разработка материалов сплошного (несплошного) наблюдения может применяться в целях: а) ускоренного получения по сокращенной программе предварительных итогов обследования; б) получения дополни- 44
тельной информации с применением расширенной программы разработки итогов, построения сложных экономико-математических моделей с последующим распространением результатов на генеральную совокупность; в) проведения специализированной дополнительной разработки материалов по отдельно взятой территории или категории единиц совокупности; г) выполнения многовариантных поисковых экспериментальных расчетов в научных целях. Вариант а применяется в некоторых странах при разработке итогов переписей населения в целях быстрого получения предварительных итогов по наиболее важным показателям, не дожидаясь итогов основной разработки, что может дать опережение на 1—1,5 года. Примером варианта б может служить осуществленная при разработке итогов переписи населения 1959 г. пятипроцентная выборка семей из всего массива информации по стране. По этой выборочной совокупности был произведен анализ состава семей. Примером применения варианта в может служить проводимая иногда по инициативе геронтологов более детальная разработка материалов переписи населения о долгожителях — лицах старше 90 лет. Вариант г может найти, например, применение в целях апробации какой-либо новой экономико-математической модели. 1.5. Исторические корни выборочного метода в России Формирование основ научной теории выборочного метода происходило в основном в конце XIX — начале XX в. А.Г. Волков отмечает: «Теория и практика выборочного метода в нашей стране развивались независимо от Запада, а теоретическая мысль русских статистиков шла впереди западной»1. В 1919 г. Н.С. Четвериковым была опубликована статья «О выборочном исследовании»2, посвященная вопросам теории выборочного метода. В работе есть такое удивительно глубокое по своему смыслу выражение: «... выборочное исследование дает 1 Волков А.Г. Предисловие к русскому переводу книги Ф. Йейтса «Выборочный метод в переписях и обследованиях». — М.: Статистика, 1965. — С. 14. 2 Четвериков Н. О выборочном исследовании // Вестник статистики. — 1919. -N9 8-12. - С. 170. 45
благодарную возможность заглянуть в далекие тайники статистики не только как метода исследования, но и как своеобразного способа мышления и миропонимания» (курсив наш. — Э.В.). Развитие научной мысли в области теории выборочного метода стимулировалось практической потребностью в создании методического аппарата, способного обеспечить надежность и достоверность материалов несплошных обследований. Многочисленные опыты таких обследований часто приводили к неудовлетворительным результатам. Требовалось найти оптимальные способы извлечения выборки из состава генеральной совокупности, сформировать математический аппарат для измерения ошибок репрезентативности и предварительного определения необходимого объема выборочной совокупности. Сохранились свидетельства об одной из первых научно-методологических разработок, положивших начало теоретического обоснования и практического применения методов несплошного наблюдения, развившихся в последующем в теорию выборочного метода. Статистическим отделением Московского юридического общества в 1886 г. была избрана специальная Комиссия по выработке методологических основ местных статистических исследований. В 1887 г. состоялось совещание статистиков, на котором были приняты положения, непосредственно касающиеся начальных шагов в направлении создания теории выборочного метода: «По окончании и на основе сплошного описания крестьянского и частновладельческого хозяйства рекомендуется производить специальное обследование сельского хозяйства, промыслов и других сторон быта местного населения. Для выполнения таких обследований в каждом однородном районе губернии или уезда надлежит избрать по одному или по нескольку типичных селений и частных землевладений и подвергать их возможно полному и всестороннему описанию»1. Более продвинутыми были методические разработки, реализованные еще в 1876—1881 гг. в Терской области, основанные на идее обследования типических селений из однородных групп районов в целях замены им сплошного обследования. Идея о допустимости несплошного обследования и установление хотя бы в общем виде некоторых принципов отбора объек- 1 Гурьев А. Происхождение выборочного исследования и первые его опыты в России // Вестник статистики. — 1921. — № 1—4. — С. 16. 46
тов обследования прокладывали путь, ведущий к созданию научных основ выборочного метода. Очередной шаг в развитии методов частичного статистического наблюдения был сделан известным российским ученым- статистиком А.А. Кауфманом, который разработал и реализовал на практике принципы отбора, приближающиеся к выборочному методу. В период 1887-1900 гг. он организовал в нескольких уездах Западной Сибири обследование крестьянских хозяйств, методические основы которого были изложены в его сборнике статей «К вопросу о выборочном исследовании». Дальнейшее развитие элементы выборочного метода получили в научных трудах А.И. Чупрова, который в 1894 г. выступил на Подсекции Статистики IX «Съезда русских естествоиспытателей и врачей» с докладом на тему «О монографическом описании отдельных селений как способе дополнения и подновления основных земско-статистических исследований». Порядок отбора селений должен быть следующим. Опираясь на материалы проведенного ранее сплошного обследования, необходимо разделить уезды на округа и в каждом округе отобрать одно или несколько типичных селений. При выделении округов и выборе селений важно определить, какие именно признаки должны служить критериями их типичности. Таким образом, научная мысль приходила к признанию того, что частичные обследования могут применяться не только в дополнение к сплошному, но и как самостоятельное исследование взамен сплошного. Идеи проведения частичных обследований получили свое дальнейшее развитие на заседаниях Комиссии по вопросам организации земских статистических исследований Статистического отделения Московского юридического общества в начале 1898 г. Были приглашены земские статистики из разных губерний России. На заседании Комиссии был обсужден разработанный и принятый Самарским губернским земским собранием проект повторных обследований, в котором были развиты методологические положения, намеченные ранее А.И. Чупровым. По результатам обсуждения Статистическое отделение Московского юридического общества приняло постановление с рекомендациями по вопросам методологии обследования крестьянских хозяйств в земской статистике. Примечательно, что в прениях и 47
в самом постановлении прозвучали термины «выборочное описание», «выборочное исследование», хотя их интерпретация еще не была достаточно строгой в современном понимании. Очередным мероприятием в обсуждении российскими учеными проблем выборочного метода явился доклад В.Г. Громана на тему «О применении типического метода в текущей статистике», представленный им в 1900 г. на Комиссии по вопросам земской статистики. Основными достоинствами проекта В.Г. Громана являлись предложение о применении метода механического отбора и утверждение о необходимости получения массовых данных. В России в конце XIX в. существенным препятствием к признанию в научных кругах и внедрению в практику прогрессивных элементов выборочного наблюдения являлось традиционное представление о сплошном наблюдении как единственном надежном методе получения достоверных статистических характеристик. Принципиальное отличие от идеологии западной статистики состояло в том, что в России выборочное наблюдение рассматривалось преимущественно как дополнение к сплошному наблюдению, а на Западе при отсутствии практики сплошных обследований не возникало столь осторожного отношения к выборочному методу. Известный российский статистик А.И. Чупров был одним из первых убежденных сторонников массового внедрения прогрессивных методов выборочного обследования и автором научных трудов, содержащих теоретическое обоснование выборочного метода. К концу XIX в. в российской статистике сложилась определенная научная база и был накоплен практический опыт в области выборочного метода. Идеи выборочного метода, зародившиеся в российской статистике еще в 70-е гг. XIX в., развивались одновременно по двум направлениям, ведущим к единой цели (получение достоверных данных по всей совокупности), но с использованием разных методов формирования выборочной совокупности. В основе одного направления лежал принцип отбора типичных объектов. Другое направление основывалось на методе механического (систематического) отбора единиц. Начало научным основам закона больших чисел и теории вероятностей было положено еще в XVIII в. К концу XIX в. эта ветвь математической науки достигла высокого уровня развития. Большой вклад в математическую науку внесли выдаю- 48
щиеся русские математики П.Л. Чебышев, A.M. Ляпунов, А.А. Марков. Однако вытекающие из закона больших чисел и теории вероятностей методы математической статистики долгое время не находили своего применения в теории выборочного метода. Лишь в 1901 г. русский статистик В. Борткевич и вслед за ним в 1906 г. английский статистик А.Л. Боули раскрыли возможность использования теории вероятностей как мате- матико-статистической основы выборочного метода. Первые десятилетия XX в. были временем стремительного развития теории выборочного метода в нашей стране и на Западе. Главными особенностями этого периода явились научное обоснование и разработка приемов оценивания выборочных показателей на основе методов математической статистики. Одновременно совершенствовались и дифференцировались способы формирования выборочной совокупности, осуществлялся поиск наиболее эффективных приемов проектирования и организации выборочных наблюдений. Особенно большой вклад в развитие теории выборочного метода внесли русские ученые А.А. Чупров, А.Г. Ковалевский, А.А. Кауфман, Ю. Янсон. В последующие годы теория выборочного метода как один из разделов теории статистики стала активно развиваться. В 1908 г. было открыто распределение Стьюдента. В работе английских статистиков Дж. Э. Юла и М. Дж. Кендэла «Теория статистики» были развиты основы теории выборочного метода. В 1915 г. впервые в математической статистике Р.А. Фишером было введено понятие случайной выборки. Актуальные для нашего времени понятия «риск производства», «риск потребителя», позже обозначаемые в математической статистике как «риски ошибок», были впервые введены в научный оборот в 1925-1929 гг. Доджем и Ромигом в связи с разработкой ими теории выборочного метода применительно к задаче браковки партий изделий массового производства1. На протяжении последующих десятилетий статистики английской и американской школы, русские и французские математики обеспечили своими трудами большой прогресс математической статистики, включая теорию выборочного метода. 1 См.: Уилкс С. Математическая статистика / пер. с англ. — М.: Наука, 1967. - С. 405. 4 - 2394 49
После установления в 1917 г. советской власти в стране активно проводились статистические работы в целях сбора информации о наиболее важных экономических и социальных процессах. Существенная роль принадлежала в этих обследованиях выборочному методу. Данная тенденция отчетливо прослеживается на примере статистики сельского хозяйства. В 1917 г. была опубликована первая глава книги С.С. Кона «К вопросу о применении выборочного метода при разработке сельскохозяйственных переписей» (Петроград, издательство отдела переписи ЦСУ). В сентябре-октябре 1919 г. была проведена 10-процентная выборочная перепись крестьянских хозяйств. По 26 губерниям европейской части страны были получены данные о числе крестьянских хозяйств и численности населения в них, о поголовье лошадей и крупного рогатого скота, о посевных площадях1. В период с 1921 по 1929 г. проводились ежегодные весенние выборочные опросы крестьянских хозяйств, в ходе которых регистрировались данные о численности населения, о посевах по видам культур, о наличии скота по видам и группам животных. Выборочная совокупность формировалась методом механического отбора хозяйств. По двум показателям (размер семьи и площадь посева) проводилась оценка точности выборочных данных путем сопоставления с материалами сплошных налоговых списков. Центральное статистическое управление (ЦСУ) СССР проводило Всесоюзные статистические конференции, на которых, в частности, обсуждались вопросы организации выборочных обследований. Примером крупного локального выборочного обследования по крайне сложной проблеме может служить первое выборочное санитарно-демографическое обследование сельского населения Украины, проведенное в 1923 г. В этой уникальной работе нашла свое продолжение традиция санитарных описаний губерний, издавна практиковавшихся в России. Санитарно-гигиеническое обследование охватило 2% сельского населения Украины. Единицами отбора выступали сельские населенные пункты, т.е. отбор был гнездовым. В строго математическом смысле это обследование не было выборочным, 1 См.: Организация государственной статистики в Российской Федерации. - М.: Госкомстат России, 2004. - С. 294. 50
так как отбор селений производился не случайным методом, а путем определения наиболее типичных для каждого округа сельских населенных пунктов. Решения о выборе типичных селений принимались в окружных центрах на совещаниях санитарных врачей и статистиков. В первые годы действия советского режима в условиях жестко централизованной системы управления и острой потребности в социально-экономической информации широкое применение выборочного метода явилось средством преодоления дефицита информации, столь необходимой для принятия государственными органами управленческих решений. В целом в СССР выборочный метод в социально-экономической статистике широко применялся вплоть до 1930-х гг. По мере формирования в СССР единой системы планирования, учета и отчетности потребность в выборочных обследованиях стала снижаться. Выборочные наблюдения уже носили эпизодический характер и применялись в тех сферах, где объективно невозможно организовать текущий статистический учет и систематическую отчетность или необходимо получить оперативные данные, уточнить информацию, провести контрольные проверки. Сфера практического применения выборочного метода резко сузилась, что повлекло за собой свертывание научных разработок проблем выборочного метода. Интерес к теории и практике выборочных обследований возродился в СССР в 1960-е гг. На проведенном в 1954 г. научном совещании по статистике было акцентировано внимание на необходимости развития научных основ выборочного метода с использованием положений математической статистики. Широкомасштабным выборочным обследованием было статистическое наблюдение бюджетов рабочих, служащих и колхозников, охватившее около 0,1% семей. На основе метода основного массива регулярно проводилась регистрация цен и объемов продаж на колхозных рынках в наиболее крупных 250 городах страны. В 1956 и 1963 гг. были проведены выборочные обследования заработной платы работников предприятий. В 1958 г. ЦСУ СССР организовало единовременное выборочное обследование состава семей, доходов и жилищных условий 240 тыс. семей рабочих и служащих. Была сформирована двухступенчатая, стратифицированная по отраслевому признаку выборка. На первой ступени в отраслевом разрезе были под- 4* 51
готовлены списки предприятий, ранжированных по размеру средней заработной платы. Из этих списков производился механический отбор предприятий. На второй ступени в отобранных предприятиях осуществлялся механический отбор рабочих и служащих из списка персонала, ранжированного по размеру заработной платы. В СССР 60-е гг. XX в. были периодом, когда после десятилетий застоя в статистической науке и практике появилась возможность активизации статистических исследований. В частности, получило развитие такое направление работ, как проведение выборочных обследований в социально-экономической сфере. Выборочный метод применялся, если нужны были: • замена ряда сплошных обследований выборочными; • сбор дополнительной информации, отсутствующей в материалах сплошного учета; • получение предварительных итогов до разработки материалов сплошного учета; • экспериментальные обследования; • контрольные проверки точности материалов сплошного учета1. В 1967 г. Центральное статистическое управление (ЦСУ) СССР впервые провело выборочное обследование доходов и жилищных условий семей рабочих и служащих, в 1968 г. — выборочное обследование семей колхозников. По инициативе ученых научно-исследовательского института ЦСУ СССР программа этих обследований была дополнена вопросами о брачности и рождаемости2. Начиная с 1972 г. ЦСУ СССР стало регулярно, с периодичностью в три года, проводить выборочные обследования доходов, жилищных условий и демографических характеристик семей рабочих, служащих и колхозников. Объем выборки составлял около 300 тыс. семей. Применялся отраслевой принцип формирования выборки. Перечень единиц наблюдения составлялся на основе данных о персонале попавших в выборку предприятий и 1 См.: Организация государственной статистики в Российской Федерации. — М.: Госкомстат России, 2004. — С. 295. 2 Там же. - С. 260. 52
организаций. Такие обследования были проведены в 1972, 1975, 1978 и 1981 гг. Публикации итогов этих обследований были крайне ограничены, так как многие статистические данные были засекречены или были разрешены лишь к ограниченному использованию. Во второй половине XX в. в нашей стране стали регулярно с десятилетней периодичностью проводиться всеобщие переписи населения, в которых нашел применение выборочный метод. Первая послевоенная перепись населения 1959 г. примечательна тем, что выборочный метод был использован не на этапе наблюдения, а только при разработке итогов переписи. Была произведена пятипроцентная выборка информации о семьях, и на ее основе получены характеристики семейного состава населения страны. В условиях того времени, когда еще не были освоены технологии электронных средств обработки информации, применение выборки при разработке блока данных о семье позволило существенно сократить затраты времени и средств на этапе формирования итогов переписи. В последующих переписях 1970, 1979, 1989 и 2002 гг. применялся комбинированный метод наблюдения — совмещение сплошной и выборочной переписи. Так, при переписи 2002 г. программа сплошной переписи содержала 11 вопросов: родственное отношение к лицу, записанному первым в формуляре переписи; пол; дата рождения; состояние в браке; место рождения; гражданство; национальная принадлежность; владение языками; образование и обучение; источник средств к существованию; занятость и положение в занятии. В каждом четвертом жилом помещении (25-процентная выборка) проводилась выборочная перепись по расширенной программе. Она включала, кроме вопросов сплошной переписи, следующие вопросы: в какой отрасли экономики занят; какую основную продукцию производит предприятие, где занят опрашиваемый; совпадает ли территория места жительства и предприятия; вид выполняемой работы; о поиске работы теми, кто не имеет занятия; продолжительность проживания в месте жительства; число рожденных детей. Очередную перепись 2010 г. планируется провести, как и предыдущие, с использованием выборочного метода. В 2008 г. была проведена пробная перепись населения. 53
Контрольные вопросы 1. В чем состоят слабые стороны анкетного несплошного обследования? В каких случаях допустимо его применение? 2. При каких условиях уместен цензовый метод наблюдения? 3. Чем обусловлено расширение практики выборочных обследований в современной России? 4. В чем состоят принципиальные различия между ошибками репрезентативности и ошибками регистрации? 5. Перечислите основные принципы и особенности выборочного метода. 6. На каких этапах исследования и в каких целях может применяться выборочный метод? 7. Определите основные различия между простой и серийной выборками. 8. Какие существуют разновидности стратифицированной выборки, при каких условиях более предпочтительно применять каждую из них? 9. Что понимается под отбором сериями, каковы его преимущества и слабые стороны? 10. Чем обусловлена практика комбинирования разных видов выборки? 11. Что понимается под малой выборкой? 12. Каковы особенности применения выборочного метода на этапе разработки итогов статистического наблюдения? 13. В чем заключается преимущество стратифицированного отбора с оптимальным размещением выборки? 14. Когда и в каких формах проводились несплошные обследования в России в XIX в.? 15. В каких формах и когда применялся выборочный метод в СССР в XX в.? Глава 2 ОРГАНИЗАЦИЯ ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЙ Выборочное обследование — сложный комплекс последовательно выполняемых статистических процедур, требую- 54
щих разнообразных профессиональных знаний и практических навыков. Некачественное выполнение какой-либо одной процедуры, даже если все остальное сделано безупречно, обесценивает работу в целом. 2.1. Основные процедуры при организации выборочных обследований К числу наиболее существенных процедур организационного характера при выборочном наблюдении относятся: 1. Определение и обоснование проблемы, которую необходимо исследовать с применением статистических методов. Четкая постановка целей обследования особенно важна при проведении больших комплексных работ, так как при множестве решаемых частных задач есть опасность утратить общую целевую направленность операций, допустить смещение приоритетов и даже принять решения, расходящиеся с исследуемой проблемой. 2. Установление базисных условий исследования: заказчик, исполнитель, пользователи, сроки, источник финансирования. 3. Определение генеральной совокупности, по которой необходимо получить первичную информацию для решения задач исследования. Установление границ генеральной совокупности во времени и в пространстве, определение единицы совокупности (наблюдения). В социально-экономических исследованиях задача определения объекта наблюдения нередко может иметь несколько решений. Необходимо либо обосновать выбор одного из возможных объектов, либо проводить наблюдение параллельно по нескольким объектам. Так, методологией переписей населения предусматривается сбор информации по двум категориям единиц наблюдения — индивидам и домохозяйствам. Немалые трудности могут возникнуть при определении четких границ изучаемой совокупности. Например, при переписи населения необходимо установить, что понимается под домохозяйством. Если в квартире проживают две родственные^ семьи, имеющие частичную общность бюджета, то следует их считать одним или двумя домохозяйствами? Необходимо сформулировать единые правила, позволяющие отграничить одно домохозяйство от другого или определить, по какому месту жительства 55
переписывать лиц, зарегистрированных по одному адресу, а фактически проживающих по другому адресу. 4. Обоснование необходимости и возможности сбора первичной информации на основе выборочного метода с учетом задач исследования, необходимой достоверности результатов, располагаемых ресурсов времени, финансирования, кадровой обеспеченности. 5. Определение исходных параметров и условий предстоящего выборочного наблюдения: экспертная оценка необходимого уровня точности выборочных данных, расчет необходимого объема выборочной совокупности, определение вида выборки и способа ее формирования, составление плана работ. 6. Подготовка основы выборки, представляющей полный перечень единиц генеральной совокупности, из которой производится извлечение единиц выборочной совокупности. 7. Разработка программы наблюдения и инструментария; методологическое и ресурсное обеспечение. 8. Осуществление работ по проведению выборочного обследования. 9. Обработка полученных материалов выборочного обследования, анализ результатов, представление информации пользователям. Перечисленные процедуры можно укрупнить и свести к трем этапам: проектирование выборки, наблюдение, обработка материалов выборочного наблюдения. На каждом этапе возникают специфические организационно-методологические вопросы, от качественного уровня решения которых зависит точность итоговых данных. 2.2. Проектирование выборочного обследования Исключительно ответственным этапом работ по организации выборочного обследования является проектирование {планирование) будущего статистического наблюдения. Допущенные на этом этапе ошибки могут обесценить результаты всей последующей работы. На этапе планирования выборочного обследования выполняют: • определение цели и задач исследования; • определение исследуемой генеральной совокупности, ее границ во времени и в пространстве; 56
• составление программы наблюдения и программы разработки итогов; • определение требований к степени точности и надежности достоверности материалов выборочного наблюдения (допустимые пределы ошибок репрезентативности, вероятность, с которой гарантируется этот результат); • расчет необходимого объема выборочной совокупности; • определение вида выборки; • определение единицы отбора; • определение способа сбора необходимой информации (опрос, непосредственное наблюдение, саморегистрация и др.); • формирование основы выборки; • отбор и составление перечня подлежащих обследованию единиц; • в случае необходимости — проведение пилотного (пробного) обследования; • составление плана кадрового, финансового и материально-технического обеспечения; • составление календарного графика работ с указанием ответственных за его исполнение; • разработку инструментария; • составление сводного плана контрольных мероприятий. • в случае необходимости — согласование проекта выборочного обследования с заказчиками и пользователями. Сложность выполнения указанного перечня подготовительных работ состоит в том, что они тесно взаимосвязаны и принимаемые решения по всем вопросам должны быть взаимно согласованными. Например, расчет объема выборки возможен лишь после того, как определены требования к достоверности материалов. Объем выборки надо также согласовать с размерами финансирования, потребностью в кадрах, продолжительностью периода обследования. Затраты на выполнение работ определяются не только объемом выборки, но и трудоемкостью заполнения формуляра наблюдения, т.е. размерами и сложностью программы наблюдения. При выполнении отдельных видов работ разными исполнителями принимаемые ими решения должны систематически взаимно согласовываться. Если решения по отдельным разделам проекта выборочного обследования принимаются в некоторой 57
последовательности во времени, то требуется их увязка с ранее принятыми решениями, что нередко сопровождается корректировкой ранее принятых решений. Одним из существенных вопросов является предварительное определение того, какие виды объектов будут выступать в качестве единиц в основе выборки, что явится единицами отбора и что - единицами наблюдения. При решении этих вопросов необходимо учитывать: задачи исследования, используемый вид выборки, наличие и характер информации по генеральной совокупности. Единица основы выборки - это вид объектов, принятых в качестве единиц, по которым приводится информация в полном перечне единиц генеральной совокупности, именуемом основой выборки. Единицей отбора является единица наблюдения или группа единиц наблюдения (серия), принятая за базу при формировании выборочной совокупности. Единицами наблюдения выступают единицы совокупности, подлежащие обследованию при проведении статистического наблюдения. Эти три категории единиц могут совпадать, но могут быть различными. Например, при выборочной переписи населения, совмещаемой со сплошной всеобщей переписью населения России, единицей основы выборки и единицей отбора является жилое помещение (квартира, отдельный дом), а единицами наблюдения являются домохозяйство и индивиды. При обследованиях населения по проблемам занятости, например, единицей основы выборки является счетный участок по переписи населения 2002 г. Единицами отбора служат счетные участки (на первой ступени отбора) и домохозяйства (на второй ступени отбора), так как выборка является многоступенчатой и на каждой ступени применяется своя единица отбора. Единицами наблюдения являются члены отобранных домо- хозяйств в возрасте от 15 до 72 лет. Цели и задачи исследования должны быть четко сформулированы заказчиком или руководством, ответственным за выполнение текущих и стратегических планов организации. Каждое выборочное обследование осуществляется в целях получения информации по какой-либо актуальной проблеме развития экономики страны или региона, развития конкретной сферы народного хозяйства или социальной жизни. 58
Так, например, выборочное обследование 2007 г. «Семья и рождаемость» проводилось в целях информационного обеспечения федеральных и региональных целевых программ, направленных на решение основных вопросов поддержки рождаемости в семьях, улучшения условий их жизни, охраны здоровья, создания предпосылок для увеличения ожидаемой продолжительности жизни. Одновременно достигается вторая цель - участие России в реализации международной программы «Семья и рождаемость». Для достижения поставленных целей в ходе выборочного статистического наблюдения должны быть получены материалы по таким направлениям исследования, как анализ причин низкой рождаемости, изучение отношения семей к мерам демографической политики, характеристика репродуктивного здоровья населения, оценка мотиваций семейной жизни и др. Весь цикл работ по проведению выборочного обследования должен быть подчинен достижению поставленной цели. Цель и задачи должны быть реальными, т.е. обеспечены достаточным объемом финансирования и иными ресурсами. Все вопросы технологии подготовки выборочного обследования разрабатываются параллельно, чтобы была возможность их текущих согласований. Исходя из цели исследования, определяют круг единиц, составляющих генеральную совокупность. Для этого необходимо установить, в пределах каких территориальных границ представлен объект исследования (страна, субъект РФ, конкретный город и др.) и на какую дату, за какой период времени должна быть получена информация. В зависимости от целей исследования и реальных условий выборочное обследование по времени проведения может быть организовано как текущее, периодическое или единовременное. В каждом случае предусматривается свой порядок организации работ. Методические аспекты дифференциации видов выборочного наблюдения по времени проведения такие же, как и при сплошном наблюдении. Если проводится текущее выборочное обследование, то его организационно-методологические основы определяются на начальном этапе, когда впервые вводится в практику статистических работ данный вид обследования. Во все последующие сроки сохраняется изначальный порядок работ, хотя при необходимости могут быть внесены отдельные уточнения и коррективы. Работы выполняются постоянным составом исполните- 59
лей и по устоявшейся схеме при относительном постоянстве состава единиц выборочной совокупности. Специальным методическим вопросом текущего статистического наблюдения является необходимость периодической ротации (обновления) состава выборочной совокупности. Одна из возможных моделей ротации — ежегодная 25-процентная замена единиц совокупности, в результате чего полная смена их состава происходит каждые четыре года. При ротации выборочной совокупности соблюдаются принципы выборочного метода. Необходимость ротации обусловлена тем, что при длительном пребывании в положении объекта статистического наблюдения в единицах наблюдения происходят постепенные качественные изменения и они перестают отвечать требованию репрезентативности. Так, например, для семей участие в бюджетных обследованиях является дисциплинирующим фактором, воспитывающим умение планировать и наиболее разумно распоряжаться своими денежными средствами. Кроме того, со временем возникает эффект «усталости» и соответственно нежелание оставаться в дальнейшем объектом обследования. Но действие этого фактора существенно лишь в условиях, когда участие в выборочном обследовании предполагает добровольное на это согласие объекта обследования (семьи, индивида). При обследовании организаций, предприятий участие в обследовании отобранных единиц является обязательным. Наконец, единицы совокупности в процессе своей жизнедеятельности видоизменяются, возникают новые типы единиц совокупности, постепенно сокращается доля единиц некоторых типов. В процессе ротации происходят корректировка состава выборочной совокупности и поддержание соответствия ее состава меняющемуся составу генеральной совокупности. Периодическое выборочное наблюдение является повторяющимся во времени. Чем короче промежутки времени между последовательными датами наблюдения (квартал, полугодие), тем в меньшей степени требуется корректировка организационно- методического комплекса. Обследование приближается по своему характеру к текущим наблюдениям. Возникает, в частности, необходимость ротации выборки. Если обследования проводятся с интервалом в несколько лет, то неизбежны существенные корректировки в связи с измене- 60
нием условий работы, возникновением новых подходов к решаемым задачам, развитием научной базы. При каждом новом обследовании выборочная совокупность обычно формируется заново. Программа наблюдения и программа разработки итогов обычно существенно обновляются при обязательном сохранении преемственности, обеспечивающем возможность отслеживания динамики характеристик совокупности. Единовременное выборочное наблюдение проводится в тех случаях, когда возникает проблема эпизодического характера. Такие выборочные обследования являются наиболее трудоемкими и дорогостоящими, так как требуется проведение всего комплекса подготовительных работ при одноразовом использовании его результатов. Сумма затрат на единицу получаемой информации при единовременном выборочном обследовании значительно выше, чем при текущем или периодическом наблюдении. Отсутствует возможность динамических сопоставлений. Единовременный характер выборочного обследования сказывается и на качестве решений, принимаемых по организационно-методическим вопросам. Из-за отсутствия предшествующего опыта аналогичных работ выше вероятность принятия неточных и ошибочных решений. В связи с этим особенно важно на подготовительном этапе провести пилотное (пробное) обследование. В единовременном порядке может быть проведено одноразовое углубленное исследование по расширенной программе в дополнение к наблюдению, проводимому в текущем или периодическом режиме. В таких условиях отсутствует повышенная нагрузка на подготовительном этапе, поскольку в основном применяются уже сформированный организационно-методический комплекс и существующая выборочная сеть единиц совокупности. В соответствии с целью и задачами выборочного обследования определяют, на базе какой генеральной совокупности будет формироваться выборочная совокупность, устанавливают территориальные границы генеральной совокупности и момент (либо период) времени, по состоянию на который следует получить выборочные данные, дают точное и однозначное определение единицы совокупности (единицы наблюдения). Ответы на все эти вопросы необходимы для избежания «засорения» выборочной совокупности посторонними единицами 61
и избыточной информацией и для предупреждения случаев потери, недобора необходимой информации. Не следует смешивать два разных понятия - единицы совокупности (единицы наблюдения) и единицы отбора. Единицы совокупности являются непосредственными носителями необходимой исходной информации, в них протекает исследуемый процесс, именно они выступают в качестве единиц наблюдения, в отношении которых осуществляется сбор первичной информации. Единицей отбора может быть единица совокупности или группа единиц совокупности, например серия (гнездо), но в обоих случаях при выборочном наблюдении данные регистрируются относительно единиц совокупности. Например, при изучении проблем занятости населения единицей отбора может быть домохозяйство, но программа обследования и регистрация данных ориентированы на единицы совокупности — на взрослых членов домохозяйства. В отдельных случаях при комплексном исследовании проблемы возможно совмещение в одном выборочном обследовании изучения двух совокупностей, например, домохозяйств и членов домохозяйств. Такой подход актуален при изучении бюджетов семей и определении уровня жизни населения. По семьям получают информацию о совокупном доходе семьи, о ее жилищных условиях, обеспеченности предметами длительного пользования, транспортными средствами и др. В отношении каждого члена семьи необходима информация о виде занятий, уровне образования, о получаемых доходах и т.д. В этом случае единицами отбора являются семьи, а единицами совокупности (единицами наблюдения) - и семьи, и члены семей. Составление программы наблюдения и программы разработки итогов осуществляется в соответствии с целью и задачами исследования. Программой наблюдения является конкретный перечень вопросов, на которые должны быть получены ответы по каждой единице наблюдения при проведении обследования и которые составляют содержание формуляра наблюдения. В программе наблюдения должны быть представлены все вопросы, по которым необходима информация для полноценного анализа изучаемой проблемы. Не следует включать в программу вопросы второстепенные, дублирующие друг друга, не относящиеся непосредственно к исследуемой проблеме, чтобы не перегружать программу избыточной информацией. Строгий 62
отбор только самых необходимых вопросов, включаемых в формуляр наблюдений, позволяет избежать неоправданного завышения стоимости и трудоемкости работ, удлинения сроков работы, увеличения количества ошибок. Наличие программы наблюдения необходимо для оценки общей трудоемкости работ по заполнению формуляров наблюдения, что, в свою очередь, согласовывается с проектными показателями объема финансирования, потребности в кадрах регистраторов, продолжительности периода проведения обследования. Программой разработки итогов является перечень итоговых показателей, которые предстоит вычислить по материалам проведенного выборочного обследования. Программа разработки итогов обычно представлена в виде схем разработочных таблиц, систематизированных в определенном порядке с учетом комплекса задач исследования. Разработочные таблицы содержат обобщенные показатели, которые, в свою очередь, будут использованы для построения более сложных числовых индикаторов и для экономико-математического моделирования. Вся эта разнообразная информация должна лечь в основу аналитических разработок, выводов, заключений, рекомендаций, отвечающих сформулированным на начальной стадии цели и задачам исследования. Программа наблюдения и программа разработки итогов обследования должны разрабатываться одновременно и взаимно согласовываться, что обеспечивает максимальную эффективность использования первичной информации — не будет собираться практически бесполезная информация и не окажутся отсутствующими необходимые исходные данные. Одним из важнейших вопросов, решаемых на этапе проектирования выборочного наблюдения, является определение требований к степени достоверности материалов обследования (допустимые пределы ошибок репрезентативности, вероятность, с которой гарантируется этот результат). Решение по этим вопросам принимается с учетом допустимых рисков пофешности итоговых показателей. Чем теснее связь исследуемой проблемы с жизненно важными процессами, с явлениями, способными привести к катастрофическим последствиям, тем более жесткими должны быть требования к точности получаемой при обследовании информации. Например, предельно высокой точностью 63
должны отличаться данные выборочного контроля химического состава лекарственных средств, изготавливаемых на основе веществ, содержащих сильнодействующие яды. Столь же жесткие требования предъявляются к контролю качества деталей самолетов, космических аппаратов. Несколько менее жесткими являются требования к точности экономических показателей. В статистике общественных мнений допустимые пределы ошибок выборки находятся еще в более широком диапазоне. Решения по вопросу о допустимых пределах ошибок выборки принимаются на уровне высшего руководства проектом на базе научно обоснованных рекомендаций и экспертных оценок специалистов. Трудность заключается в том, что со стороны нескольких пользователей итоговой информацией могут предъявляться разные требования к степени точности и надежности материалов. Для разных итоговых характеристик предусматривается разная степень их детализации по территории, по числу выделяемых групп, по числу признаков, участвующих в многомерных группировках. Неоднозначность ситуации состоит в том, что итоги выборочного обследования будут представлены системой показателей большого объема и для разных групп показателей различны требования к степени их точности и надежности. В зависимости от допустимых пределов ошибок выборки определяется объем выборочной совокупности. Последний должен отвечать требованиям к качеству материалов выборки с позиций всей системы итоговых показателей. Используемые характеристики степени точности выборочных показателей должны иметь четкую содержательную интерпретацию. Это требование актуально в связи с возможной разной профессиональной специализацией потребителей (заказчиков) и исполнителей работ по проведению выборочного обследования. Расчетные процедуры и реализацию плана выборочного обследования осуществляют профессионалы-статистики. Решение вопроса о необходимой степени точности результатов в значительной мере зависит от оценок экспертов, являющихся специалистами в исследуемой сфере экономики или социальной жизни, однако далеко не всегда владеющих знаниями в области методологии выборочного наблюдения. При планировании объема выборки необходимо избегать как заниженной численности обследуемых единиц, при которой не 64
обеспечивается необходимая точность результатов, так и избыточной их численности, что ведет к необоснованному увеличению затрат на выполнение работ. На основе принятых решений о допустимых пределах ошибок выборки, доверительной вероятности и иных требованиях производится расчет необходимой численности выборочной совокупности, определяются вид выборки и способ отбора единиц наблюдения. Объем выборки рассчитывается по формулам, дифференцированным в зависимости от вида выборки. В качестве исходных данных используется информация о допустимом пределе ошибки выборки, о доверительной вероятности, об объеме генеральной совокупности, о дисперсии, оценивающей степень неоднородности генеральной совокупности. Учитываются также требования минимизации затрат на обследование и запланированная степень детализации информации при разработке итогов обследования. При расчете необходимого объема выборки на этапе ее проектирования нередко возникают трудности из-за отсутствия необходимых исходных данных. В таких случаях прибегают к специальным приемам косвенной оценки недостающих данных или к упрощенным способам расчета. Если неизвестен объем генеральной совокупности, то возможны два решения. Обычно в таких случаях за объем генеральной совокупности принимается его приближенная величина, но не ниже максимально возможной, чтобы избежать риска заниженного против необходимого объема выборки. При полной неопределенности в отношении объема генеральной совокупности приходится применять для расчета необходимого объема выборки модель повторного отбора. Это заведомо обеспечивает достаточный объем выборки, но есть опасность значительного избыточного объема и неоправданного завышения суммы затрат. Нередко оказывается невозможным рассчитать необходимый объем выборочной совокупности именно для того вида выборки, который будет практически использован, из-за отсутствия необходимой информации. В таких случаях расчет производится по более простым формулам. Но такой путь требует большой осторожности. Необходимо оценить, в каких масштабах будет завышен или занижен действительно необходимый объем выборки. 5-2394 65
Наибольшие трудности возникают при расчете необходимого объема выборки из-за отсутствия достоверных данных о величине дисперсии исследуемых признаков. Математическая модель расчета предполагает использование данных о дисперсии признаков по генеральной совокупности, что практически возможно крайне редко и лишь по какому-либо отдельному признаку, не по всем исследуемым характеристикам. Но и по выборочной совокупности дисперсия неизвестна, так как расчет производится на стадии проектирования предстоящего обследования. Наилучшим способом определения величины дисперсии является проведение пилотного (пробного) обследования и получение приближенной величины показателя дисперсии. Можно применить косвенные методы оценки величины дисперсии признаков. Для этого обращаются к материалам проведенных ранее обследований по аналогичной проблематике и аналогичным совокупностям объектов. Возможно использование экспертных оценок специалистов. При невозможности получения таких косвенных оценок используют формально-математический подход. При оценках дисперсии показателя доли принимается его максимально возможное значение, соответствующее значению доли 0,5. Для оценки дисперсии средних величин ее величина на основе закона нормального распределения принимается равной одной третьей части предполагаемого среднего значения признака. Расчет необходимого объема выборки следует производить для всех или большинства наиболее значимых выборочных показателей доли и средних величин. Результаты расчетов могут значительно различаться из-за разной величины дисперсии и разных требований в отношении меры точности каждого показателя. По результатам расчетов экспертным путем принимается решение о необходимом объеме выборки. В качестве критерия выбора может быть принят объем выборки, необходимый для получения репрезентативных данных по наиболее важному для данного исследования показателю. Другой подход состоит в использовании максимального из полученных значений объема выборки. Возможно определение некоторой осредненной величины из необходимого объема выборки по группе наиболее значимых показателей. 66
Принятие решения о виде выборки осуществляется с учетом задач исследования, наличия и содержания информации о составе генеральной совокупности, ее общем объеме, степени ее однородности и характере территориального размещения. Например, серийная выборка должна использоваться, если необходимо исследовать процессы и взаимосвязи в пределах серий. При значительном рассредоточении генеральной совокупности по территории следует применять многоступенчатую выборку. Стратифицированная выборка неуместна при малом объеме генеральной совокупности или при высокой степени однородности генеральной совокупности. При очень малой доле отбора из генеральной совокупности можно упростить расчеты выборочных показателей, применив математическую модель повторной выборки. Целесообразно предварительно подготовить несколько вариантов решений по вопросу об определении вида выборки, чтобы сделать аргументированный, научно обоснованный выбор с учетом преимуществ и недостатков каждого варианта и экспертных оценок специалистов. Обязательным блоком вопросов подготовительного этапа являются составление плана кадрового, финансового, материально-технического обеспечения, разработка календарного графика работ с указанием ответственных за его исполнение. При определении исполнителей работ необходимо установить конкретное распределение функций и центров ответственности за отдельные разделы и за всю работу в целом. При выборочном наблюдении эти вопросы решаются в таком же порядке, как при сплошном наблюдении. Специфика выборочного обследования состоит в том, что вследствие резкого сокращения, по сравнению со сплошным обследованием, общего объема работ уменьшается, соответственно, объем затрат труда и финансовых ресурсов. Вместе с тем выборочное обследование предполагает выполнение ряда достаточно сложных и ответственных операций, отсутствующих в условиях сплошного наблюдения, что сопровождается некоторыми дополнительными затратами. Так, потребуется привлечение специалистов, имеющих теоретико-методологическую подготовку и практические навыки в области проектирования и проведения выборочного обследования. В смете расходов необходимо предусмотреть затраты, связанные с получением вспомогательной информации о составе 5* 67
генеральной совокупности, с выполнением комплекса расчетных процедур по определению ряда выборочных показателей при подготовке обследования и при разработке его итогов. Календарный график работ составляется, как обычно при проведении статистического наблюдения, но в сравнении со сплошным обследованием отдельными позициями выделяются процедуры, необходимость в которых возникает только при выборочном обследовании. По каждому пункту плана предусматриваются: содержание операции, срок начала и окончания, исполнители и ответственные, дополнительная информация (специальные условия, требования и др.). Составление сводного плана контрольных мероприятий в основе своей совпадает с содержанием этой работы при сплошном обследовании. В качестве дополнительных контрольных мероприятий, характерных только для выборочных обследований, необходимо предусмотреть: 1) независимую экспертизу технологических и методологических решений по предстоящему выборочному обследованию (если это признано необходимым со стороны заказчика или исполнителя проекта); 2) непосредственно в процессе обследования — контроль за соблюдением установленной схемы отбора единиц наблюдения и проверку правильности решения вопросов, возникающих в случае невозможности получения информации по единицам, подлежащим обследованию; 3) при разработке итогов выборочного наблюдения — проверку правильности методики расчета выборочных показателей. Часть контрольных мероприятий может выполняться вручную, часть — с использованием современных информационных технологий. 2.3. Основа выборки Широкое внедрение выборочных статистических наблюдений требует, в первую очередь, решения такой методической проблемы, как формирование базы данных по полному перечню единиц генеральной совокупности. Наиболее полноценными источниками такой информации являются материалы сплошных Всероссийских переписей хозяйствующих субъектов и населения. В соответствии с программой развития государственной 68
статистики на период 2007-2011 гг. одной из крупнейших работ станет создание на основе информационного массива Всероссийской переписи населения 2002 г. территориальной выборки многоцелевого назначения, на базе которой, в свою очередь, будут формироваться выборочные совокупности для проведения конкретных федеральных выборочных наблюдений. При подготовке к каждому предстоящему выборочному обследованию необходимо обеспечить наличие списка единиц генеральной совокупности, из числа которых по установленной схеме будет производиться отбор единиц выборочной совокупности. Такой перечень единиц генеральной совокупности именуется основой выборки. Например, при изучении качества образовательных услуг в сфере высшего профессионального образования генеральной совокупностью выступают все высшие образовательные учреждения страны. Основой выборки является полный перечень высших образовательных учреждений, содержащий адресные данные и, по возможности, краткие сведения о каждом из них. В качестве основы выборки используются уже имеющиеся информационные ресурсы в виде регистров, массивов данных по ранее проведенным статистическим наблюдениям, материалов оперативного учета. При обследованиях населения чаще всего используют материалы последней Всероссийской переписи населения. Качественной основой выборки, в которой единицей совокупности является человек, в будущем может стать Государственный автоматизированный регистр населения (ГАРН), который планируется создать в обозримом будущем. Для проведения локальных обследований отдельных категорий населения могут быть использованы данные регистрации населения по месту проживания, списки избирателей, телефонные справочники, материалы учета персонала предприятий и организаций и др. Качество основы выборки определяется следующими обстоятельствами: • соответствие вида единиц совокупности задаче исследования; • полнота охвата всех единиц изучаемой совокупности; • отсутствие в основе выборки посторонних объектов, не относящихся к исследуемой совокупности; • возможность идентификации и отграничения тех категорий единиц, которые подлежат изучению в данном конкретном 69
исследовательском проекте при использовании основы выборки многоцелевого назначения; • информация о составе и характеристиках единиц совокупности не должна быть устаревшей; • регулярная актуализация, т.е. своевременное обновление и соответствие информации текущему составу генеральной совокупности, реальному состоянию единиц совокупности (при длительном использовании основы выборки); • унифицированность по содержанию, форме записи, единицам измерения содержащегося в основе выборки перечня характеристик единиц совокупности; • наличие в основе выборки, помимо адресных данных, некоторых существенных признаков единиц совокупности является крайне ценным ее качеством, так как позволяет применить более сложные виды выборочного наблюдения и произвести на стадии проектирования выборки более точные расчеты; • основа выборки должна быть представлена в виде электронной базы данных. Необходимо обеспечить конфиденциальность информации, удобство работы с материалами, автоматизацию основных процедур (актуализации, извлечения выборочной совокупности и др.). Выборочные обследования хозяйствующих единиц в российской статистике уже обеспечены достаточно качественной информацией для формирования основы выборки — Единым государственным регистром предприятий и организаций (ЕГРПО) и рядом других автоматизированных баз данных. Одной из актуальных задач государственной статистики в области организации статистических наблюдений в Российской Федерации является совершенствование научно-методологической базы и прикладных разработок по формированию основ выборки для большого числа проводимых в стране обследований. Оптимальные результаты могут быть достигнуты при условии создания основ выборки многоцелевого назначения, чтобы не приходилось подбирать заново основу выборки для каждого конкретного обследования. Тем самым обеспечиваются унификация методик, повышение эффективности и качества работ по формированию выборки, расширение сферы применения современных информационных технологий в организации выборочных наблюдений. 70
Все многообразие объектов выборочных социально-экономических обследований подразделяется на две группы — население и субъекты хозяйственной деятельности. Соответственно необходимо иметь две системы баз данных, которые могут быть использованы в качестве основы выборки. Каждая из этих баз данных должна отвечать таким критериям качества, как полнота и достоверность данных, методологическое единство, возможность применения информационных технологий в работе с базой данных, систематическая актуализация базы данных, доступность для пользователей. В российской государственной статистике существуют и используются в практике выборочных обследований указанные два типа баз данных. При изучении различных аспектов хозяйственной деятельности в качестве материалов для создания основы выборки используются данные ЕГРПО. Для обследований населения основа выборки формируется по материалам последней Всероссийской переписи населения. Рассмотрим более детально каждую из этих баз данных. Единый государственный регистр предприятий и организаций (ЕГРПО) как база формирования основы выборки. На основе ЕГРПО создается база данных — «Генеральная совокупность объектов статистического наблюдения», являющаяся основой выборки, т.е. информационной системой, построенной на единых методологических и программно-технологических принципах. Общий порядок создания и ведения этой базы данных предусмотрен методологическими положениями по статистике РФ1. В качестве единицы генеральной совокупности выступают хозяйствующие субъекты, осуществляющие свою деятельность на территории Российской Федерации, прошедшие государственную регистрацию и обязанные представлять в органы государственной статистики статистическую и (или) бухгалтерскую отчетность: • юридические лица; • филиалы и представительства юридических лиц; • хозяйствующие субъекты без права юридического лица (индивидуальные предприниматели). «Генеральная совокупность объектов статистического наблюдения» имеет сложную структуру. В ее состав входят два разде- 1 См.: Методологические положения по статистике. Вып. 3. — М.: Госкомстат России, 2000. - С. 29-40. 71
ла: территориальный раздел с данными по каждому субъекту РФ и отраслевой раздел, в котором объекты систематизированы по основному виду деятельности. Пользователями отраслевых разделов «Генеральной совокупности объектов статистического наблюдения» являются на федеральном уровне подразделения Росстата и на региональном уровне - подразделения территориальных органов государственной статистики. На базе «Генеральной совокупности объектов статистического наблюдения» создаются субрегистры объектов: • субрегистр организаций розничной и оптовой торговли; • субрегистр «Строительные организации»; • субрегистр «Сельскохозяйственные товаропроизводители». Указанные субрегистры используются в качестве основы выборки для формирования выборочных совокупностей при организации выборочных обследований в сферах торговли, строительства, сельскохозяйственного производства. Унифицированной схемой формирования данных, содержащихся в «Генеральной совокупности объектов статистического наблюдения», по каждому объекту предусмотрен учет по состоянию на две даты — на начало отчетного года и на последнюю дату актуализации информационного фонда (без блока экономических показателей). В «Генеральной совокупности объектов статистического наблюдения» представлены следующие блоки информации: 1. Наименование и код по Общероссийскому классификатору предприятий и организаций. 2. Коды по общероссийским классификаторам административно-территориального деления, органов государственной власти и управления, отраслей народного хозяйства, видов экономической деятельности, форм собственности и организационно-правовых форм. 3. Адрес, дата государственной регистрации, ИНН, данные о наличии лицензии на право занятия определенным видом деятельности и другая справочная информация. 4. Экономические показатели — среднесписочная численность персонала, выручка от реализации продукции (работ, услуг). 5. Прочая технологическая и нормативно-справочная информация. 72
«Генеральная совокупность объектов статистического наблюдения» создается и используется органами государственной статистики как инструмент, предназначенный для реализации следующих задач в области методологии и организации статистических работ (в том числе выборочных обследований)1: • формирование перечня объектов (выборочных совокупностей) для конкретных статистических наблюдений; • сбор и анализ информации по сопоставимому кругу объектов; • определение единого круга объектов наблюдения в разрезе отраслей экономики; • установление стандартного перечня характеристик по единицам наблюдения; • разработка и применение единых программных средств, введение единого порядка формирования выборочной совокупности и координация выборок. Функциональная направленность деятельности служб государственной статистики по ведению «Генеральной совокупности объектов статистического наблюдения» состоит в следующем. А. Центральный аппарат Росстата осуществляет: • общее методологическое руководство и координацию работ по формированию и ведению «Генеральной совокупности объектов статистического наблюдения»; • ведение копий «Генеральной совокупности...» федерального уровня для: а) формирования списочных основ выборки по предстоящим обследованиям; б) оптимизации объемов выборки по РФ в целом и в разрезе регионов; в) уточнения весов выборочных единиц наблюдения при получении сводной информации; • координацию использования информационных ресурсов пользователями отраслевых разделов «Генеральной совокупности...». Б. Главный межрегиональный центр обработки и распространения статистической информации (ГМЦ) Росстата осуществляет: • формирование, ведение и хранение «Генеральной совокупности...» в полном объеме; См.: Методологические положения по статистике. Вып. 3. — С. 30. 73
• взаимодействие с территориальными органами государственной статистики по формированию и ведению «Генеральной совокупности...»; • хранение на технических носителях информации, полученной от территориальных органов государственной статистики для актуализации «Генеральной совокупности...»; • информационно-справочное обслуживание пользователей «Генеральной совокупности...»; • обеспечение защиты содержащейся в «Генеральной совокупности...» информации от несанкционированного доступа. В. Территориальные органы государственной статистики осуществляют в отношении соответствующих территориальных разделов «Генеральной совокупности...» следующие функции: • формирование, ведение и хранение территориального раздела «Генеральной совокупности...»; • сбор и представление информации на технических носителях в ГМЦ Росстата для формирования и ведения «Генеральной совокупности...» на федеральном уровне; • информационно-справочное обслуживание пользователей территориального раздела «Генеральной совокупности...»; • обеспечение защиты содержащейся в территориальном разделе «Генеральной совокупности...» информации от несанкционированного доступа; • организация формирования и ведения районных (городских, муниципальных) разделов «Генеральной совокупности...» (при наличии соответствующего решения территориального органа государственной статистики). Под ведением «Генеральной совокупности...», осуществляемым органами государственной статистики, понимается выполнение следующих операций: 1) ежеквартальная актуализация информационного фонда (учет изменений, связанных с созданием новых или ликвидацией ранее функционировавших организаций, структурным преобразованием организаций, сменой вида деятельности и др.); 2) внесение изменений, связанных с изменениями нормативного, методологического, программно-технологического обеспечения. При формировании «Генеральной совокупности...» на новый отчетный год используются данные по состоянию на 1 января соответствующего года. Источником информации на реги- 74
ональном уровне служат данные ЕГРПО. На федеральном уровне формирование «Генеральной совокупности...» на новый отчетный год осуществляется путем слияния ее территориальных разделов. Формирование многоцелевой основы выборки на базе материалов всеобщих переписей населения. Проводимые в стране обследования населения в целях изучения демографических, социальных, экономических процессов объединяет то, что в качестве объекта наблюдения в них выступает население — индивиды, брачные пары, семьи, домохозяйства. В этих условиях целесообразно сформировать единую для всех обследований населения основу выборки, используя уже имеющиеся массивы информации по генеральной совокупности, представленные материалами переписей населения. Крупномасштабное использование в качестве основы выборки данных переписи населения было осуществлено в нашей стране при проведении микропереписей населения в межпереписные периоды. Материалы переписи населения 1979 г. явились основой выборки при проведении микропереписи 1985 г., охватившей 5% населения страны. Вторая микроперепись, для которой основой выборки стали материалы переписи населения 1989 г., состоялась в 1994 г. Данные переписи населения 1989 г. были представлены на электронных носителях, что существенно облегчило процедуру отбора. В 1991 г. была проведена одноступенчатая пятипроцентная многомерная (стратифицированная) выборка счетных участков переписи 1989 г. В 1992 и 1993 гг. была осуществлена актуализация данной выборки. Сформированная на основе материалов переписи 1989 г. выборка использовалась: • для формирования подвыборки в целях проведения обследований населения по проблемам занятости, которые осуществляются с 1992 г. по настоящее время; • при проведении микропереписи населения 1994 г.; • для создания подвыборки в целях обследований бюджетов домашних хозяйств, проводимых по территориальному принципу с 1996 г. по настоящее время; • для проведения других статистических обследований населения. Использование материалов переписи в качестве основы выборки для построения многоцелевой выборки предполагает ре- 75
шение сложного комплекса методических и организационных вопросов. Данная проблема была тщательно проанализирована в статье сотрудников Росстата Т.М. Чернышевой и Г.Е. Шевер- довой1. Материалы этой публикации очень важны для понимания технологии использования переписных материалов в целях формирования выборки населения, поэтому рассмотрим основные положения данной работы. Как отмечают авторы статьи, на основе материалов переписи населения 2002 г. необходимо создать территориальную многоцелевую выборку, предназначенную как для крупномасштабных, так и для локальных обследований населения по самым различным проблемам. Решение такой задачи было предусмотрено Программой развития государственной статистической системы до 2005 г.2 Формирование многоцелевой выборки населения «позволит: • повысить эффективность работ по построению подвыбо- рок для проведения множества обследований населения по различной тематике, снизить нагрузку на респондентов (в частности, за счет формирования полностью непересекающихся единиц наблюдения или частично пересекающихся, но в разные временные периоды), облегчить процедуру актуализации основы выборки, координации и ротации выборочных совокупностей; • усовершенствовать план выборки и ее методологический аппарат как для проведения обследования бюджетов домашних хозяйств, так и для квартальных обследований населения по проблемам занятости; • создать в перспективе высококвалифицированный корпус интервьюеров и минимизировать затраты на его содержание за счет сокращения трудовых и финансовых ресурсов на постоянное обучение новых интервьюеров, контроль их работы и повышение качества первичной информации»3. 1 См.: Чернышева Т.М., Шевердова Г.Е. Создание территориальной выборочной сети многоцелевого назначения на основе материалов Всероссийской переписи населения 2002 года // Вопросы статистики. —2006. - № 12. - С. 16-23. 2 Организация государственной статистики в Российской Федерации. - М.: Госкомстат России, 2004.- С. 286. 3 Там же. - С. 287. 76
Чтобы соответствовать своему назначению, выборка населения должна наиболее полно отражать структуру населения каждого региона и быть достаточно большого объема. При этих условиях на базе главной выборки может быть сформирован ряд подвыборок, варьирующих в зависимости от задач конкретных обследований, особенностей изучаемых совокупностей и требований к степени точности результатов. Указанные требования важны также в связи с необходимостью ротации выборки, т.е. систематической частичной замены единиц совокупности. Многоцелевая территориальная выборка населения должна обеспечивать получение репрезентативной информации на уровне субъектов РФ раздельно по городскому и сельскому населению. В статье Т.М. Чернышевой и Г.Е. Шевердовой изложены принципы, общий порядок и результаты работ по данному направлению развития выборочного метода. Основные принципы и особенности построения территориальной выборочной сети многоцелевого назначения при использовании материалов переписи населения в качестве основы выборки состоят в следующем: • изучаемой совокупностью является постоянное население, проживающее в частных домохозяйствах на территории субъектов РФ; • используется централизованный порядок формирования выборочной совокупности; • выборочный массив предназначен для использования в течение нескольких лет в целях организации разных по своей структуре и назначению крупномасштабных обследований населения в межпереписной период; • использование многоцелевой территориальной выборки населения способствует повышению качества получаемой статистической информации; • достигается значительная экономия затрат на формирование выборочной совокупности по сравнению с иными методами построения выборки населения за счет использования готовой основы выборки; • обеспечена возможность реализации моделей (схем отбора) различной степени сложности при формировании выборки и подвыборок, в том числе многоступенчатой схемы создания подвыборок; • имеются необходимые условия для ротации подвыборок, т.е. периодического замещения части единиц совокупности; 77
• обеспечена возможность формирования резервных выборочных массивов единиц, предназначенных для замены единиц наблюдения, оказавшихся по тем или иным причинам недоступными для обследования; • обеспечена возможность получения репрезентативных данных в пределах достаточно крупных административно-территориальных единиц; • наличие возможности использования при формировании выборки разных единиц отбора — переписных участков, инструкторских участков, счетных участков, жилых помещений, до- мохозяйств, индивидов; • снижена роль субъективного фактора при осуществлении процедур по формированию выборки. Цикл работ, связанных с созданием и использованием многоцелевой территориальной выборки населения, включает ряд операций, которые можно подразделить на несколько блоков. Предварительно необходимо осуществить комплекс научно- методологических разработок, включающих: 1) оценку состояния информационного массива переписи 2002 г.; 2) определение единицы отбора и единицы наблюдения; 3) выбор вида выборки и способа отбора; 4) определение объема выборки, критериев точности и достоверности выборочных показателей; 5) создание универсального программного обеспечения для выполнения всего круга операций с использованием информационно-коммуникационных технологий (ИКТ); 6) определение порядка применения коэффициентов взвешивания при распространении выборочных данных на генеральную совокупность; 7) подготовку плана крупномасштабных и локальных статистических наблюдений с использованием многоцелевой выборочной сети и др. Материалы переписи населения не могут быть непосредственно в своем первоначальном виде использованы в качестве основы выборки. Необходимо предварительно на начальном этапе работ подготовить и упорядочить электронную версию массива первичных данных переписи 2002 г., на базе которой будет сформирована основа выборки. При этом учитываются принятые правила и методика выполнения последующих процедур. Далее осуществляется одна из ключевых операций — формирование основы выборки в виде электронной таблицы. В практике Росстата основа выборки населения по материалам 78
переписи 2002 г. получила рабочее название «первичный информационный фонд (ПИФ)». За первичную единицу в основе выборки принят счетный участок, который станет единицей отбора при извлечении выборочной совокупности из основы выборки. Учитывая многоцелевой характер создаваемой выборочной сети, в основу выборки включена также информация о других возможных единицах отбора — инструкторских и переписных участках, о жилых помещениях и домохозяйствах. В основе выборки представлена информация по основным вопросам переписи населения (пол, возраст, уровень образования, национальность, источник средств к существованию, наличие приносящей доход или заработок работы, размер домашнего хозяйства, тип жилого помещения). Это необходимо для проведения многомерной стратификации генеральной совокупности. Данные о структуре генеральной совокупности понадобятся при построении стратифицированной выборки и подвыборок. Следующей задачей является обеспечение надлежащего хранения основы выборки, при котором должны быть обеспечены защита от несанкционированного доступа, условия для осуществления отбора единиц при формировании выборочной совокупности и необходимые предпосылки для текущей работы с основой выборки. Наиболее ответственной процедурой является процесс отбора счетных участков из основы выборки, т.е. формирование территориальной выборочной сети многоцелевого назначения. В соответствии с принятым порядком выполнения этой операции отбор производится способом систематического (механического) отбора по принципу «серпантина». Принцип серпантина заключается в том, что территориальные единицы (районы) в электронной таблице основы выборки расположены в строгой последовательности географического их расположения с севера на юг в направлении с запада на восток и с востока на запад. При этом каждый следующий район должен иметь общую границу с предыдущим районом. Объем выборки счетных участков должен соответствовать принятым ранее методическим решениям по этому вопросу, в которых учтены следующие обязательные требования и условия: • обеспечение заданной точности результатов всех обследований, которые будут проводиться на базе многоцелевой выборочной сети; 79
• влияние степени неоднородности выборочной совокупности на величину ошибок репрезентативности; • возможность при формировании подвыборок использовать единицы отбора разного уровня (счетные, инструкторские и переписные участки); • обеспечение возможности ротации единиц в подвыборках при использовании единиц отбора разного уровня (счетных, инструкторских и переписных участков); • обеспечение возможности разграничения годового объема подвыборки на несколько непересекающихся подмножеств (взаимопроникающие подвыборки) для проведения обследования с ежеквартальной или иной внутригодовой периодичностью. В соответствии с перечисленными требованиями установленная доля отбора составляет 20% от общего числа счетных участков в генеральной совокупности. Это составило по данным переписи населения 2002 г. 74,3 тыс. счетных участков, в том числе 49,3 тыс. по городскому населению и 25,0 тыс. по сельскому. Единая выборочная сеть многоцелевого назначения структурируется по территориальному принципу таким образом, чтобы в качестве самостоятельных массивов были представлены данные по каждому субъекту РФ с разграничением районов, а в районах - с выделением городского и сельского населения. Каждый из этих выборочных массивов должен составлять 20% от соответствующего массива в составе генеральной совокупности. Вся процедура такого отбора счетных участков из стратифицированной основы выборки осуществляется по схеме одноступенчатой механической выборки, формируемой в централизованном порядке с применением информационно-коммуникационных технологий. При проведении механического (систематического) отбора счетных участков соблюдаются следующие правила: • при условии 20-процентной выборки единый шаг отбора счетных участков составляет пять единиц; • точка начала отбора, т.е. определение порядкового номера первой единицы выборочной совокупности, в первом интервале (шаге отбора) устанавливается в случайном порядке. Во всех последующих интервалах сохраняется данная точка отбора. Например, при 20-процентной выборке (шаг отбора — 5), если 80
из первых пяти единиц в случайном порядке была отобрана четвертая единица, то последующие единицы выборочной совокупности будут иметь в основе выборки порядковые номера: 9, 14, 19, 24, 29 и т.д.; • отбор единиц осуществляется автоматически с использованием соответствующего программного обеспечения, благодаря чему достигаются высокая точность и скорость выполнения данной операции; • выполнение всех процедур и их конечный результат подвергаются обязательному контролю. Проверяются правильность организации работ, соблюдение установленных правил и методик. Одним из приемов контроля является подсчет числа оставшихся в основе выборки неотобранных единиц, которые должны составлять 80% от всего объема генеральной совокупности в пределах каждого территориального подразделения и каждой страты. Рассмотренный цикл работ по созданию территориальной выборочной сети многоцелевого назначения на основе материалов переписи населения 2002 г. стал осуществляться Росстатом после проведения переписи 2002 г. Как указывают Т.М. Чернышева и Г.Е. Шевердова, в 2003 г. Росстатом были разработаны алгоритмы построения основы выборки и программное обеспечение по его реализации1. В территориальных органах государственной статистики по каждому субъекту РФ была проведена систематизация административно-территориальных единиц по «серпантинной» технологии. В 2005 г. были сформированы в разрезе субъектов РФ электронные таблицы структурных характеристик генеральной совокупности населения по данным переписи 2002 г. Таким образом была создана основа выборки. Следующим этапом работы должен стать описанный выше комплекс операций по созданию и ведению территориальной выборочной сети многоцелевого назначения. Но их выполнение в силу ряда причин было приостановлено. Тем не менее уже созданная основа выборки была востребована и использо- 1 См.: Чернышева Т.М., Шевердова Г.Е. Создание территориальной выборочной сети многоцелевого назначения на основе материалов Всероссийской переписи населения 2002 года // Вопросы статистики. — 2006. - № 12. - С. 23. 6-2394 81
вана для формирования выборочных совокупностей при проведении ряда статистических наблюдений. В частности, материалы основы выборки были использованы для создания выборки при проведении в 2006 г. в Тверской области локального обследования населения по теме «Семья и рождаемость», которым было охвачено более 500 семей. Завершая рассмотрение вопроса об основе выборки, следует отметить, что качество материалов выборочного обследования в немалой степени определяется способом формирования и состоянием информационной системы, которая служит базой для формирования состава выборочной совокупности. В условиях, когда выборочный метод все шире внедряется в практику государственной статистики и становится полноценной альтернативой сплошному наблюдению за самыми различными социально-экономическими процессами, создаются объективные предпосылки для формирования и использования многоцелевых информационных систем, выполняющих функции основы выборки и пригодных для применения на протяжении длительного периода времени. Так, выборочная сеть, сформированная на базе материалов переписи населения, должна функционировать в течение всего межпереписного периода, составляющего 10 лет. Создание многоцелевой основы выборки представляет сложный, трудоемкий и дорогостоящий комплекс работ, сравнимых по своей значимости с разработкой национальных проектов. Однако полезный эффект от эксплуатации основы выборки значительно превосходит затраты на создание и ведение данной информационной системы. 2.4. Способы формирования выборочной совокупности Формирование выборочной совокупности осуществляется по схеме, соответствующей избранному виду выборки. Так, при стратифицированной выборке следует предварительно сгруппировать единицы генеральной совокупности и производить отбор автономно из каждого выделенного типа (группы, слоя). При серийной выборке единицей отбора служит группа единиц совокупности. 82
Отбор единиц для формирования выборочной совокупности следует производить в сроки, минимально отдаленные от даты начала обследования, чтобы информация не устарела. Чем продолжительнее интервал времени между датами формирования выборочной совокупности и началом обследования, тем больше вероятность того, что часть единиц окажется выбывшей из состава данной генеральной совокупности и при обследовании они не будут найдены, а новые единицы окажутся не представленными в выборочной совокупности. Это чревато смещением структуры выборочной совокупности относительно структуры генеральной совокупности и увеличением размера ошибки выборки. При составлении списка единиц выборочной совокупности необходимо вносить в них всю имеющуюся в основе выборки существенную информацию о единицах совокупности по единой схеме. В современной практике составление списков производится в автоматизированном режиме. Основа выборки представлена компьютерной базой данных. Отбор осуществляется по специальным программам с применением электронных технологий. Классическая теория выборочного метода предусматривает возможность применения двух равноценных по своим результатам способов отбора единиц наблюдения — случайного отбора и систематического (механического) отбора. Техникой случайного отбора является отбор по жребию. Но жеребьевка в чистом виде при значительном числе единиц совокупности очень трудоемкая операция. Поэтому используются специальные приемы отбора, в полной мере обеспечивающие эффект случайного отбора. Случайный отбор можно произвести, используя математическую таблицу случайных чисел, в которой представлены результаты проведенного случайного отбора при строгом соблюдении принципа случайности. В качестве таблиц случайных чисел можно также использовать таблицу мантисс десятичных логарифмов. Чтобы произвести отбор с помощью таблицы случайных чисел, следует предварительно пронумеровать единицы генеральной совокупности. Затем произвести отбор единиц по приведенному ниже порядку. 6- 83
Предположим, что необходимо из генеральной совокупности объемом в 7567 единиц отобрать в случайном порядке 3% единиц. Единицы генеральной совокупности будут иметь номера от 1 до 7567. Объем выборки при трехпроцентной доле отбора должен составить 227 единиц. Таблица случайных чисел содержит пятизначные числа (см. приложение 1). Но так как объем нашей генеральной совокупности выражается четырехзначным числом, мы будем работать только с первыми четырьмя знаками случайных чисел. Начало отбора по таблице случайных чисел определяется произвольно. Порядковые номера подлежащих обследованию единиц генеральной совокупности должны соответствовать последовательности случайных чисел в таблице. При этом необходимо пропускать номера, превышающие число 7567, поскольку в генеральной совокупности нет единиц с такими номерами. Отбор продолжается до тех пор, пока не будет сформирована выборочная совокупность нужного объема — 227 единиц. В таблице случайные числа располагаются по строкам и столбцам. Ниже приведен фрагмент таблицы случайных чисел, начинающийся со строки 50. 72335 82037 92003 34100 29879 46613 89720 13274 49280 88924 35779 00283 81163 07275 89863 02348 61870 41657 97468 08612 98083 97349 20775 45091 43898 65923 25078 86129 78496 97653 91550 08078 Отобранными окажутся единицы со следующими порядковыми номерами: 7233, 3410, 2987, 4661, 1327, 4928, 3577, 28, 727, 234, 6187 и т.д. Отбор надо продолжать, пока объем выборочной совокупности не будет доведен до 227 единиц. Для этого потребуется обращение к продолжению таблицы случайных чисел за пределы того небольшого фрагмента, который здесь представлен. При отборе были пропущены числа, превышающие число 7567: 8203, 9200, 8972, 8892, 8986 и т.д. Систематический (механический) отбор является одной из разновидностей направленного отбора. Мнения специалистов о соотношении случайного и механического отбора по основным критериям достаточно близки. Н.К. Дружинин утверждал, что хотя систематический отбор и не опирается на законы случая, 84
но при соблюдении необходимых мер против смещения выборки может быть с успехом применен1. Уильям Кокрен утверждал, что эффективность систематического отбора очень сильно зависит от особенностей совокупности. Существуют такие совокупности, систематический отбор из которых дает высокую точность2. Френк Йейтс отмечал, что систематический отбор из списков оказывается вполне удовлетворительным, если принимать меры к тому, чтобы в списке не было никакой правильной повторяемости, связанной с интервалом отбора3. Официальная интерпретация сущности систематического отбора в современной российской статистике сформулирована в публикации Росстата «Методологические положения по статистике», где сказано, что при систематическом отборе затруднено получение несмещенной оценки выборочной дисперсии и что при систематическом отборе обычно применяются оценочные формулы простого случайного отбора4. Механический отбор производится в систематическом порядке строго через равные интервалы из общего списка единиц наблюдения. Систематический отбор удобен при планировании и извлечении выборки и находит широкое применение в статистической практике. При механическом отборе величина интервала (шаг отбора) рассчитывается путем деления числа единиц в генеральной совокупности на число единиц в выборочной совокупности. Например, при отборе 100 единиц из 2000 шаг отбора составит 20. Если в ответе получено дробное число, то применяется переменный шаг отбора. Например, при отборе 400 единиц из 2600 шаг отбора составляет 6,5. Следовательно, необходимо чередовать интервалы 6 и 7. Возможен и более сложный случай. Если шаг отбора составил, например, 12,25 единицы, то необходимо применить следующее чередование длины шага отбора: 12, 12, 12, 13//12, 12, 12, 13 и т.д. 1 См.: Дружинин Н.К. Выборочное наблюдение и эксперимент. — М, 1977,- С. 169. 2 См.: Кокрен У. Методы выборочного исследования. — М., 1976. — С. 227, 233. 3 См.: Йейтс Ф. Выборочный метод в переписях и обследованиях. — М., 1965. - С.56-57. 4 См.: Методологические положения по статистике. Вып. 3. — М., 2000. -С.18. 85
Точками отбора единиц в пределах шага отбора могут быть: начало интервала, конец интервала, середина интервала. Последний вариант считается более предпочтительным. В первом из приведенных выше примеров при отборе с «полушага» в выборку попадут единицы со следующими порядковыми номерами: 10, 30, 50 и т.д. Точка отбора может быть также определена путем случайного ее выбора в первом интервале, что считается более корректным в методическом отношении. Вопрос о степени точности результатов выборочного обследования при механическом отборе единиц не имеет однозначного ответа. Систематическая выборка может дать результаты более точные, чем расслоенная случайная выборка, но иногда может сопровождаться большой ошибкой репрезентативности. Это зависит от особенностей строения генеральной совокупности и порядка расположения единиц в основе выборки. Систематический отбор можно применять без опасений, если единицы генеральной совокупности в основе выборки расположены в случайном порядке. При этом принцип случайности реализуется благодаря тому, что случайным является нахождение единиц в точках отбора. Существует математическое доказательство того, что при совершенно случайном порядке расположения единиц в основе выборки в среднем систематический отбор эквивалентен простому случайному отбору1. Но достичь строго случайного порядка расположения единиц в списке практически невозможно. Ближе всего к идеалу случайной последовательности единиц является алфавитный порядок. В целом принято считать, что систематический отбор из списков дает вполне удовлетворительные результаты. Систематический отбор не соответствует принципу случайного отбора только в тех редких случаях, когда числовые значения изучаемого признака в упорядоченном списке единиц генеральной совокупности меняются циклически и период колебания совпадает с интервалом отбора. Иногда механический отбор сравнивают с гнездовой и стратифицированной выборкой. Действительно, общим у них является разграничение генеральной совокупности на группы. Но 1 Математическое доказательство — см.: Ко крен У. Методы выборочного исследования / пер. с англ.; под ред. А.Г. Волкова. - М.: Статистика, 1976. - С. 233-235. 86
способы и цели такого разграничения различны. При классической модели гнездовой выборки гнезда (серии) представляют собой многочисленные, неравные по своей величине естественные сообщества единиц — домохозяйства, учебные группы в вузах, населенные пункты, административные районы. Если выборка является стратифицированной, то ограниченное число страт (слоев, типов) получают путем группировки с выделением качественно различных, неравных по величине социально-экономических типов единиц. При механической выборке применяется строго формализованная процедура последовательного по списку единиц разделения генеральной совокупности на большое число равновеликих групп. Разным является и порядок отбора единиц в выделенных группах. Гнездовой отбор предполагает сплошное обследование единиц в пределах отобранных гнезд, за исключением тех случаев, когда применяются сложные модели выборки и гнездовой метод используется на определенных ступенях многоступенчатой выборки. При стратифицированной выборке в пределах каждой страты проводится простая случайная или механическая выборка. Механический отбор состоит в извлечении по одной единице из каждой группы с фиксированной точкой отбора. Требует своего решения вопрос о способе регистрации данных при выборочном наблюдении. Как известно, существует ряд способов фиксирования первичной информации: специально подготовленные переписчики записывают ответы на вопросы программы обследования со слов респондентов, респонденты сами вписывают ответы в формуляры обследования в присутствии переписчика, организации представляют отчетность по установленной форме, телефонный опрос, респонденты по почте высылают заполненные формуляры, специальная аппаратура регистрирует необходимые параметры и др. Выборочное обследование распространяется на ограниченную часть генеральной совокупности, что позволяет применять методы получения информации, обеспечивающие более высокое качество заполнения формуляров наблюдения. При специально организованных выборочных обследованиях предпочтение обычно отдается экспедиционному методу наблюдения, при котором переписчики (интервьюеры) посещают респондентов и с их слов записывают ответы. Приведенные выше краткие положения о технических аспектах формирования выборочной совокупности носят общий харак- 87
тер и при принятии решений по организационно-методическим вопросам должны быть конкретизированы с учетом особенностей того или иного выборочного обследования. Существует ряд специфических условий выборочного наблюдения, требующих особого подхода к определению способа отбора единиц. Существенно различается порядок формирования выборочной совокупности при единовременных и периодических статистических обследованиях. При проведении единовременных обследований необходимо осуществлять полный цикл всех организационных мероприятий, включая формирование перечня единиц выборочной совокупности. Составленный перечень подлежащих обследованию единиц является инструментом разового пользования. Из этого следует, что необходимо произвести определенные затраты ресурсов на выполнение данной операции, а полученный результат при отсутствии практического опыта выполнения подобных процедур может оказаться недостаточно качественным. В связи с этим при подготовке к проведению единовременных обследований обычно предварительно реализуют пилотный проект в целях апробации инструментария и плана организационных мероприятий, а также обучения руководящих кадров предстоящего обследования. При этом целесообразно реализовать несколько схем отбора единиц и на основе анализа полученных результатов выбрать оптимальный вариант. Схема отбора единиц совокупности определяется видом выборки. Известно, что каждый вид выборки отличается как рядом преимуществ, так и имеет свои слабые стороны. Принятые при планировании выборки гипотетические суждения о наилучшем в конкретных условиях виде выборки не всегда подтверждаются на практике. Необходимо в рамках пилотного обследования проверить эффективность намеченного порядка формирования выборочной совокупности. При проведении текущих или периодических выборочных наблюдений весь цикл операций по проектированию, апробации и формированию состава выборочной совокупности осуществляется лишь на начальном этапе обследования. В последующем может производиться корректировка выборки и периодически по сложившейся технологии осуществляться замена (ротация) единиц совокупности. Преимуществами текущих и периодических выборочных обследований с точки зрения организационно-методического обеспечения являются: 88
• низкая величина удельных расходов (в расчете на массив получаемой информации) на организационно-методическое обеспечение; • возможность систематического совершенствования организационно-методической базы выборочного обследования; • формирование постоянного контингента интервьюеров и руководящего персонала обследования, имеющих опыт работы и обеспечивающих высокое качество материалов наблюдения. К существенным достоинствам текущих и периодических выборочных обследований относятся также: а) возможность изучения объектов в их развитии; б) повышение общего уровня достоверности выборочных данных. Применение периодических выборочных обследований порождает ряд требующих своего решения методических вопросов: 1. Выбор оптимальной периодичности сбора информации. 2. Определение сроков ротации выборки. 3. Выбор метода ротации состава выборочной совокупности. Оптимальная периодичность сбора информации определяется с учетом таких факторов, как: а) необходимость более полной регистрации всех существенных изменений в наблюдаемых признаках единиц совокупности, что возможно при более кратких интервалах времени между отдельными обследованиями; б) необходимость экономии затрат и, соответственно, задача выбора максимально возможных интервалов времени между отдельными обследованиями; в) способность и готовность объектов наблюдения представлять информацию с установленной периодичностью. Рыночные цены относятся к наиболее подвижным экономическим параметрам, поэтому выборочные обследования цен производятся с высокой частотой, хотя и по предельно краткой программе. Износ производственного оборудования происходит размеренно, предсказуемо, и интервал времени между отдельными операциями по переоценке основных фондов является достаточно длительным. Определение частоты проведения обследований взаимосвязано с вопросом о степени сложности и объеме программы наблюдения. При более частых обследованиях программа должна быть сравнительно краткой. Если требуется получать информацию по обширной программе, то этого можно достичь за счет увеличения интервалов времени между обследованиями. Эти два 89
подхода могут быть совмещены: регулярные обследования по краткой программе и через более длительные интервалы времени — наблюдения по расширенной программе. Сроки ротации выборки устанавливаются с учетом следующих обстоятельств, затрудняющих получение достоверной информации от единиц выборочной совокупности при сохранении неизменным ее состава: 1) при неоднократном предоставлении информации по одним и тем же вопросам у респондентов возникает «реакция отторжения» - нежелание оставаться далее объектом наблюдения; 2) в ходе обследования внимание респондентов привлекается к регистрируемым процессам и поведенческим актам, что может со временем изменить стандарты их поведения и принятия решений, в результате чего обследуемая совокупность становится непредставительной и материалы обследования содержат все большую погрешность; 3) любые объекты материального мира подвержены изменениям, следовательно, наблюдаемая выборочная совокупность со временем может оказаться по своим качественным характеристикам не соответствующей характеристикам генеральной совокупности; 4) систематически в генеральной совокупности происходит смена состава - возникают новые единицы, другие единицы прекращают свое существование, и фиксированная выборочная совокупность все более отличается по своему составу от генеральной совокупности. Особый характер имеет подход к формированию массива единиц наблюдения при проведении пилотных (пробных) обследований. Главной особенностью пилотных обследований, как уже ранее было сказано, является то, что результаты наблюдения не предназначены для получения информации, пригодной к распространению на генеральную совокупность. Их цель — апробация инструментария и плана организационно-методических мероприятий предстоящего обследования. В соответствии с общепринятой классификацией обследования такого типа, как пилотные наблюдения, относятся к монографическим несплошным обследованиям. Порядок формирования обследуемого массива при пилотных обследования следующий: 1. На основе экспертных оценок специалистов производится отбор двух-трех территориальных единиц или иных крупных 90
серий единиц. Их выбор может определяться несколькими соображениями. В одних случаях стремятся провести пилотное обследование на территориях или иных подразделениях генеральной совокупности, наиболее типичных для изучаемой генеральной совокупности. В других ставится задача проверить эффективность подготовленного организационно-методического обеспечения предстоящего обследования при работе с разными типами объектов, особенно с объектами с экстремальными характеристиками. 2. В пределах отобранных крупных серий может быть проведено: а) сплошное обследование всех единиц совокупности; б) формирование репрезентативной для данной территории выборки; в) произвольный (без строгой схемы) отбор заданного числа единиц совокупности. При использовании вариантов а) или б) материалы пилотного обследования являются репрезентативными для соответствующей территориальной единицы и могут быть использованы в аналитических целях. Рассмотрим несколько примеров формирования обследуемого массива единиц при проведении пилотных обследований. В российской практике каждой всеобщей переписи населения предшествует пробная перепись в нескольких субъектах РФ. Отбор является двухступенчатым: экспертным методом отбираются субъекты РФ, а в каждом из них — один из административных районов или населенных пунктов. В пределах административного района (населенного пункта) проводится сплошная пробная перепись населения. В 1997 г. в целях подготовки к проведению Всероссийской переписи населения 1999 г. (которая не состоялась) была осуществлена пробная перепись с охватом следующих территорий: • Октябрьский район г. Ижевска Удмуртской республики; • г. Алейск и Алейский район Алтайского края; • Аксайский район Ростовской обл.; • Рыбновский район Рязанской обл. При подготовке Всероссийской переписи населения 2002 г. пробная перепись была проведена в нескольких регионах России. В связи с предстоящей Всероссийской переписью населения 2010 г. была организована подготовка к проведению пробной переписи в 2008 г. 91
В 2007 г. проведено выборочное обследование «Семья и рождаемость». Предварительно в феврале—апреле 2006 г. Федеральной службой государственной статистики было проведено пилотное обследование в трех регионах России: Нижегородской обл., Республике Марий Эл и в Тверской обл. В первых двух регионах отбор семей был произвольным. В Тверской обл. было проведено репрезентативное обследование семей — опрошено 1035 чел., в том числе 488 женщин, 396 мужчин и 151 подросток. В Нижнем Новгороде был опрошен 201 чел., в том числе 96 женщин, 65 мужчин и 40 подростков. В Республике Марий Эл было опрошено 187 чел., в том числе 91 женщина, 67 мужчин и 29 подростков. Опрашивались следующие категории населения: • состоящие в браке (зарегистрированном или незарегистрированном) женщины репродуктивного возраста, их мужья и дети-подростки в возрасте 15-17 лет; • незамужние матери и их дети-подростки в возрасте 15— 17 лет. Программа обследования была согласована с Минздравсоц- развития России, Минэкономразвития России, Институтом социально-экономических проблем народонаселения, Центром демографии и экологии человека Института народнохозяйственного прогнозирования Российской академии наук. В результате обследования были получены материалы о рождаемости по более широкому кругу вопросов, чем информация, содержащаяся в данных сплошного текущего учета естественного движения населения. Были разработаны итоги пилотного обследования. Таким образом, помимо основной цели — апробации организационно- методологических основ предстоящего выборочного обследования, пилотное обследование в Тверской области позволило получить также ценную информацию для аналитических целей. Полученные результаты относятся только к одному субъекту РФ, однако они дали определенное представление о демографических процессах на Северо-Западе России. Условия обследования могут потребовать применения особых способов отбора единиц. Существует, например, способ «движущегося наблюдателя», применяемый при определении числа передвигающихся объектов. Если нужно подсчитать число пешеходов на оживленной улице или число посетителей крупного 92
торгового центра, то крайне трудно это сделать наблюдателю, размещенному в определенной точке пространства. Чтобы преодолеть эту трудность, наблюдатель движется в одном направлении с толпой, подсчитывая людей, мимо которых он проходит, независимо от направления их движения, и вычитает тех, кто его перегоняет. Затем наблюдатель проходит ту же территорию в обратном направлении с прежней скоростью и производит подсчеты в таком же порядке, как раньше. Средняя величина из результатов двух подсчетов представляет оценку числа людей на изучаемой территории в наблюдаемый момент времени. При таком обследовании вся территория может быть разделена на несколько участков, на каждом из которых работает один наблюдатель. 2.5. Проведение выборочного обследования и разработка итогов Непосредственно процесс сбора первичной информации и разработка итогов при выборочном наблюдении осуществляются в целом в таком же порядке, как в случае сплошного обследования. Отличительными особенностями этих этапов при выборочном обследовании являются: • меньший объем работ; • необходимость соблюдения установленной схемы отбора единиц; • профилактика возможных непредвиденных факторов нарушения репрезентативности материалов выборки; • проверка соответствия перечня фактически обследованных единиц предусмотренному планом составу выборочной совокупности; • выявление случаев «необследования» и проверка соблюдения планового способа компенсации этого недобора; • расчет показателей ошибок выборки, распространение выборочных данных на генеральную совокупность при разработке материалов выборочного обследования. Как правило, к началу статистического наблюдения имеется перечень подлежащих обследованию единиц выборочной совокупности, например, при изучении бюджетов домашних хозяйств. При проведении крупномасштабных выборочных обследований считается предпочтительным осуществлять всю работу по фор- 93
мированию перечня подлежащих обследованию единиц в централизованном порядке, передавая в регионы уже готовые перечни единиц выборочной совокупности. Этим обеспечивается строгое соблюдение методологического единства, более эффективное использование предоставляемых электронными технологиями возможностей, выполнение работы более квалифицированными специалистами, предотвращение тенденциозности или небрежности при отборе. В практике Росстата, как правило, формирование выборочной совокупности для федеральных обследований производится централизованно. Реже применяется иная схема, когда формирование выборочной совокупности является одной из процедур процесса наблюдения. Так, при переписи населения на подготовительном этапе принимается решение о доле отбора и способе отбора. Конкретный перечень жилых помещений, переписываемых по расширенной программе в выборочном порядке, устанавливается в переписных участках. После проведения переписчиками предварительных контрольных обходов инструктор-контролер по установленной схеме делает в полном списке жилых помещений, в которых проживает постоянное население, пометки о квартирах (отдельных домах), подлежащих выборочной переписи. Наибольшую сложность при выборочных обследованиях представляют случаи невозможности обследования запланированных к включению в выборочную совокупность единиц. Причины этого могут быть разнообразные: недоступность единиц, к обследованию были намечены уже несуществующие единицы (при использовании устаревшей основы выборки), отказ от участия в обследовании (если законом или правилами обследования определен принцип добровольности участия в обследовании), ошибочные адресные данные (при некачественной основе выборки), трудности идентификации единиц (при нечетком определении вида подлежащих обследованию объектов). Эти факторы риска должны быть предусмотрены на стадии проектирования, и заранее намечены способы их предотвращения или устранения последствий. Например, в России организационным планом переписей населения, проходивших в зимнее время, в самых труднодоступных районах предусматривалось проведение переписных работ в другие сроки, более благоприятные по климатическим условиям. 94
Неполный охват наблюдением намеченного объема выборочной совокупности может привести к двум типам негативных последствий: 1. Оценки исследуемых параметров могут оказаться смещенными из-за того, что незатронутая обследованием часть выборочной совокупности может существенно отличаться по своим характеристикам от той части, которая подверглась выборочному обследованию. 2. Дисперсии оценок, полученные только по обследованной части выборочной совокупности, оказываются увеличенными из-за меньшего объема совокупности. При возникновении смещений состава выборочной совокупности из-за невозможности обследования некоторых единиц наблюдения может быть предусмотрено использование на стадии обработки итогов обследования специального математического приема — введения поправок на смещение1. Необходимо предусмотреть средства борьбы с неоправданными случаями отклонения от заданной схемы отбора или несанкционированной замены одних единиц наблюдения другими по инициативе переписчиков. Такое может происходить, если для обследования нужного объекта следует приложить дополнительные усилия, например, потребуется повторное посещение квартир, где никого не оказалось дома. Недобросовестные переписчики иногда производят по своему усмотрению замену таких объектов на другие, «более удобные» объекты, что может привести к смещению состава выборочной совокупности. Сокращение числа подобного рода нарушений может быть достигнуто путем проведения пилотных обследований, более тщательного обучения персонала и контроля его работы. Правилами проведения наблюдения может быть предусмотрено право переписчика записать ответы со слов другого осведомленного лица, если не удается встретиться лично с лицом, подлежащим обследованию. Основными способами компенсации недобора могут быть: замена отсутствующих единиц аналогичными по существенным признакам единицами, замена их в случайном порядке, сохранение фактически обследованной совокупности без корректировки и последующий пересчет итогов с помощью специальных поправочных коэффициентов. 1 См.: Кокрен У. Методы выборочного обследования. — С. 395—399. 95
Большую роль в обеспечении качества выборочных данных играют контрольные меры. Эту функцию на этапе заполнения формуляров наблюдения выполняет среднее звено персонала, проводящего обследования. Непосредственные исполнители (переписчики, регистраторы, интервьюеры) объединены в небольшие группы, которыми руководят сотрудники среднего звена. Последние осуществляют текущий контроль за работой подчиненных им непосредственных исполнителей, проверяя не только правильность заполнения формуляров (выявление ошибок регистрации), но и соблюдение установленной схемы выборки и схемы замены единиц, которые оказалось невозможным обследовать. В целом применение выборочного метода, благодаря меньшему объему работ, чем при сплошном наблюдении, позволяет существенно сократить число ошибок регистрации. Риск появления ошибок регистрации зависит также от объема и степени сложности программы наблюдения, от редакции вопросов и их оптимального размещения в формуляре наблюдения, от умелой организации работ по проведению наблюдения. Масштабы и характер ошибок регистрации, в отличие от ошибок репрезентативности, не поддаются оценке с помощью каких-либо формализованных технологий. При необходимости произвести оценку ошибок регистрации проводят повторное выборочное обследование с малой долей отбора, по ограниченной программе при тщательном отслеживании качества регистрации данных. Полученные поправочные коэффициенты могут быть использованы для корректировки итогов по генеральной совокупности. Операции по проверке полноты и правильности заполнения формуляров наблюдения могут быть выполнены недостаточно качественно. Это может быть неполный охват массива такой проверкой, неполное выявление ошибок, появление новых ошибок из-за неправильной корректировки данных. Причинами некачественного проведения контрольных операций могут послужить неудачный подбор персонала, плохо организованное его обучение, небрежность в работе, плохая организация работ. Не исключено появление новых погрешностей в процессе обработки уже собранных материалов выборочного наблюдения. При выполнении операций по кодировке открытых вопросов программы наблюдения могут допускаться ошибки, выз- 96
ванные такими причинами, как недостаточный профессионализм кодировщиков, некачественно проведенные их обучение и инструктаж, недостаточно эффективный контроль их работы, дефекты используемых при кодировке технических средств или словарей. Могут возникнуть ошибки и неточности в процессе автоматизированной обработки информации на этапе получения сводных итогов из-за сбоев в работе компьютеров, погрешностей в программном обеспечении, ошибок или небрежной работы операторов. Обеспечение высокого качества выполнения работ на этапе получения сводных итогов по материалам проведенного выборочного обследования в значительной мере определяется следующими условиями и факторами: • тщательностью составления программы разработки, ее согласованностью с программой наблюдения; • взвешенными решениями при определении круга операций, выполняемых в централизованном и в децентрализованном порядке; • оптимальным распределением всей программы разработки итогов выборочного наблюдения на циклы по очередности выполнения расчетных процедур: • программой расчета системы показателей для оценивания достоверности выборочных данных и распространения параметров выборочной совокупности на генеральную совокупность. На этапе разработки итогов выборочного обследования, помимо стандартных процедур, крайне важно получить ответ на принципиальный вопрос - были ли существенные отклонения от первоначальной модели выборочного обследования в части вида выборки, исполнения плана выборки по перечню подлежащих обследованию единиц. Если получено аргументированное заключение о том, что существенные отклонения имели место, то ставится под сомнение правомерность использования математического аппарата для расчета предельных значений ошибок выборки. Тем самым утрачивается возможность оценки уровня достоверности материалов обследования и определения границ, в которых находятся итоговые показатели по генеральной совокупности. Крайне важно получить оценку степени достоверности выборочных показателей. Фактическую величину ошибки репре- 7-2394 97
зентативности определить невозможно. Приближенное ее значение вычисляется для наиболее важных для исследовательских целей выборочных показателей по формулам, основанным на методах математической статистики и дифференцированных в зависимости от вида выборочного наблюдения. В заключение необходимо отметить, что все названные выше проблемы имеют свою специфику в зависимости от конкретного вида выборочного обследования (текущее, периодическое, единовременное наблюдение, локальное или крупномасштабное обследование, статистическая отчетность и т.д.). В связи с этим рассмотренные выше положения даны лишь в форме оценки типовой ситуации, которая обретает более конкретные очертания в условиях реального исследовательского проекта. Принципиальное значение имеет вопрос о предоставлении пользователям информации по таким вопросам, как методика статистического наблюдения (сплошное или несплошное, вид и объем выборки), уровень неответов, величина ошибок выборки. Сложившаяся практика такова, что в публикуемых Росста- том статистических сборниках приводятся только сведения о доле или проценте охвата наблюдением генеральной совокупности. На уровне методологических разработок Росстатом определен порядок информирования пользователей по вопросам о полноте и качестве статистических данных. Приказом Госкомстата России от 27 сентября 2001 г. № 137 были утверждены «Основные методологические положения по оценке качества статистической информации»1. В этом документе отмечено, что детализация предоставляемой информации зависит от круга пользователей. Содержится также указание на необходимость сопровождения любой публикации метаданными, включая, в частности, следующие компоненты: 1. Информация о генеральной совокупности объектов статистического наблюдения и применяемых стандартных классификациях. 2. Информация о методах сбора и обработки данных: • какие именно использовались методы сбора данных (по почте, по телефону или с помощью интервьюеров); 1 См.: Николаев И., Леонтьева Е. ВВП: качество и достоверность информации // Общество и экономика. — 2006. — N° 11 — 12. — С. 167. 98
• каков реальный охват генеральной совокупности; • что предпринималось для учета фактов отсутствия ответов от респондентов; • какие применялись методы редактирования данных; • какие методы распространения данных были использованы в случае выборочного наблюдения; • какого рода проводились корректировки данных (например, поправки на объемы теневой экономики, сезонность и т.п.). 3. При публикации результатов выборочных наблюдений характеристики точности распространенных на генеральную совокупность выборочных данных целесообразно включать в таблицы, непосредственно содержащие оцененные показатели (а не в отдельный раздел). В этом случае пользователь имеет общую картину достоверности информации в каждой таблице. Однако нужно учитывать, что недостатком таких таблиц является их громоздкость и, следовательно, сложность восприятия. Контрольные вопросы 1. Каковы различия в порядке организации текущего, периодического и единовременного выборочного обследования? 2. Какие вопросы решаются на этапе проектирования выборки? 3. Что понимается под основой выборки? Как она формируется и как используется? 4. На каких этапах выборочного обследования и в каких формах применяются современные информационные технологии? 5. Каково содержание и какова взаимосвязь проекта программы выборочного обследования и проекта программы разработки его итогов? 6. Каково содержание календарного плана работ по проведению выборочного обследования? 7. Как контролируется соблюдение принятого порядка организации выборочного обследования? 8. Определите понятия единицы совокупности и единицы отбора. 9. Чем руководствуются при определении вида выборки и объема выборки? 7- 99
10. Какими мерами обеспечивается необходимое качество материалов выборочного наблюдения? 11. Что является основой выборки при формировании выборочной совокупности для обследования субъектов хозяйственной деятельности в практике Росстата? 12. Какими объективными и субъективными причинами может быть вызван неполный охват обследованием всех единиц выборочной совокупности? 13. Каковы возможные негативные последствия неполного охвата наблюдением единиц выборочной совокупности? 14. С какой целью проводятся пилотные обследования? 15. Какую информацию об особенностях выборочного наблюдения следует доводить до сведения потребителей статистических данных? 16. Перечислите возможные способы формирования выборочной совокупности. 17. Сформулируйте понятие основы выборки. 18. Какие контрольные меры предпринимаются при проведении выборочного наблюдения? 19. Какая информация о методике проведенного выборочного наблюдения должна предоставляться пользователям материалов этого наблюдения?
МАТЕМАТИЧЕСКИЙ АППАРАТ И ПРИЕМЫ, Раздел II используемые В ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЯХ Глава 3 МАТЕМАТИЧЕСКИЕ ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА В предыдущих главах были рассмотрены такие проблемы, как необходимость выборочного метода, различные виды выборок, организационные вопросы практического применения выборочного метода в изучении народного хозяйства, населения, социальной сферы. Задача данной главы состоит в изложении математико-статистической теории выборочного метода — в первую очередь классической теории случайной выборки, ее основных понятий, приемов и интерпретации ее результатов. Излагаются также ограниченные методы, возникшие на практике отступления от классической теории, нерешенные проблемы математико-статистической теории выборочного метода. 3.1. Основные понятия и термины 1. Генеральная совокупность — это та масса, множество изучаемых явлений, параметры которого должны быть оценены с помощью выборочного метода. Свойства генеральной совокупности, ее численные параметры: средние величины, доли, показатели вариации, связи, координации, показатели динамики во времени и т.д. — будем называть генеральными характеристиками. Генеральная совокупность может быть реальной (все население страны, предприятия отрасли, жилые строения, поголовье скота и т.п.) или гипотетической (потенциальной), например, совокупность возможных результатов эксперимента при 101
его повторении в однородных условиях бесконечно большое число раз. Параметры генеральной совокупности обычно обозначают заглавными буквами или строчными с добавлениями подписного знака «ген», например дисперсия признака в генеральной совокупности может обозначаться как «а2ген». 2. Выборочная совокупность, или, упрощенно, «выборка» - это подмножество тех единиц, которые были отобраны из генеральной совокупности, подвергнуты измерению, параметры которых считаем известными, и на их основе определяются оценки параметров генеральной совокупности. Параметры выборки обычно обозначаются строчными буквами или с добавлением подписного знака «выб», например дисперсия признака в выборке может быть обозначена как «ст2выб». 3. Оценки — точные оценки неизвестных параметров генеральной совокупности, полученные с помощью выборочного метода. Оценки в классической теории выборочного метода считаются вероятностными (или стохастическими) переменными, подлежащими указаниям тех вероятностей, той надежности, которые они имеют, например: оценка генеральной средней величины месячного дохода жителя Орловской области за 2003 г. с вероятностью 0,95 составила 3133 ± 210 руб./мес. 4. Ошибки репрезентативности выборочных оценок — это различие между выборочной оценкой и тем значением параметра генеральной совокупности, который был бы получен при сплошном наблюдении всех единиц генеральной совокупности. При этом предполагается, что и сплошные, и выборочные наблюдения не имеют ошибок регистрации. Упрощенно и неточно говорится «ошибка выборки». Неточность такого названия ошибки репрезентативности в том, что по отношению к выборке оценка является точной величиной, не имеющей никаких ошибок (при отсутствии ошибок регистрации, как уже сказано). 5. Случайная выборка, случайный отбор. Это такая выборка, при осуществлении которой каждая единица генеральной совокупности имеет равную вероятность быть отобранной. Строго говоря, для этого необходимо, чтобы после каждого акта отбора одной единицы совокупности она вновь возвращалась в генеральную совокупность и участвовала в следующих актах отбора. Такая процедура называется повторным отбором. На практике повторный отбор применяется редко, только в некоторых спе- 102
циальных экспериментах. В социологических и экономических исследованиях применяется «бесповторный отбор», когда отобранная единица совокупности не участвует в следующих актах отбора, т.е. каждый акт отбора происходит из уже изменившегося состава генеральной совокупности. При большом объеме последней - тысячи и миллионы единиц - неточности в равной вероятности попадания в выборку невелики, но если генеральная совокупность не столь велика, то в оценках параметров генеральной совокупности нужно сделать поправку на беспов- торность отбора, о чем будет сказано далее. Технически случайный отбор можно проводить разными способами: • пронумеровать все единицы генеральной совокупности до N, заложить номера в тиражный механизм (в разъемные шарики) и, перемешав их, взять число, равное объему выборки п\ • с помощью «таблиц случайных чисел», представляющих собой последние три-четыре знака шестизначных логарифмов или иных функций, последние знаки дробей чередуются в случайном порядке, поэтому из пронумерованной генеральной совокупности в выборку включают те единицы, которые имеют номера, соответствующие числам в случайной таблице, в датчике случайных чисел ЭВМ; • если составить список единиц генеральной совокупности в порядке какого-либо признака, не влияющего на изучаемые свойства, например в алфавитном порядке, и отбирать из этого списка единицы в выборку через равный интервал, то, по существу, хотя и не строго математически, получается случайная выборка, не требуется при этом никаких механизмов. 3.2. Средняя ошибка репрезентативности при случайной выборке. Ее сущность и способы вычисления Число разных по составу единиц бесповторных выборок объемом п из генеральной совокупности объемом N есть число сочетаний из jV по п, обозначаемое и вычисляемое по формуле 103
гп - CN - n\-(N-n)\' (3.1) Например, из пяти единиц (N = 5) можно составить 10 раз- -х 5! 4-5 ных выборок по 3 единицы в каждой (п = 3): С$ = —^ = — = 10, а из 20 единиц (N = 20) можно составить уже 125970 выборок разного состава по 8 единиц в каждой. Число же разных по составу выборок по 2000 человек из населения города, имеющего 4 млн жителей, настолько чудовищно велико, что оно на миллиарды порядков превышает число атомов во всей наблюдаемой Вселенной! И все эти выборки имеют равную вероятность при случайном отборе. В принципе каждая отдельная выборка имеет свою ошибку репрезентации, например, для средней арифметической. Рассмотрим это на простейшем примере, при N = 5, п = 3 (табл. 3.1). Состав генеральной совокупности (назовем ее А): х, = 12; *2 = 21; хъ = 24; jc4 = 30; х5 = 33: Построив все различные бесповторные варианты по 3 из 5, определим ошибку репрезентативности каждой выборки и среднюю ошибку (т.е. математическое ожидание ошибки). Оценки средней величины по разным выборкам различны, но средняя оценка точно равна генеральной средней. Это означает, что выборочная оценка средней величины является несмещенной. Таблица 3.1 Все бесповторные выборки по 3 из 5 (совокупность А) Номер выборки 1 2 3 4 Состав выборки jc,; х,; х, *,; х,\ х, X|> Xj, Х4 Средняя величина X,- 19 21 22 22 Ошибка репрезентативности -5 -3 -2 -2 А? 25 9 4 4 104
Продолжение Номер выборки 5 6 7 8 9 10 I Состав выборки х,; jc,; xs *.; х&\ хк Хп X-i, ХЛ х,; х,; х, Х-1) ХА, Х^ Х-н Хл, ДС, Средняя величина X, 23 25 25 26 28 29 240 Ошибка репрезентативности *,■-*=*/ -1 1 1 2 4 5 0 А? I 1 1 4 16 25 90 Алгебраическая средняя ошибка репрезентативности равна нулю. Если же вычислить модуль средней ошибки, т.е. величи- 10 ну £|д,|:10 = 26:10 = 2,6, то не всегда распределение ошибки i симметрично, как в табл. 3.1. Если же средняя величина не совпадает с медианой, то минимальной суммой отклонений будет сумма отклонений по модулю от медианы, а не от средней величины, и по ней должна рассчитываться линейная мера ошибки. Главное же неудобство оценки по модулям ошибок в том, что модули никак не связаны с вероятностными оценками надежности выборочных величин. Вероятностные меры связаны с квадратической средней ошибкой репрезентативности, поэтому эта мера ошибки является основной. Средняя квадратическая ошибка, обозначим ее как т^, вычисляется по формуле (3.2) где к= cnN. По табл. 3.1 Чтобы установить, как влияет на величину ошибки репрезентативности степень неоднородности генеральной совокупности, т.е. дисперсия признака а2ген, нужно сравнить среднюю 105
ошибку по выборкам из совокупности А со средней ошибкой по выборкам из совокупности Б (табл. 3.2), при тех же N и л, по большей дисперсии - совокупность Б состава: jc, = 12; х2 = 18; 2127 42 2 ^ 305 х3 = 21; хА = 27; х5 = 42: X = 24, = 130,5. Таблица 3.2 Все бесповторные выборки по 3 из 5 (совокупность Б) Номер выборки 1 2 3 4 5 6 7 8 9 10 I Состав выборки X, *| X, X, X, х? X, Х1 X, х4 X, *4 *4 х4 *<> ХА хч Средняя величина */ 17 19 24 20 25 27 22 27 29 30 240 Ошибка репрезентативности *,.-*=*/ -7 -5 0 -4 1 3 -2 3 5 6 0 А? 49 25 0 16 1 9 4 9 25 36 174 По совокупности Б получаем среднюю квадратическую ошибку щи = J— =4,171, при дисперсии а2ген в 130,5 : 67,5 = 1,93 раза Л Л/ 1П больше, получаем т^ в 4 171 = 1,39 раза больше. Но следовательно, средняя ошибка репрезентативности прямо пропорциональна корню квадратному из дисперсии, т.е. прямо пропорциональна аген. В связи с этим, если возможно, следует до выборки уменьшить вариацию признака в генеральной совокупности. Если, например, требуется взять выборочно пробы на жирность молока или на содержание в нем солей и других веществ, то сначала нужно перемешать молоко в баке или в другой емкости. Можно при сильной неоднородности совокупности исключить из нее резко отклоняющиеся от основной массы единицы, или «отсечь хвост», применив «ценз», например, при изучении расходов населения по видам товаров, исключить 106
лиц с душевым доходом более 100000 руб. в месяц. Чтобы определить, как влияет на величину ошибки репрезентативности объем выборки п, следует сравнить ошибки выборок при одинаковых а2ген, одинаковой доле п : УУ, но при разных объемах, например, выборку 2 из 4 и 3 из 6. Совокупность В состава: х, = 15; х2 = 25; х3 = 25; хА = 35: X =25, ОрСН =66,7 (табл. 3.3). Средняя ошибки репрезентативности равняется: т^ - Теперь составим совокупность Г для выборок 3 из 6: jct = 12; х2 = 18; х3 = 27; х4 = 30; х5 = 30; хв = 33: X = 25; aJ:CH = 67,2 (табл. 3.4), почти такие же, как в совокупности В. Средняя квадратическая ошибка репрезентативности соста- /224 вила ту = Л =3,347. Эта величина составляет 82% от величи- х v 20 ны ошибки при п = 2. Иначе, при уменьшении л с 3 до 2, т.е. в 1,5 раза, ошибка возросла в — = 1,22 раза, что равно ->J\3. Итак, ошибка репрезентативности бесповторной выборки обратно пропорциональна корню квадратному из объема выборки п. Таблица 3.3 Бесповторные выборки по 2 из 4 (совокупность В) их ошибки Номер выборки 1 2 3 4 5 6 Состав выборки х,; х, х,; х, х,; х4 х?, х^ х7, х4 х^, х4 Средняя величина Xi 20 20 25 25 30 30 150 Ошибка репрезентативности -5 -5 0 0 5 5 0 А? 25 25 0 0 25 25 100 Остается определить, как зависит ошибка репрезентативности бесповторной выборки от ее доли в генеральной совокупности, т.е. от отношения п : N. Логически ясно, что по мере увели- 107
чения этой доли ошибка должна уменьшаться и при п —> N ошибка должна стремиться к нулю. Необходимо сравнить ошибки выборок при той же дисперсии признака и одинаковом объеме выборки я, но разных отношениях п : N, например, сравним выборку 2 из 4 (табл. 3.3) с выборкой из совокупности А по 2 из 5 (табл. 3.5). Таблица 3.4 Бесповторные выборки по 3 из 6 (совокупность Г) и их ошибки репрезентативности Номер выборки 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 Состав выборки •Хр Х2, X} X\i Xjf ХА •Хр Х2 Х\9 Х2 X\i Х3 *р Хъ х,;*з х,;х4 хр хА Хр Хь х2, х3 х2, х3 х2\ хъ х2;х4 х2, х4 х2;х5 х},хА Х)> ХА Хц Х5 х4; х5 х5 хь х4 Х5 ХЬ х5 хв х6 хА х5 Хь xs Хь Хь Х5 Хь Хь Х6 Средняя величина xt 19 20 20 21 23 23 24 24 25 25 25 25 26 26 27 27 29 30 30 31 500 Ошибка репрезентативности Xi-X = Ai -6 -5 -5 -4 -2 -2 -1 -1 0 0 0 0 1 1 2 2 4 5 5 6 0 А? 36 25 25 16 4 4 1 1 0 0 0 0 1 1 4 4 16 25 36 224 108
Таблица 3.5 Бесповторные выборки по 2 из 5 (совокупность А) Номер выборки 1 2 3 4 5 6 7 8 9 10 I Состав выборки *| *, *| *? *, X, х, хл х, х, хй х< х^ хл х, хл х, х. Средняя величина Xi _ 16,5 18 21 22,5 22,5 25,5 27 27 28,5 31,5 240 Ошибка репрезентативности -7,5 -6 -3 -1,5 -1,5 1,5 3 3 4,5 7,5 0 А? 56,25 36 2,25 2,25 2,25 9 9 20,25 56,25 201,5 Средняя ошибка репрезентативности составила: т^ = /201,5 = J =4,489, что больше ошибки при выборке 2 из 4 (табл. 3.4) в 1,1 раза, или составляет 110% к ошибке выборки 2 из 4. Точно такое же соотношение между квадратными корнями из доли совокупности, не вошедшей в выборку: ^О^в.у/О^Е- -1,096 «1,1, или 110%. Таким образом, ошибки репрезентативности бесповторной выборки за счет доли п : TV обратно про- порциональна Итак, объединяя влияния всех трех факторов на ошибку бесповторной выборки, полунаем общую формулу для бесповторной выборки. Ее средняя ошибка равна: (3.3) Переходим к определению средней ошибки репрезентативности при повторной выборке. Число всех возможных повторных выборок больше, чем бесповторных, за счет того, что в по- 109
вторные выборки могут попадать одни и те же единицы совокупности до п раз. Так, в выборку 2 из 4 повторно попадут четыре новые выборки х1 и хх\ х2 и х2; х3 и х3; хА и х4, кроме шести бесповторных выборок. В общем виде добавляется число сочетаний из N по К, где К — все целые числа от 1 до п — 1. Построим повторные выборки по 2 из 4 на основе совокупности В (табл. 3.6) и сравним среднюю ошибку с табл. 3.3 — бесповторная выборка по 2 из 4. Таблица 3.6 Все повторные выборки по 2 из 4 и их ошибки Номер выборки 1 2 3 4 5 6 7 8 9 10 I Состав выборки JC, Х\ х\ Х\ х-> х, х, х, хл х} Х-, х, хл х7 -*\ Х4 х, хл хй Средняя величина Xi 15 20 20 25 25 25 30 25 30 35 250 Ошибка репрезентативности Xi-X = Ai -10 -5 -5 0 0 0 5 0 5 10 0 А? 100 25 25 0 0 0 25 0 25 100 300 Средняя арифметическая величина признака в виде ее обычной оценки по повторным выборкам, так же как и по бесповторным, является несмещенной оценкой генеральной средней и вычисляется как X*/ к (3.4) где К - число выборок. Иначе обстоит дело со средней квадратической ошибкой 2 При бесповторных выборках мы ее также вычисляем как — 110 К
Число бесповторных выборок было ограничено условием бесповторения одних и тех же единиц совокупности. Число же повторных выборок из N по п есть абсолютный предел числа выборок, а последняя из этих выборок является величиной предопределенной, несвободной. В связи с этим среднюю квад- ратическую ошибку повторной выборки следует вычислять с учетом потери одной степени свободы, т.е. как (3.5) к-\ По данным табл. 3.6 имеем: ш- = I JUU =5 774 Эта величи- х V10-1 ' на точно совпадает с величиной дроби в формуле средней ошибки °ген бесповторной выборки (табл. 3.3), т.е. Тй (см. формулу 3.3), поэтому величину подкоренного выражения V N и называют «поправкой на бесповторность выборки». Если объем выборки п очень мал в сравнении с совокупностью TV, скажем, —< 0,01, то поправку на бесповторность можно не делать и при любой выборке пользоваться формулой для повторной выборки (3.6) В формулы (3.3) и (3.6) входит величина аген или а2ген — среднее квадратическое отклонение признака от его средней величины или дисперсия в генеральной совокупности. Если эта величина неизвестна, ее приходится заменить оценкой а по данным выборки, т.е. авыб. Рассмотрим, как вычислить эту оценку, является ли она несмещенной оценкой аген и при каких условиях. Для этого, по данным табл. 3.1 бесповторной выборки по 3 из 5, вычислим для каждой выборки а и а2 и определим, как из них получить несмещенную оценку генеральной дисперсии в совокупности А, равную 67,5 (табл. 3.7). 111
Таблица 3.7 Выборочные оценки дисперсии в совокупности А Номер выборки 1 2 3 4 5 6 7 8 9 10 I Состав выборки X\i -*2> Х-\ •*1> -*2' "*4 •*и ■*•>» -^s -*И -^4J -*5 •^7? ■*"!» "*4 %7i X41 %Ч ■*3> -^4» Х<> Средняя величина Xj 19 21 22 22 23 25 25 26 28 29 240 Z(*,-*/)2 78 162 222 168 222 258 42 78 78 42 1350 о2, 39 81 111 84 11 129 21 39 39 21 675 Средняя величина из выборочных оценок дисперсии овыб равна 67,5, что точно равно генеральной дисперсии в совокупности А. Следует, однако, заметить, что несмещенной выборочной оценкой дисперсии является только такая оценка, которая вычислена по формулам, учитывающим потери одной степени свободы и в генеральной дисперсии, и в выборочных оценках. N .2 _/5] /V-1 "' авыб = — (3.7) п-\ Без учета потери степени свободы оценки получаются смещенными при любой их комбинации. Обычно в учебниках по общей теории статистики это обстоятельство не оговаривается. Рассмотрим (без вывода) формулы средней ошибки для других характеристик совокупности при простой случайной выборке. Дисперсией доли ^является величина W(l — W), откуда формула средней ошибки репрезентативности выборочной оценки доли lw(\—w) = V v ' — для повторной выборки; 4 112
т - I [ w) /| (L -для бесповторной выборки (3.8). w V /i V N Средняя ошибка выборочной оценки коэффициента детерминации при парной связи признаков г2^ имеет вид (поскольку коэффициент детерминации - это тоже доля по существу): „.2 где п-2 - число степеней свободы при связи двух признаков. (3.9) Из формулы (3.9) нетрудно вывести и формулу средней ошибки репрезентативности выборочной оценки коэффициента корреляции: ' " (3.10) Если связь признаков изучалась на основе данных бесповторной выборки, а отношение п : N не мало, то к формулам (3.9) и (3.10) следует добавить поправку на бесповторность выборки. 3.3. Вероятностные оценки ошибки репрезентативности и доверительные границы оценок Оценка ошибки репрезентативности должна быть достаточно точной и надежной. Надежность оценки - это вероятность того, что ошибка не превысит установленных исследователем границ. Какова же граница (допустимая ошибка по величине) и какова необходимая надежность - проблема не статистическая. Ее должен решать пользователь, заказчик выборочного исследования. Если от такой оценки среднего параметра может зависеть работа авиамотора или траектория ракеты, то потребуются очень большая точность оценки и высокая надежность, скажем 0,99999. Если же речь идет о результате социоло- 8 - 2394 113
гического исследования мнений населения о деятельности губернатора, то достаточны точность до 1% и надежность 0,9. При распределениях значений признака в генеральной совокупности, близких к закону Гаусса—Лапласа («нормальное распределение»), с которым в основном работают статистические методы, вероятность того, что ошибка отдельной выборки не превзойдет одной средней ошибки, составляет, при достаточно большой выборке (п > 30) = 0,6817. Р{Х -nix <x <x +/njf}=0,6817. (З.П) Надежность в 68% явно мала для большинства задач. Распределение ошибки репрезентативности по нормальному закону характеризуется интегральной функцией закона Гаусса—Лапласа: Р = -g. J (3.12) где Р - вероятность того, что ошибка репрезентативности (а) оценки не выйдет за границы ±/и^ •/ (г - кратность средней ошибки, т.е. t- ). -2 -1 Рис. 3.1. Нормальное распределение ошибок репрезентативности Графическое изображение нормального распределения ошибок оценки показано на рис. 3.1. 114
Заштрихованная доля в клеточку составляет 0,6817 от всей площади под кривой и представляет вероятность того, что ошибка выборочной оценки не превосходит ±>%> т.е. средней ошибки. Вся заштрихованная область представляет вероятность того, что ошибка репрезентативности по ее алгебраической величине меньше одной средней ошибки. Она составляет 0,8408 0,6817 + '- . Эта величина часто табулируется в учебных пособиях по статистике как Ф(/) = —т= [ е 2 dt. (3.13) Заштрихованная в клеточку часть рис. 3.1 может в разных источниках записываться разным образом: как 9 < ^ 2 \ 2 dt (3.14) или так, как в формуле (3.12). При объеме выборки большем, чем 30 единиц, можно находить F(t) по таблицам нормального распределения - по закону Гаусса—Лапласа (см. приложение 2). При п < 30 следует находить F(t) по таблицам распределения Стьюдента (см. приложение 3) [Английский математик Вильям Госсет (1876-1937) писал под псевдонимом «Student»]. Полезно запомнить некоторые часто употребляемые на практике значения F(t), при большой выборке — нормальное распределение ошибок репрезентативности: F(l) = 0,68; F(2) = 0,9545; F(3) = 0,9973; что уже близко к единице, т.е. вероятности достоверного события. Поэтому часто считают, что в однородной совокупности не должно быть единиц со значением признака, отклоняющимся от средней величины больше, чем на За («правило трех сигм»). При малых выборках п < 30 следует пользоваться /-критерием Стьюдента. В нем вероятность зависит от числа степеней свободы, которое 8* 115
равно числу единиц п за вычетом числа закрепленных параметров, например, вариация около средней имеет Л7— 1 степени свободы, парная корреляция имеет п—2 степени свободы (в англоязычных компьютерных программах — «degrees of freedom», обозначается d.f.). Чтобы достичь надежности непревышения ошибки, равной 0,95, при п - 11 в таблице Стьюдента / = 2,22, а при п = 6 /стьюд = 2,57. Для вычисления вероятности риска превышения ошибки над заданной границей, для которой / = fk, следует применить «од- 1 * ^ носторонний критерий» ф(Г ) - А \ е 2 dt, например, для рис- ка, с вероятностью не более 0,05 при большой выборке Ф(^) = = 0,05 при tk = 1,645 (рис. 3.2). Если пользоваться таблицей F{t), то нужно взять F(2), а вероятность риска будет: 1 — F(2) = 1 — - 0,95 = 0,05. Вероятность риска 0,05 1,645 Рис. 3.2. Вероятность риска превышения ошибки над заданной границей Полезным на практике показателем качества информации, полученной выборочным методом, служит относительная ошибка репрезентативности, равная отношению средней ошибки к средней величине изучаемого признака. Например, если по данным выборочного изучения домохозяйств средняя жилая площадь, занимаемая семьями с тремя членами семьи, равна 47,6 м2 при средней ошибке репрезентативности 2,13 м2, то относительная ошибка есть 2,13 : 47,6 = 0,0447, или 4,47%. Желательно, чтобы относительная ошибка не превышала 5%. 116
3.4. Сочетание выборочного метода с группировкой - стратифицированная выборка и ее ошибка репрезентативности Сочетание выборочного метода с группировками позволяет уменьшить ошибку репрезентативности, не увеличивая ее объем. Предположим, что имеется совокупность, состоящая из двух групп, причем значения признака xt в группах частично перекрываются. Группа А состоит из: х{ = 36; х2 = 38; х3 = 42; jc4 = 46; х5 = = 48; хв = 48; х1 = 50; х% = 51. Средняя х, =45; оА = Ш^ = 5,53. V 8 — 1 Группа Б состоит из: хх = 47; х2 = 50; хъ = 51; х4 = 56; х5 = = 59; х6 = 60; х7 = 62; х8 = 62; х9 = 64; xlQ = 67; хп = 71; х12 = 71. Средняя Х^=60; оБ = J-j^ = 7,SI. Если, не считаясь с группами, провести по всей совокупности простую случайную выборку 50%, т.е. п = 10, то получим следующие результаты: Проведем пропорциональную стратифицированную выборку, это означает, что в выборку войдут 40% из группы А и 60% от объема выборки из группы Б, т.е. будет соблюдена структура совокупности, которая при простой случайной выборке могла быть нарушена. Соблюдение структуры совокупности означает, что из общей дисперсии исключается межгрупповая дисперсия Межгрупповая дисперсия уже не будет являться источником ошибки репрезентативности. Ее источником останется средняя из внутригрупповых дисперсий, т.е. 117
-12): (8-1 + 12-1)= / = 49,78; a* =7,06, что составляет 69% общей дисперсии по всей совокупности. Соответственно уменьшается и средняя ошибка репрезентативности: 7,06 /;1Хвнутригр Таким образом, применение стратифицированной выборки позволило уменьшить ошибку на 31%. Условием применения стратифицированной выборки является знание о структуре всей исходной совокупности, что позволяет провести ее группировку. 3.5. Определение объема выборки, необходимого для обеспечения заданной точности и надежности выборочных оценок Рассмотрим сначала эту задачу на примере средней величины при простой случайной выборке при п : N < 0,01, т.е. при использовании формулы ошибки репрезентативности для повторного отбора (3.6): о2 отсюда -т. (3.15) т Необходимой или достаточной точностью выборочной оценки средней величины будем считать требование, чтобы с вероятностью 0,95 ошибка репрезентативности не превосходила 10% средней величины (пг^ ^ 0,1Х) (можно выдвинуть и другие условия: вероятность 0,9; т% <0,05Х и т.п.). 118
Для вероятности 0,95 ошибка будет равна двукратной средней ошибке, таким образом имеем: Ъп^ <0,1Х; т^ <0,05Х, что и подставляем в формулу (3.15): п> °_ 2 (3.16) (0,05Х)2 (если ошибка меньше, то объем выборки должен быть больше). о Так как -=- есть коэффициент вариации, то формулу (3.16) можно представить в виде п> -— , или/1>400у2. (3.17) 0,0025 Например, если коэффициент вариации признака равен 0,2, то п > 16 единиц. При v= 0,5 п > 100 единиц. Чаще всего до проведения выборки фактические значения а и п неизвестны. В таком случае эти величины можно принять равными их же значениям в прошлом периоде или по аналогичным объектам. Если и этого сделать нельзя, то для гарантии от риска следует взять достаточно большое их значение, например, коэффициент вариации в однородной совокупности принять за 0,25 или 0,3. Если выборка составляет достаточно большую долю от численности единиц совокупности, то следует сделать поправку на бесповторность выборки. Так как средняя ошибка репрезентативности обратно пропорциональна величине Jl-~, то необ- V N ходимая численность выборки станет меньше, чем по формуле для повторной ошибки (3.15). Имеем: п 119
Возведя в квадрат: £irn5i^ (ЗЛ8) N) п N Если п много меньше N, вторым слагаемым можно пренебречь. Так как средняя ошибка тх обратно пропорциональна \\-— а доля выборки JL как правило, известна, то известно V TV' N' и то, во сколько раз или на сколько процентов ошибка при бесповторном отборе меньше, чем при повторном. Скажем, — = 0,2, тогда ошибка меньше за счет бесповторности на 1 — л/оТв, или на 10,6% (составляет 0,894 ошибки при повторной выборке). Объем же выборки п зависит от средней ошибки в квадрате, значит, он составит (0,894)2, или 80% объема повторной выборки. Если объем повторной выборки будет равен 100 единицам, то объем бесповторной выборки составит 80 единиц. Если по организационным или техническим причинам произошло отступление от плана проведения выборочного исследования, то может встать вопрос о том, какую точность после этого могут иметь выборочные данные? Например, планировалась выборка из совокупности, где N > 40000, объемом п для определения среднего значения признака с v = 0,25, с ошибкой не более 5% средней и надежностью 0,95. Объем необходимой выборки был равен: т1 ( 0,05 ч2 Фактически удалось собрать данные по 64 единицам. Если мы потребуем сохранения заданной точности в 5% средней (а = = / • т = 0,05), то для определения надежности находим / фактическое: 120
Находим Д1,6) = 0,89. Иначе говоря, надежность того, что ошибка в оценке средней величины не превысит 5% ее, составляет 89% из 100. Если же мы пожелаем при уменьшившейся выборке сохранить ту же надежность 95%, то нужно найти ошибку: , = фг V64 и умножить на 2 (точнее, на 1,95). Имеем а = / • т = 1,95 • 0,0312 = 0,0608, или 6,08% средней величины. За сократившуюся по объему выборку надо заплатить либо уменьшением надежности, либо уменьшением точности оценки. При этом предполагается, что случайность отбора не была нарушена! Рассмотрим расчет необходимого объема выборки для надежной и достаточно точной оценки доли. Обозначим оцениваемую долю как Wo, а ее выборочную оценку — d0. Тогда, как известно, дисперсией доли является величина Wo (I — 1V0), а ее средняя ошибка репрезентативности при повторном отборе, или при N> ЮОя, вычисляется по формуле _УН1-Ч) (3.19) Одна степень свободы теряется потому, что сумма изучаемой доли и всех прочих долей (1—d0) тождественно равна единице. Будем считать достаточно надежной оценкой доли такую, при которой вероятность превышения ошибки над предельно допустимой не превышает 0,05 (надежность 95%). Предельно допустимой величиной ошибки будем считать 10% изучаемой доли (<х< 0,1 d0). Тогда средняя ошибка репрезентативности т = = а : /, где /-критерий при большой выборке по таблицам распределения вероятностей Гаусса—Лапласа равен 1,95 ~ 2, при малой выборке п < 30/ по таблицам распределения вероятностей Стьюдента критерий зависит от числа степеней свободы (я-1). Подставив в формулу (3.19) т = а : / и а < 0,1</, получаем 121
Решая неравенство относительно л, имеем ^/V^o) + 1 (3.20) Например, если оцениваемая доля do = 0,5, а / = 2, то п> 4>0>5 + 1, т.е. я £401. 0,010,5 Чем ближе оцениваемая доля к единице, тем меньше требуемый объем выборки п. Например, при доле 0,99 имеем п > —— +1« 5. Однако при /1 = 5 нужно / брать из распре- 0,01-0,99 деления Стьюдента, при /1—1=9 и / = 2,78, что при подстанов- 2 78^ «О 01 ке в формулу (3.20) дает: л> ' ' +1«9. При п = 9/Стьюдента равно 2,26, при новой подстановке в формулу (3.20) имеем п £ 6 и после нескольких итераций окончательно получаем, что для оценки доли, равной 0,99, достаточна выборка в 7 единиц. Для малой доли, скажем, 0,05, имеем 0,01 0,05 Этот объем выборки гораздо больше, чем обычные при социологических опросах ВЦИОМ и других организаций выборки в 1500—2000 респондентов. Если снизить требуемый уровень надежности до 0,9, / будет равен 1,64, и объем выборки можно будет уменьшить в (2:1,64)2« «1,5 раза. Если же увеличить вдвое допустимый уровень ошибки, скажем, с 10% до 20% изучаемой доли, то требуемый объем выборки сократится в 4 раза, но вряд ли допустима столь грубая оценка доли. Можно составить специальную таблицу требуемой численности выборки для большей и меньшей точности оценки с более высокой надежностью и с менее высокой надежностью. Из данных такой таблицы вытекает ряд выводов: 122
1. Малая выборка объемом менее 25 единиц при ошибке оценок не более 10% доли пригодна только для оценки долей, превышающих 0,9, или 90%, а при ошибке в 20% доли — для долей > 0,8. 2. Для достаточно точных оценок и надежности не менее 0,9 необходимы большие выборки объемом в сотни и тысячи единиц при оценках долей, меньших, чем 0,5. 3. Для точной и надежной оценки малых долей, меньших, чем 0,2, необходима сверхбольшая выборка объемом в несколько тысяч или десятков тысяч единиц. 3.6. Средняя ошибка репрезентативности показателей вариации Что касается размаха вариации, то логически ясно, что выборочная оценка размаха вариации не может быть несмещенной. Только в часть выборок войдут крайние значения признака Хт1п и Хтах} а все остальные выборки, не содержащие крайних значений признака, дадут заниженную оценку размаха. Видимо, по этой причине в литературе не упоминается об ошибке оценки размаха вариации. Ясно также, что с ростом объема выборки и ее доли в совокупности оценка размаха будет приближаться к генеральному показателю размаха. Наиболее важно знать ошибку оценки среднего квадрати- ческого отклонения, т.е. /яо. Используя вышеприведенную «совокупность А» (см. табл. 3.5) и выборки по 3 из 5, построим расчет ошибки а (табл. 3.8). Генеральные показатели: « ' = ^ = 67,5; о,™ =8,216; 5-1 4 средние выборочные показатели: 123
to Таблица 3.8 Расчет средней ошибки оценки а Выборки ■* I» -*2' 3 "*М *2' Х4 Х\у Х2г Х5 •* |» "*3 > 4 -*|, *3> *5 Y ' Y ' Y •^2' "^3» "^4 Л2* 4' 5 I Значения Л^ 12, 21, 24 12, 21,30 12, 21, 33 12, 24, 30 12, 24, 33 12, 30, 33 21,24,30 21, 24, 33 21, 30,33 24, 30, 33 - 19 21 22 22 23 25 25 26 28 29 240 Z(*/-*/)2 78 162 222 168 222 258 42 78 78 42 1350 Дисперсия 39 81 111 84 111 129 21 39 39 39 21 а 6,345 9,0 10,536 9,165 10,536 11,358 4,583 6,245 6,245 4,583 78,536 Ошибка -2,0 0,8 2,3 1,0 2,3 3,2 -3,6 -2,0 -2,0 -3,6 - А? 4,0 0,6 5,3 1,0 5,3 10,2 13,0 4,0 4,0 13,0 60,0
Средняя из выборочных дисперсий равна генеральной дисперсии, но только в том случае, если и генеральная дисперсия, и каждая из выборочных дисперсий вычислены с учетом потери одной степени свободы (это не указывается в учебниках)1. Теперь извлечем из дисперсий квадратный корень и получим выборочные оценки а, найдем их ошибки °"/"°ген ~^at и их квадраты. Как видим, средняя из выборочных оценок о-х не равна генеральной а. Выходит, что дисперсия по выборке — несмещенная оценка, а корень из нее — а — смещенная оценка! Но в этом нет ничего нового. Известно, что средний квадрат всегда больше, чем квадрат средней величины, или, в крайнем случае, равен: (Х)2<Х2. Отсюда (авыб)2 <а2, т.е. средняя выборочная оценка а меньше, чем генеральная а. Соответственно, средняя ошибка (квадратическая) выборочных оценок а, в нашем примере она составила I— =2 44 не V ю равна, а намного больше, чем средняя ошибка выборочной оценки а по обычно приводимой в учебниках формуле та. = ° 8,216 т.е. та. =——— = 1,85. Это еще не приняв во внимание беспов- торность выборки, а если еще принимать поправку на беспов- торность, то получим: п 1-—= 1,85-0,632 = 1,17, N что вдвое меньше, чем фактическая средняя ошибка репрезентативности 2,44. Таким образом, по крайней мере для малых выборок, обычной формулой ошибок выборочной оценки а пользоваться не следует. Итак, можно сделать вывод о том, что и обычно приводимая в учебниках формула средней ошибки репрезентативности ко- 1 См.: Теппоева Т.В. Необходимая поправка в изложении теории выборочной оценки дисперсии // Вопросы статистики. - 2004. - № 12. - С. 35-37. 125
эффициента вариации также, по крайней мере при малых выборках, неверна. Вряд ли имеет смысл перечислять формулы ошибок для всех возможных показателей (темпов, коэффициентов связи и т.п.) да еще по всем возможным типам и формам выборок! Некоторые из обычно применяемых формул приведены в приложении 5. Много формул приводится в книге Г.Ф. Лакина «Биометрия»1. Чтобы не забивать головы учащихся запоминанием бесчисленных формул, а книгу — обширными разъяснениями этих формул, целесообразно сформулировать общие правила применения категорий «ошибка репрезентативности выборочных оценок», основанные на понимании тех факторов, которыми эта ошибка определяется (см. разд. 3.8). 3.7. Серийная и многофазная выборки Серийная выборка - это выборка, состоящая не из отдельных единиц совокупности, а из их групп - серий. Единицей учета в ней является не отдельная единица совокупности, а серия, обладающая средними значениями признаков нескольких единиц совокупности. О причинах применения и об организации серийной выборки сказано в разд. 1.3. Здесь рассмотрена только математико-статистическая теория определения средней ошибки серийной выборки. Предположим, имеется большая (N > 10000) совокупность крестьянских хозяйств, из которой выборочно изучается 400 хозяйств, сериями по 20 хозяйств в серии. Признаки серий — средние величины 20 хозяйств, входящих в каждую серию. Число серий обозначим /я, а размер серии — р. Общий объем выборки п = тр. Будет получено т значений каждого признака, т.е. 20 от сокращения числа изучаемых величин признака в 20 раз, средняя ошибка возрастет в 720 раз. Но зато каждые 20 значений признака — это средняя из 20 индивидуальных величин. От осреднения значений признака по сериям вариация серийных средних уменьшится в V2 раз, т.е. <тсер=ообщ :>/20. Уменьшение числа единиц учета будет компенсировать уменьшение вариации серийных средних в сравнении с вариацией индивидуальных значений признака, а средняя ошибка выбор- 1 См.: Лакин Г.Ф. Биометрия. - М.: Высшая школа, 1968. - 287 с. 126
ки останется такой же, как была бы при индивидуальной выборке 400 хозяйств: SlP _ ао6щ / ш yjn: р yjn Таким образом, серийный отбор не приведет к возрастанию средней ошибки выборки, ее репрезентативность не снизится, если внутри серий нет существенной связи между индивидуальны- ми значениями признака. Если же такая связь есть, то снизится вариация внутри серий, но зато возрастет вариация между сериями, т.е. асер в р раз не меньше о^щ, а больше. Тогда нарушается компенсация, и ошибка при серийном отборе может стать больше, чем была бы при индивидуальном отборе 400 единиц. Это возможно, если серия — это рядом расположенные хозяйства, имеющие местные общие факторы, влияющие на результат производства. При образовании серий вовсе не обязательно, чтобы т = р9 400 хозяйств можно разделить на 16 серий по 25 хозяйств, или на 25 серий по 16 хозяйств. Пусть а^щ = 30, р = 16, т = 25. Тогда сСер = ""Tfir"= 7>5» wcep = ~7=!г = "Г"= 1>5# При индивидуал ь- а 30 ном отборе 400 хозяйств было бы: т- ? щ = — = 1,5. При 16 сериях по 25 хозяйств в каждой: р = 25; т = 16 асер = ~7тт = Ф асер 6 6 '"сер =~г^ = ~7=:=7:=:1'5- (Но необходимо учесть ранее сделан- \1т VI6 4 ную оговорку о внутрисерийной связи!) Реально величина серий зависит от объекта учета. Например, если на каждую серию для мониторинга, скажем, семейных бюджетов, назначается отдельный учетчик, то величина серии - это то количество домо- хозяйств, которое в состоянии обслуживать один учетчик, примерно 25-30 домохозяйств. Многофазная выборка — это выборка, состоящая из нескольких последовательных фаз, каждая последующая из которых есть часть предыдущей, с меньшим объемом единиц и с большей программой. Иногда I фаза - это сплошной учет всей совокупности, с программой из 20 пунктов; II фаза — выборка 10% единиц совокупности с программой из 35—40 пунктов; III фаза - 127
выборка 2% единиц (I II фазы) с программой из 60—80 пунк- 5 (I \ тов; IV фаза - выборка 0,5% единиц - П1 фазы с программой в 150 пунктов. Программа каждой фазы вводится в программы следующих фаз, и единицы каждой фазы - часть объема предыдущих фаз, а не отдельные выборки! Такая многофазная выборка позволит экономно реализовать очень большую программу, сохраняя однородность единиц, входящих во все фазы. Еще в XIX в. земские статистики в России реализовали многофазную выборку крестьянских дворов в ряде губерний, например в Пензенской (об организации многофазной выборки см. разд. 1.3). Что касается математической стороны, то ясно, что мера репрезентативности выборки на каждой фазе будет различной, а следовательно, ответы на вопросы программы будут иметь разную степень точности и (или) надежности — наименьшую при последней фазе. Возникнут нарушения математических условий при изучении, скажем, связи, корреляции признаков, учтенных на разных фазах. В силу этого признаки, связи которых предполагается измерять, следует включать в программу одной и той же фазы. 3.8. Факторы и правила, определяющие величину ошибки репрезентативности Можно назвать такие общие правила применения категорий «ошибка репрезентативности выборочных оценок»: 1. Логически бесспорна зависимость величины ошибки репрезентативности от вариации признака в генеральной совокупности. Эта зависимость — прямая, как правило - прямо пропорциональная аген. При отсутствии вариации признака ошибка равна нулю. Чем более однородна совокупность, тем меньше ошибка выборочных оценок. 2. О применении поправки на бесповторность отбора. Если объем выборки п мал в сравнении с численностью генеральной совокупности, скажем, п < 0,01 N, поправкой можно пренебречь. Во многих учебниках по математической статистике вообще об этой поправке не говорится, так как имеется в виду обработка экспериментальных данных как выборки из гипоте- 128
тической бесконечной совокупности возможных результатов опыта. В социально-экономических исследованиях поправка на бес- повторность не учитывается, если под оценкой параметра связи, или вариации, или динамики имеется в виду общая закономерность, а не наблюдаемый факт. Например, по данным о 17 областях ЦФО России изучается связь объема ВВП со стоимостью производственных фондов (капитала). Ошибка репрезента- тивности коэффициента корреляции будет: mr = J——. Хотя «выборка» эта бесповторная, поправка не делается, если имеется в виду общая закономерность связи ВВП с его фактором в условиях этих 17 субъектов ЦФО РФ и в условиях определенного года вообще, т.е. если эти 17 субъектов есть «выборка» из бесконечного множества таких же условий. Если же, например, из совокупности в 190 агрофирм области сделана выборка в _L т.е. п= 19; N= 190 и выборка беспов- 10' торная, средняя ошибка оценки коэффициента корреляции между объемом реализованной продукции и основным капиталом г = 0,48, то поправка на бесповторность необходима: lit _ 11 (0,42) h_JJL=o2O9 и коэффициент значим, а без г V 18-2 V 190 ' поправки он был бы на грани незначимости. 3. Вероятностная оценка ошибки репрезентативности возможна только тогда, когда при осуществлении выборки (отбора) применялся случайный отбор. Если выборка многоэтапная, то вероятностная оценка ошибки производится только по тем ее этапам (фазам), при которых отбор был случайный. По этапам с неслучайным отбором оценка ошибки репрезентативности возможна экспертным способом либо не производится вообще. 4. Если случайный отбор применялся по двум или нескольким фазам выборки, то общая ошибка репрезентативности по этим этапам (фазам) вычисляется по правилу сложения дисперсий, т.е.: 9 - 2394 1 29
а) при независимости этапов «а» и «в» друг от друга б) при связи этапов с коэффициентом корреляции г : та+в = + тв + 2татвга (3.22) 5. Если заведомо известно, что ошибка регистрации данного признака много больше, чем средняя ошибка репрезентативности случайной выборки, то независимо от того, применяется ли случайный отбор или нет, не следует вообще рассчитывать ошибку репрезентативности методами математической статистики (во избежание дискредитации этих методов). Следует ограничиться экспертной оценкой ошибки. 6. Если существуют серьезные теоретические основания считать, что распределение значений признака в выборке должно подчиняться определенному закону (например - закону Гаусса—Лапласа), а результат обследования показал «облом» кривой на участке высших значений (доходов, например), то «достроив» наблюдаемую часть распределения до «нормального» вида по закону, можно оценить «серую» ненаблюдаемую часть распределения и оценить корректированные параметры средней величины, дисперсии и дооценить ошибку репрезентативности (рис. 3.3). Наблюдаемая часть распределения Ненаблюдаемая часть распределения t Рис. 3.3. «Достройка» кривой распределения до нормальной 7. С ростом объема выборки п ошибка репрезентативности уменьшается пропорционально 7й, т.е. замедляется по сравнению с затратами на проведение выборки, которые возрастают пропорционально п. Необходимо находить «баланс интересов» 130
точности и стоимости выборочного исследования. Большие выборки целесообразны либо тогда, когда они заменяют еще более затратное сплошное наблюдение, либо по особо важным практическим проблемам и при отсутствии другой необходимой информации. 3.9. Малая выборка Малой считается выборка, объем которой меньше той границы, с которой распределение вероятностей ошибок репрезентативности начинает заметно отклоняться от нормального закона Гаусса-Лапласа. Это распределение называется распределением Стьюдента. Его изучал английский математик Вильям Госсет (1876-1937), опубликовавший свое исследование под псевдонимом «студент» (student). В отличие от нормального распределения распределение Стьюдента зависит не только от s и Г, но еще и от числа степеней свободы вариации п-\. Чем меньше число степеней свободы, тем меньше вероятность, что ошибка репрезентативности не выйдет за границы: —t - т < а < t • т. Например, при 20 степенях свободы и t = 2 эта вероятность равна 1-0,06 = 0,94, а при 6 степенях свободы уже 1—0,09 = 0,91 (соответственно «значимость» 0,06 и 0,09). Иначе говоря, при 6 степенях свободы для надежности 0,95 нужно иметь 2,46-кратную среднюю ошибку, а при 20 степенях свободы достаточно иметь 2,09-кратную среднюю ошибку. Казалось бы, малая выборка - невыгодна, но с другой стороны — она дешевле «большой выборки», а в ряде случаев применение малой выборки вынужденное, так как число реальных единиц совокупности, например автозаводов в стране, заведомо меньше 20. Чаще всего считают выборку «малой», если п < 30 единиц. При п > 30 распределение Стьюдента уже почти не отличается от нормального. В разд. 3.5 было сказано, что малая по объему выборка почти совершенно непригодна для определения долей. Только для долей очень близких к единице малая выборка может дать достаточно надежные и точные оценки генеральных параметров. Это относится и к мерам корреляционной связи. Если малая выборка является результатом опыта, то следует особенно тщательно позаботиться о «чистоте» опыта, т.е. по *• 131
возможности устранить влияние случайных факторов на результат, снизить дисперсию. Малая выборка может являться последней фазой многофазной выборки, так как с каждой следующей фазой объем выборки уменьшается (см. разд. 3.5). В этом случае для повышения репрезентативности последней фазы выборки, учитывая большую ее программу, на обследование следует направлять наиболее опытных учетчиков, способных предельно сократить ошибки регистрации, чем и компенсировать рост ошибок репрезентативности. 3.10. Средняя ошибка репрезентативности признака-произведения Встречаются ситуации, когда выборочное изучение признака - результата какого-то процесса затруднительно или слишком трудоемко, но можно провести выборочное изучение факторов - сомножителей. Например, по выборке фермерских хозяйств труднее вести наблюдение за годовым надоем молока, но гораздо легче выборочно определить среднее поголовье коров на хозяйство, средний надой молока на одну корову. Предположим, что среднее поголовье коров на одно хозяйство в области равно 32,6 (X) со средней ошибкой 2,5 головы ^пгх), а средний надой на одну корову составит 12,8 кг в сутки (Z), при средней ошибке тх = 0,5 кг. Тогда среднесуточное производство молока на одну ферму составит: у = х Z= 32,6 • 12,8 = = 417,28. Средняя ошибка признака-произведения неравна, как часто неверно полагают, произведению средних ошибок сомножителей: 2,5 • 0,5 = 1,25 кг. Такой результат означал бы, что ошибка надоя на корову распространяется только на ошибку поголовья\ На самом деле ошибка надоя должна относиться и ко всей величине поголовья, т.е. к средней х, а не к тх. То же относится и к ошибке поголовья, которую следует распространить на весь удой, а не на его ошибку. Складывать дисперсии можно лишь тогда, когда они выражены в единицах одного и того же признака - в объемах производства молока. Получаем следующую формулу средней ошибки объема производства, при условии, что ошибки поголовья и надоя не коррелированы между собой (скорее всего, так оно и есть): 132
= ^/(2,5-12,8)2 + (0,5-32,6)2 = Vl 024+ 266 = 35,92 кг. (3.23) В данном примере основная часть общей ошибки возникает из-за ошибки в факторе X - поголовье. Как общее правило, вариация объемных факторов больше, чем вариация качественных, интенсивных факторов, поэтому ошибка за счет объемного фактора и составляет преобладающую часть общей ошибки. Если между факторами существует значимая связь, то это необходимо учесть при расчете ошибки репрезентативности признака-произведения. Формула ее примет вид 'Я., = \/(/Лу *Z I +[ni-7'X] +2/1ly 'П2у ' X Z ' /Vt • Если корреляция прямая, ошибка станет больше, чем по формуле (3.23), а при обратной связи между факторами ошибка станет меньше, чем по формуле (3.23), так как отклонения факторов от средних частично станут погашаться. Если результативный признак — произведение трех сомножителей-факторов, то средняя ошибки каждого из них должна взвешиваться на произведение средних величин двух других факторов, т.е. у = а • Ь - с, и расчет ошибки результата примет вид (при отсутствии корреляции факторов между собой) =МтаЬ-с} +(/И£-я-с) +[nic-a-b\ . (3.25) ту В качестве упражнения предлагаем учащимся самим составить формулы для четырех факторов и для случая наличия связи между факторами (множественная корреляция). 3.11. Выборка во времени Чтобы проследить за изменением наблюдаемого признака в течение некоторого процесса, необходима выборка во времени; например, чтобы определить среднюю температуру воздуха в городе за месяц, необходимо проводить измерения в раз- 133
ные дни, а часто — и в разные часы суток. Как наиболее рационально разместить п наблюдений по всей длине периода времени? Логически ясно, что чем слабее колебания во времени изучаемого признака, тем меньше требуется наблюдений и тем легче их разместить во времени. Но важен также и характер колебания. Если колебания строго периодические, скажем, маятниковая миграция в городе — на работу (учебу и т. п.) и обратно, то наблюдение следует размещать так, чтобы они попадали на все фазы процесса. При этом сами наблюдения должны размещаться не через равные промежутки времени, а с частотой, не совпадающей с суточным циклом колебания поездок горожан, т.е. один раз за 4 часа: в 9 ч (пик!), в 13 ч (min), 17 ч (пик), в 21 ч и в 01 ч (min). Для получения средней суточной температуры воздуха достаточно трех наблюдений: в 7—8 ч; в 15—16 ч; в 23—24 ч. Если же колебания изучаемого параметра имеют случайный характер, как, например, смена циклонов и антициклонов в течение месяца, то наблюдения могут размещаться строго равномерно, например, в определенное время ежесуточно (какой час - несущественно). Процесс сам собой «наведет» разные фазы непериодичных колебаний на эти стационарные часы наблюдений, и среднее атмосферное давление за месяц будет достаточно репрезентативно. При контроле качества продукции в массовом производстве, однако, нецелесообразно применять строго периодические наблюдения в течение смены: работники смогут, зная заранее час проверки качества, «подготовить» к проверке образцы продукции получше и в результате брак не будет выявлен выборочной проверкой. Методикой выборочного обследования объема перевозок пассажиров, пользующихся правом бесплатного проезда в пригородном сообщении на железнодорожном транспорте РФ, предусматривались следующие сроки проведения обследования: 1. Понедельник — с 7 до 8 ч 30 мин. в направлении к крупным городам. 2. Среда - с 17 до 19 ч в направлении из крупных городов: с 13 до 15 ч в обе стороны. 3. Пятница — с 16 до 18 ч в направлении из крупных городов. 4. Воскресенье — с 17 до 19 ч в направлении к крупным городам. 134
Таблица 3.9 Объем и структура пассажиров Срок Понедельник с 04°° до б30 Среда с IIю до 1430 Среда с 15°°до 1800 Пятница с 14ю до 17" Воскресенье с 14°°до 18м Число пассажиров (выборка) Всего 5306 5085 4428 5410 4673 Не имеют льгот 2843 3096 2393 3386 2699 В том числе «зайцы» 1027 - 961 1202 1090 Имеют 50-процентную льготу 438 704 765 553 881 Работники РЖД 1361 515 612 678 316 служащие 169 199 181 194 111 Ветераны, инвалиды 296 431 295 418 397 Прочие 200 140 182 181 209
Явно видно, что ставилась цель уловить максимальные («пиковые») объемы пассажиров, так называемую «маятниковую миграцию» работающих в крупных городах. Однако в республике Башкортостан в 2002 г. обследование с той же программой было проведено в иные сроки (табл. 3.9). Если считать, что местное время в Башкортостане на три часа опережает московское, то сроки обследования все равно не сходятся. Срок «среда с II до 14 часов» — это явно не максимум, а скорее минимум перевозок. Это привело к тому, что число пассажиров по всем срокам мало варьирует — см. таблицу. Изменения структуры, доли «льготников» явно несущественны, ибо средняя ошибка доли, которая близка к 0,5—0,6 составит при объеме выборки 25 поездов: JW(l-W) 0,5 Л t Средняя ошибка доли тп = т=— = — = 0,1 и с надежно- V25 5 стью 0,95 / = 2 имеет ошибку доли 0,1 • 2 = 0,2, а доля льготников = 0,579 ± 0,2, или от 78% до 38%. Что явно не дает ясного указания на их роль в перевозках пассажиров; меньшие доли по группам льготников будут иметь еще меньшую точность. Контрольные вопросы 1. Раскройте содержание понятия «ошибка репрезентативности выборочных оценок». 2. Как влияют на величину ошибки репрезентативности неоднородность генеральной совокупности и объем выборки? 3. Как зависит ошибка репрезентативности бесповторной выборки от ее доли в генеральной совокупности? 4. При каких условиях следует пользоваться таблицей распределения Стьюдента? 5. Раскройте содержание относительной ошибки репрезентативности. 6. Как определяется дисперсия показателей доли? 7. Как определяется средняя ошибка репрезентативности при повторном случайном отборе? 8. Охарактеризуйте способ формирования пропорциональной стратифицированной выборки. 9. Каково обязательное условие применения вероятностной оценки ошибки репрезентативности? 136
10. В каких случаях целесообразно применять стратифицированную выборку? 11. Раскройте особенности определения ошибки репрезентативности в условиях малой выборки. 12. Охарактеризуйте порядок расчета ошибки репрезентативности для признака-произведения. 13. Приведите примеры применения выборки во времени. 14. В чем состоит отличие распределения Стьюдента от нормального закона распределения Гаусса—Лапласа? 15. В каких условиях можно пренебречь поправкой на беспов- торность отбора? Глава 4 РАСЧЕТНЫЕ ПРОЦЕДУРЫ ПРИ ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЯХ Любое несплошное статистическое наблюдение требует решения двух вопросов, не возникающих при сплошных обследованиях: 1) определения объема обследуемой части генеральной совокупности, достаточного для достижения целей конкретного обследования: 2) определения размеров ошибок репрезентативности по основным наблюдаемым параметрам, т.е. оценки масштабов отклонения полученных по несплошному обследованию значений показателей от величины этих параметров по генеральной совокупности. Только в условиях такого вида несплошного наблюдения, как выборочное обследование, имеется возможность использовать разработанные в математической статистике модели, позволяющие произвести расчет указанных выше величин. Проведение выборочных обследований сопровождается выполнением следующих расчетных процедур и связанных с ними операций: • расчет необходимого объема выборочной совокупности, осуществляемый на этапе проектирования выборочного обследования; 137
• осуществление отбора единиц из основы выборки и составление перечня подлежащих обследованию единиц; • расчет значений ошибок репрезентативности показателей, полученных по материалам проведенного выборочного обследования, и оценка пределов, в которых при заданной вероятности находятся значения этих показателей по генеральной совокупности. 4.1. Предварительные расчеты при планировании выборочного обследования Такие расчеты выполняются после того, как определена цель исследования и получена необходимая информация об объекте. Например, в 2001 г. проводилось выборочное изучение индивидуальных торговцев в ряде областей РФ. В одной из них общее число индивидуальных розничных торговцев — генеральная совокупность — составила около 13000. В программе изучения рассматривалось до 10—15 показателей, характеризующих их деятельность. Исходя из этих условий было решено применить простую случайную выборку. Так как в число обследуемых показателей входили и доли (например, доля торговцев, имеющих собственные торговые площади, и доля арендаторов, доля торгующих только на рынках и вне рынков) было необходимо, чтобы объем выборки обеспечил достаточную точность и надежность оценки долей, хотя бы с точностью до 20% доли и с надежностью не ниже 0,9. Исходя из данных приложения 4, для долей 0,2 и более требуется объем выборки не ниже 269 единиц, что составляет 2,07% численности генеральной совокупности, т.е. « 2%. Если нужна оценка доли с надежностью 0,95 и с точностью не ниже 10% от доли, потребовалась бы выборка объемом не ниже 1601 единиц, т.е. 12,3% от генеральной совокупности соответственно в шесть раз возросли бы и затраты на это обследование. Однако вряд ли было бы это оправдано. Цели обследования — дать ориентировку администрации региона в том, что происходит в розничной торговле на рынках, лотках и т.д. — не требовали особо высокой точности и надежности оценок изучаемых показателей. Другое дело, если бы речь шла о выборочной проверке предпринимателей, например, автоперевозчиков грузов и тем более 138
пассажиров (такси, «маршруток»). Здесь требуется высокая надежность показателей, от которых зависит безаварийная работа транспортных средств, чтобы обеспечить безопасность жителей города и быстроту передвижения. Необходимый объем выборки для надежности 0,999 может превзойти общую численность генеральной совокупности, и это означает, что необходимо сплошное изучение, а не выборка. Третий случай таков: генеральная совокупность очень велика и составляет, скажем, 3000000 избирателей в городе. Чтобы изучить их намерения голосовать на выборах за ту или иную партию с точностью до 10% доли и надежностью 0,95 для партий, набирающих единицы процентов голосов, требуется выборка объемом 39600 единиц, т.е. около 1,3% населения, имеющего право голоса. Но затраты на обследование будут высоки (опрос 40000 человек — долгая и трудоемкая операция!). На практике ограничиваются опросом около 2000 человек, что дает точность в 20% доли и с надежностью 0,95 для долей, не меньших 0,05, либо с ошибкой доли 10% и с надежностью 0,9 для долей, больших чем 0,2, т.е. только для основных партий. Что следует предпочесть — высокую точность оценки показателей или высокую надежность при меньшей точности — зависит от «заказчика» выборочного исследования и его средств. Известно, что строй современных государств - так называемая представительная демократия, т.е. избиратели должны из своей среды выбрать таких представителей (членов Думы, парламента и т.п.), которые в максимально возможной степени выражали бы волю большинства, а лучше - всех избирателей. Таким образом, это задача на репрезентацию выборки. Пусть на 100 млн избирателей нужно избрать «парламент» из 500 представителей, или по одному представителю на каждые 200 тысяч избирателей. Как это сделать? Можно составить алфавитный список всех избирателей и отбирать механически каждого двухтысячного, но такая случайная выборка никак не обеспечит ни «качества» депутатов, ни того, чтобы были представлены интересы всех групп и слоев населения. Это была бы «игра в рулетку». Гораздо лучше выглядит территориально-соревновательная выборка: страна разбивается на 500 избирательных округов, в каждом из которых 5 или 10 партий выдвигают своих кандидатов, которые соревнуются за голоса избирателей. Но и такая 139
выборка никак не обеспечивает репрезентации всех слоев и групп населения. На практике «проходят» те кандидаты, которые выражают волю либо наиболее крупных групп народа, либо с помощью «пиара» проходят кандидаты, выражающие интересы правящих или богатых слоев общества. Можно предложить еще один вариант репрезентативной выборки: «профессионально-групповую» выборку. Например, в стране имеется 2400000 учителей школ, лицеев, колледжей; они из своей среды выбирают 2400000 : 200000 = 12 депутатов парламента. Работников транспорта в стране 1800000; они из своей среды избирают 9 депутатов. Рабочих промышленности 5600000, они избирают 28 депутатов и т.д. Возникают трудности с представительством редких профессий, скажем, работников цирков 65000, и они не могут избрать своего кандидата. Их можно соединить с артистами эстрады и т.д. Высшее звено управленцев тоже немногочисленно, но зато имеет наибольший опыт государственной деятельности и вряд ли целесообразно их из-за невысокой численности лишать представительства! «Идеальной выборки» в политике, видимо, достичь невозможно, но студенты могут попробовать обосновать еще не один вариант, обеспечивающий представительность избирателей в парламентах. Поскольку величина средней ошибки выборочных оценок зависит от дисперсии, или среднего квадратичного отклонения (а), признака в генеральной совокупности, а истинное их значение до выборки часто неизвестно, при проектировании выборки приходится экспертным способом оценивать эту величину. Применяются следующие оценки: 1. По данным за предыдущие периоды: этот прием хорош для стабильных, мало меняющихся во времени показателей, например, дисперсии роста людей одного возраста, температуры воздуха в среднем за год, числа детей в семье и т.д. Для быстро изменяющихся признаков, например, душевого дохода, этот способ не подходит. 2. По аналогии с известными показателями других, но связанных с X признаков Y, Z, W и т.д. Например, неизвестную дисперсию затрат на транспортные услуги можно оценить по дисперсии, или по а, расстояния от места проживания до места работы. Пусть а расстояния равна 4 км, а среднее расстояние — 12 км. Средний расход на транспортные услуги равен 800 руб./ 140
мес, тогда коэффициент вариации расстояния =^- = о,33, а оценка (расхода) равна: <*х'У= °'33"80°РУ6-= 267РУ6х 3. По максимуму, т.е. неизвестная дисперсия для относительного показателя (доли) как 0,52 = 0,255, а средняя ошибка репрезентативности доли будет равна и по заданной ошибке теперь можно найти требуемый объем выборки п. 4.2. Определение необходимого объема выборочной совокупности Одним из центральных вопросов, решаемых на этапе планирования выборочного обследования, является расчет объема выборочной совокупности, отвечающего установленным для данного проекта требованиям точности и надежности результатов. В предыдущем разделе были раскрыты теоретико-методологические аспекты этого вопроса. Но в практике выполнения расчетных процедур нередко возникает ряд частных задач, по которым необходимо принимать обоснованные решения. Для иллюстрации этого рассмотрим следующий пример. Предположим, что администрацией одного из регионов страны была поставлена задача сформировать базу данных о деятельности малого бизнеса в сфере жилищного строительства. Всего в регионе функционируют 375 строительных организаций, представляющих основной объект исследования. Кроме того, необходимо изучить состояние нескольких обеспечивающих строительство видов экономической деятельности - производство строительных материалов, добычу природного сырья для получения строительных материалов (глина, песок, камень и т.д.), снос старых зданий. В регионе имеется 96 организаций по производству строительных материалов, 36 организаций по добыче природных материалов и 24 организации специализируются на сносе старых зданий. Объем генеральной совокупности составляет 531 единицу. Исследование требовалось провести в условиях ограниченного объема финансирования и в краткие 141
сроки. Чтобы снизить трудоемкость и сроки выполнения работ, было принято решение использовать выборочный метод. Проектирование данного выборочного обследования включало следующие этапы. Определение вида выборочного наблюдения. Учитывая ограниченный объем генеральной совокупности и ее компактное пространственное размещение, нецелесообразно применять стратифицированную выборку. По этим же причинам нет необходимости производить многоступенчатый отбор. Решено произвести простой случайный отбор с использованием таблицы случайных чисел. Определение объекта исследования. Основным объектом исследования является изучаемая на выборочной основе генеральная совокупность строительных организаций. Дополнительно, по более краткой программе, должны быть изучены «предприятия-смежники» - производители строительных материалов; предприятия, добывающие местное сырье для производства строительных материалов; предприятия, осуществляющие снос старых зданий. Установление основы выборки. В качестве основы выборки решено использовать материалы территориальной базы данных «Генеральная совокупность объектов статистического наблюдения» и субрегистра «Строительные организации». Определение надежности оценок. В условиях данного исследования признано необходимым обеспечить надежность результатов на уровне 0,95 (/ = 2) для выборочных средних величин и 0,9 (/ = 1,65) для показателей доли. Получение перечня показателей, по которым на стадии проектирования должна быть задана мера точности. Программой обследования предусмотрено получение по каждой организации двух видов информации: а) данных бухгалтерского и управленческого учета - всего по 34 показателям за текущий и предыдущий год; б) формализованное интервью, содержащее около 20 вопросов (к «первым лицам» в организации) о состоянии и перспективах развития предприятия. Обследование предприятий-смежников будет производиться по сокращенной программе. На основе экспертных оценок, подготовленных группой экспертов (из числа специалистов исследовательского проекта и представителей заказчика), была сформирована система основных показателей для расчета необходимого объема выборки. Отобраны следующие шесть показателей: 142
• средняя численность персонала в последнем квартале; • средняя месячная заработная плата персонала за последний квартал; • фонд оплаты труда за последние девять месяцев; • объем реализации товаров собственного производства за последние девять месяцев; • средний месячный объем реализации товаров собственного производства в расчете на одного работника за последний квартал; • доля предприятий, осуществлявших в последнем квартале, наряду с реализацией товаров собственного производства, продажу товаров не собственного производства. Установление необходимой меры точности выборочных данных. По каждому из шести показателей группой экспертов были определены допустимые пределы ошибок репрезентативности: • два человека - по показателю численности персонала; • 0,5 тыс. руб. — по показателю средней месячной заработной платы персонала; • 0,15 млн руб. - по показателю фонда оплаты труда; • 1,4 млн руб. - по показателю объема реализации товаров собственного производства; • 3 тыс. руб. — по показателю среднего месячного объема реализации в расчете на одного работника; • 2% — по показателю доли предприятий, осуществлявших, наряду с реализацией товаров собственного производства, продажу товаров несобственного производства. Получение приближенной оценки предполагаемой величины дисперсии по каждому показателю. Для получения оценок дисперсии использованы материалы ежеквартальных выборочных обследований малых предприятий по форме № ПМ «Сведения об основных показателях деятельности малого предприятия» и оценки группы экспертов. Для расчета необходимого объема выборки приняты следующие значения средних квадратических отклонений (ох) и показателя доли (н>): • 11 человек - по показателю численности персонала; • 3,1 тыс. руб. — по показателю средней месячной заработной платы персонала; • 0,9 млн руб. — по показателю фонда оплаты труда; • 12 млн руб. — по показателю объема реализации товаров собственного производства; 143
• 18 тыс. руб. — по показателю среднего месячного объема реализации в расчете на одного работника; • 0,12 - по показателю доли предприятий, осуществлявших, наряду с реализацией товаров собственного производства, продажу товаров не собственного производства. Расчет необходимого объема выборки производится по формулам, представленным в табл. 4.1. Таблица 4.1 Формулы для определения численности выборки Вид выборочного наблюдения Вид показателя Способ отбора единиц повторный бесповторный Простая случайная выборка Средняя величина п = ■ А§ п =■ t2S2N Показатель доли п = - п = - w (\-w) Стратифицированная (пропорциональная) случайная выборка Средняя величина п =■ t2S2N 4 Показатель доли rw(\-w)N n = —z \ Серийная случайная выборка Средняя величина п = а! n = - t2S2R Показатель доли п = ■ t2wr{\-wr)N Для наших расчетов следует использовать формулы для простой случайной бесповторной выборки. Исходные числовые данные были приведены выше. Необходимо рассчитать, при каком объеме выборочной совокупности обеспечивается заданная точность каждого из рассматриваемых показателей по строительным организациям. Определим количество организаций, 144
которые необходимо обследовать для получения достоверных данных по следующим результатам: • численность персонала: 22112-375 оо - = 92 организации; 22-375+22-112 • средняя месячная заработная плата персонала: 22-3 I2-375 —- ! г г- = 109 организаций; 0,52-375 + 22-3,1 • фонд оплаты труда: 22 0 92-375 ' = 104 организации; 0,152375 + 220,92 объем реализации товаров собственного производства: 22-122-375 1,42-375 + 22-122 = 135 организаций; • средний месячный объем реализации товаров собственного производства в расчете на одного работника: 22-182-375 = 104 организации; 32-375 + 22-182 • доля предприятий, осуществлявших, наряду с реализацией товаров собственного производства, продажу товаров не собственного производства: 1,652 0,12*0,88 375 0,022-375 + 1,652.0,12-0,88 = 246 организаций. По первым пяти показателям необходимый объем выборки колеблется от 92 до 109 единиц. В качестве компромиссного решения можно принять объем выборки в 100 единиц, что со- 10-2394 145
ставит 26,6% от объема генеральной совокупности строительных организаций. По показателю доли необходимый объем выборки несоразмерно велик. Поскольку этот показатель не относится к числу наиболее значимых характеристик, придется пренебречь возможностью получения по нему достоверных выборочных данных и ограничить объем выборки 100 единицами. Аналогичные расчеты необходимого объема выборки проводятся по трем вспомогательным массивам предприятий с той лишь разницей, что применяется алгоритм расчета, предусмотренный для малой выборки (см. разд. 3.9). Результаты проведенных расчетов оказались следующими. Должны быть обследованы 24 предприятия по производству строительных материалов, 18 предприятий по добыче местного сырья и 12 предприятий, осуществляющих снос зданий. Таким образом, из общего объема 531 предприятия планируется обследовать 158 предприятий, что составит в среднем 29% от объема генеральной совокупности. 4.3. Проведение отбора единиц и организация обследования Рассмотрим пример. Необходимо отобрать 100 строительных предприятий из общего их числа в 375 единиц методом случайного отбора. Используем таблицу случайных чисел (приложение 1). Объем генеральной совокупности представлен трехзначным числом, поэтому в таблице используются только первые три цифры случайных чисел, которые не превышают величину 375. Из первого ряда случайных чисел отбираются значения: 289, 166, 121. Из второго ряда - 248, 325, 220. Из третьего ряда — 008, 112, 329 и 174. Пока набрано только десять чисел. Отбор следует продолжать до получения всех ста чисел. Полученные числа соответствуют порядковым номерам предприятий в списке основы выборки. Аналогичным образом производится отбор предприятий по производству строительных материалов, по добыче сырья и по сносу старых зданий. Резервные списки не составляются в связи с небольшим общим объемом выборочной совокупности и высоким качеством основы выборки. 146
При составлении списка единиц выборочной совокупности следует указывать наименование и адресные данные по каждому предприятию. На основе полученного общего списка формируются частные списки для переписчиков в соответствии со средним объемом нагрузки на одного интервьюера (переписчика). Главным принципом формирования частных списков является ориентация на удобство работы переписчика, т.е. компактность территориального размещения предприятий и их транспортная доступность. Объем нагрузки на переписчика определяется с учетом затрат времени на обследование одного предприятия и плановой продолжительности периода обследования. Возможны разные способы организации обследования. В нашем условном примере программой предусмотрен сбор информации двух видов: а) получение показателей бухгалтерского и управленческого учета и б) изучение мнений топ-менеджеров о состоянии и перспективах развития предприятия. Можно поручить одному переписчику собирать информацию по обоим разделам программы обследования либо направлять в каждую организацию по два переписчика, каждый из которых специализируется по своему разделу программы. Преимуществом первого способа является то, что, хорошо владея информацией по первому разделу и зная экономические показатели предприятия, переписчик успешнее сможет провести интервью с топ- менеджером. При втором способе имеется возможность поручить реализацию второй части программы обследования специалистам, владеющим знаниями не только в области экономики, но и психологии, что позволит более умело установить личный контакт с респондентом при проведении интервью. В нашем обследовании предпочтение было отдано первому варианту с учетом того, что обследуются малые предприятия, где руководящий персонал и работники учета представлены крайне ограниченным числом лиц. Другой пример. При обследовании строительных организаций из 100 единиц выборочной совокупности были обследованы 93 предприятия. Из семи необследованных предприятий одно оказалось в стадии банкротства, три предприятия к моменту обследования были ликвидированы и три предприятия не были найдены по указанным адресным данным. Их замена другими предприятиями не производилась, итоги обследования разраба- ю« 147
тывались по обследованным 93 предприятиям. Обследование дополнительных трех выборочных массивов предприятий (производство строительных материалов, добыча сырья и снос зданий) было проведено в соответствии с планом выборки. 4.4. Характеристики точности выборочных данных и оценка параметров генеральной совокупности После завершения обследования была осуществлена разработка его итогов по заранее установленной программе. Из обширного массива полученный информации мы рассмотрим только данные по строительным организациям и тем шести показателям, которые были приняты за основу при расчете необходимо объема выборки (см. разд. 4.2). В табл. 4.2 приведен фрагмент массива информации по обследованным строительным предприятиям. По 93 обследованным предприятиям были вычислены средние значения рассматриваемых показателей и определена величина среднего квадратического отклонения по каждому показателю (табл. 4.3). Среднее квадратическое отклонение необходимо для расчета предела ошибки репрезентативности. На основе выборочной средней и величины предела ошибки определяются границы, в которых находится значение соответствующего показателя по генеральной совокупности. Сопоставляя показатели средних квадратических отклонений по выборке с теми условными значениями, которые были приняты на этапе проектирования выборки, можно заметить, что фактическая степень неоднородности совокупности оказалась по всем показателям несколько выше предполагавшейся. Из этого следует, что ошибки репрезентативности также будут превышать, хотя и ненамного, те их гипотетические значения, которые были заложены в модель расчета необходимого объема выборочной совокупности. Для определения степени точности выборочных данных необходимо рассчитать по каждому показателю предел ошибки репрезентативности, выразив его в абсолютной и относительной формах. В приложении 4 найдем формулы средних ошибок при простой случайной бесповторной выборке для средних и 148
Таблица 4.2 Показатели экономической деятельности строительных организаций Номер предприятия I 2 3 4 5 6 7 8 9 10 Численность персонала, чел. 34 74 53 29 93 13 5 18 12 62 Фонд оплаты труда за 9 мес, млн руб. 3,19 3,81 3,68 0,81 4,20 0,94 0,36 1,49 0,42 5,39 Среднемесячная заработная плата, тыс. руб. 10,4 5,7 7,7 3,1 5,0 8,0 8,0 8,3 3,5 9,4 Реализовано продукции собственного производства за 9 мес, млн руб. 11,3 124,4 19,2 5,9 34,1 6,1 0,4 5,1 1,3 46,9 Реализация продукции на одного работника, тыс. руб. 33 188 40 23 41 52 11 31 13 85 Реализация продукции не собственного производства нет нет нет да нет нет нет нет да нет
Таблица 4.3 Выборочные показатели по 93 строительным организациям Выборочные показатели Средние значения (доля) Среднее квад- ратическое отклонение Численность персонала, чел. 34 13 Фонд оплаты труда за 9 мес, млн руб. 2,47 0,12 Среднемесячная заработная плата, тыс. руб. 7,4 3,4 Реализовано продукции собственного производства за 9 мес, млн руб. 20,4 15,0 Реализация на одного работника, тыс. руб. 57 20 Доля предприятий с реализацией продукции не собственного производства 0,16 —
показателей доли. Предел ошибки репрезентативности определяется как произведение коэффициента доверия (кратности ошибки) и средней ошибки: Формула предела ошибки репрезентативности для средних: A,=<-J-|l~|- Формула предела ошибки репрезентативности для показателя доли: V W (1-w) n N Расчеты пределов ошибок репрезентативности необходимо произвести с доверительной вероятностью 0,954, при которой коэффициент кратности ошибки / составляет 2. Произведем расчет предела ошибки репрезентативности для каждого показателя. Численность персонала: A, =2J— -0,752 =2,3«2 чел. Л V 93 Средняя месячная заработная плата персонала: A? =2*P 0,752 =0,61 =0,6 тыс. руб. Фонд оплаты труда: 752 =0,02 млн руб. 93 151
Объем реализации товаров собственного производства: А* = 2 J—• 0,752 = 2,69 - 2,7 млн руб. Средний месячный объем реализации товаров собственного производства в расчете на одного работника: =2J — 0,752=0,61«3,6тыс.руб. Доля предприятий, осуществлявших наряду с реализацией товаров собственного производства продажу товаров не собственного производства: 0>84 °'752 = °'066(6'6%)- Относительная величина предела ошибки репрезентативности для средних и показателей доли определяется по формулам = 4f 100; j К = ^100. w Например, по показателю численности персонала К = — . 100 = 0,0588 «0,06. 34 Результаты выполненных расчетов и данные о границах, в которых находятся рассматриваемые показатели по генеральной совокупности, представлены в табл. 4.4. 152
Таблица 4.4 Оценки характеристик генеральной совокупности Показатель Предел ошибки репрезентативности Относительная величина предела ошибки репрезентативности По генеральной совокупности Численность персонала, чел. 2 0,06 32-36 Фонд оплаты труда за 9 мес, млн руб. 0,02 0,01 2,45-2,49 Среднемесячная заработная плата, тыс. руб. 0,6 0,08 6,8-8,0 Реализовано продукции собственного производства за 9 мес, млн руб. 2,7 0,13 17,7-23,1 Реализация на одного работника, тыс. руб. 3,6 0,06 53-61 Доля предприятий с реализацией продукции не собственного производства 6,6% 0,41 9-23%
Расчет этих показателей для средних и показателей доли производится по формулам х - А у < х < х + А д.; w-Aw < р< w + Ац,. Например, по генеральной совокупности средняя численность персонала на одно строительное предприятие составляет 34-2 <х< 34 + 2; 32 чел. < х < 36 чел. Анализируя полученные результаты, можно сделать вывод о том, что для оценки доли строительных предприятий, реализующих не только продукцию собственного производства, но и товары не собственного производства, полученная выборочная совокупность не может обеспечить репрезентативные данные, как это и предполагалось на этапе проектирования выборки. Такой вывод подтверждается очень высоким значением показателей абсолютной (6,6%) и относительной (0,41%) величины предела ошибки репрезентативности, а также чрезмерно широкими границами, в которых находится показатель доли по генеральной совокупности (от 9 до 23%). Недостаточной оказалась надежность выборочных данных по показателю объема реализации товаров собственного производства за 9 месяцев, где предел ошибки репрезентативности равен 2,7 млн руб., или 13% среднего значения показателя объема реализации по выборочной совокупности. Соответственно с вероятностью 0,954 можно утверждать, что границы, в которых находится генеральная средняя, являются весьма неопределенными и составляют от 17,7 до 23,1 млн руб. Несколько великоватой оказалась ошибка репрезентативности по показателю средней месячной заработной платы персонала. По остальным показателям ошибки репрезентативности выборочных данных находятся в допустимых пределах и, следовательно, обеспечена необходимая степень точности оценок показателей по генеральной совокупности. За пределами нашего анализа осталась большая часть системы выборочных показателей по строительным организациям, 154
так как программа обследования содержала несколько десятков характеристик. В прикладных социально-экономических исследованиях применяются компьютерные программы для проверки репрезентативности всех или наиболее значимых показателей, что позволяет получить комплексную оценку уровня достоверности материалов выборочного обследования. Контрольные вопросы 1. Приведите примеры влияния цели исследования на необходимую меру точности выборочных показателей. 2. Какие на практике применяются способы приближенной оценки среднего квадратического отклонения на этапе проектирования выборки? 3. Назовите основные факторы, влияющие на величину средней ошибки выборочных оценок. 4. При каких условиях можно для оценки среднего квадратического отклонения использовать данные за предшествующий период? 5. Какие данные могут быть использованы в качестве основы выборки при обследовании малых строительных организаций? 6. Каким способом можно принять решение о необходимой мере точности выборочных данных на этапе проектирования выборки? 7. По какой формуле рассчитывается необходимый объем выборки для показателя доли при бесповторном простом случайном отборе? 8. Какими принципами следует руководствоваться, если для обеспечения репрезентативности разных показателей требуется разный объем выборочной совокупности? 9. Как пользоваться таблицей случайных чисел при формировании выборочной совокупности методом простого случайного бесповторного отбора? 10. С какими причинами может быть связана невозможность обследования некоторых единиц выборочной совокупности предприятий? 11. Как определить среднюю ошибку выборочной средней при простой случайной бесповторной выборке? 155
12. Как на основе данных о средней ошибке выборки рассчитать предел ошибки репрезентативности? 13. По какой формуле определяются границы значений изучаемого признака по генеральной совокупности на основе выборочных данных? 14. Как определяется относительная величина предела ошибки репрезентативности? 15. Как при анализе выборочных данных используется показатель относительной величины предела ошибки выборки? 16. На каком этапе работ используют основу выборки? 17. Почему может не совпасть величина предела ошибки выборки, определяемая на этапе проектирования, с величиной этого показателя, полученной по результатам проведенного выборочного обследования? 18. Как пользуются таблицей случайных чисел при определении перечня единиц выборочной совокупности? 19. Какова допустимая величина относительного значения предела ошибки выборки в экономических исследованиях? 20. Как определить необходимую для проведения обследования численность переписчиков?
ПРАКТИКА ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЙ Глава 5 ВЫБОРОЧНЫЕ ОБСЛЕДОВАНИЯ В СФЕРЕ ЭКОНОМИКИ Изложенные в предыдущих главах научно-методологические основы и организационные принципы выборочных обследований представляют большие возможности для выбора и обоснования конкретного проекта выборочного наблюдения с учетом задач и условий выполнения работ. Проводимые Рос- статом выборочные обследования отличаются исключительным разнообразием подходов к решению методологических и организационных вопросов. В данной главе рассмотрены наиболее значительные выборочные обследования, проводимые Росста- том в сфере хозяйственной деятельности, раскрыты особенности выборочных обследований в сфере малого предпринимательства и в аграрном секторе экономики, описаны некоторые обследования субъектов хозяйственной деятельности, посвященные изучению частных аспектов бизнес-процесса. 5.1. Выборочные обследования малых предприятий Важнейшим элементом рыночной экономики является малое предпринимательство, включающее три категории хозяйствующих субъектов: совокупность малых предприятий, крестьянские (фермерские) хозяйства и индивидуальных предпринимателей. В современной России этот сектор экономики является одним из самых динамичных, и поэтому необходим особенно 157
тщательный его мониторинг — отслеживание тенденций и факторов его развития. В данном разделе рассматриваются вопросы применения выборочного метода при сборе информации по двум группам субъектов малого предпринимательства - малым предприятиям и индивидуальным предпринимателям. В системе государственной статистики постепенно сформировались методологические основы учета малых предприятий. В настоящее время информация об их хозяйственной деятельности поступает в органы государственной статистики в виде нескольких форм выборочного наблюдения — № ПМ, № ДАП-ПМ, № 11 ПМ. Квартальными выборочными обследованиями по сокращенной программе охвачено около 20% малых предприятий. Это обеспечивает оперативность получения информации и сокращение нагрузки на респондентов. Но такая информация недостаточна для полноценного анализа состояния и тенденций развития малых предприятий. Необходимы также периодические сплошные обследования. В 2000 г. было проведено сплошное обследование тех субъектов малого предпринимательства, которые представлены юридическими лицами. Было также проведено сплошное обследование индивидуальных предпринимателей. В перспективе сплошные обследования субъектов малого предпринимательства будут осуществляться в рамках периодических экономических переписей хозяйствующих субъектов. На период 2007-2011 гг. совершенствование статистического наблюдения за субъектами малого предпринимательства признано в качестве одной из ключевых задач статистики предприятий. Как указано в Федеральной целевой программе развития государственной статистики на 2007-2011 гг., мобильность сектора малого предпринимательства требует более гибких инструментов наблюдения за малыми предприятиями. Наметившийся в последние годы существенный рост вклада индивидуальных предпринимателей в экономику страны также свидетельствует об актуальности мониторинга данной сферы хозяйственной деятельности, где основным способом статистического наблюдения является выборочный метод. Рассмотрим формы выборочного наблюдения. Статистическая отчетность по форме федерального государственного статистического наблюдения № ПМ «Сведения об основных показателях деятельности малого предприятия». Реа- 158
лизация мер государственной политики поддержки малого предпринимательства должна опираться на качественную статистическую информацию о состоянии и тенденциях развития этого сектора экономики. В соответствии с распоряжением Правительства РФ от 9 октября 1995 г. № 1389-р начиная с 1996 г. стали проводиться ежеквартальные выборочные обследования малых предприятий по форме № ПМ. Методологические основы, инструментарий обследований и правила организации обследования по форме № ПМ определяются на федеральном уровне Росстатом в строго централизованном порядке. Только при этом условии может быть унифицирован весь организационно-методологический комплекс и обеспечены сопоставимость информации, возможность получения сводных итогов по стране. Формирование выборочной совокупности и сбор информации осуществляются региональными органами государственной статистики1. Целью проведения статистического наблюдения за деятельностью малых предприятий является формирование показателей деятельности малых предприятий в разрезе регионов, отраслей экономики, форм собственности. Статистическую отчетность по форме федерального государственного статистического наблюдения № ПМ «Сведения об основных показателях деятельности малого предприятия» представляют юридические лица, отнесенные в соответствии с законом к субъектам малого предпринимательства. Установлены три критерия для идентификации малых предприятий (юридических лиц и индивидуальных предпринимателей) — организационно-правовой статус, численность работников и структура уставного капитала. По первому критерию к субъектам малого предпринимательства относятся только субъекты, осуществляющие коммерческую деятельность. Средняя численность работающих не должна превышать следующих предельных уровней: • в промышленности, строительстве и на транспорте - 100 чел.; 1 При подготовке изложенных далее материалов использована информация, содержащаяся в издании Госкомстата «Методологических положениях по статистике. — Вып. 3. — М., 2000. 159
• в сельском хозяйстве и научно-технической сфере — 60 чел.; • в розничной торговле и бытовом обслуживании населения - 30 чел.; • в оптовой торговле, остальных отраслях и при осуществлении других видов деятельности — 50 чел. В уставном капитале доля участия государственной и муниципальной собственности, собственности общественных и религиозных организаций, благотворительных и иных фондов не должна превышать 25%. Доля капитала, принадлежащая одному или нескольким юридическим лицам, не являющимися субъектами малого предпринимательства, не должна превышать 25%. В отчетности по форме № ПМ сведения представляются ежеквартально нарастающим итогом за период с начала отчетного года и за соответствующий период прошлого года. Сроки представления отчетов: 29 апреля, 29 июля, 29 октября и 29 января. Бланк отчета содержит несколько разделов, в которых представлена система основных показателей финансово-хозяйственной деятельности предприятий. В форму № ПМ и указания о порядке ее заполнения Росстатом периодически вносятся некоторые коррективы — вводятся новые показатели, отдельные показатели упраздняются, однако основной массив информации во всех версиях сохраняется стабильным. Форма № ПМ включает пять разделов: 1. Численность и начисленная заработная плата работников; 2. Общие экономические показатели; 3. Оптовая и розничная продажа товаров, оборот общественного питания; 4. Перевозка грузов и грузооборот автомобильного транспорта; 5. Производство и отгрузка по видам продукции. Ежегодно постановлением Росстата утверждаются два документа: форма квартальной отчетности № ПМ и инструкция — «Порядок заполнения и представления формы федерального государственного статистического наблюдения № ПМ "Сведения об основных показателях деятельности малого предприятия"». Весь цикл работ по выборочному обследованию малых предприятий подразделяется на три этапа. 1. Планирование выборки: а) формирование информации о генеральной совокупности малых предприятий (основы выборки) по состоянию на начало года; 160
б) формирование выборочной совокупности малых предприятий, используемой на протяжении года. 2. Сбор первичной информации от малых предприятий, ее ввод, контроль, корректировка, хранение. 3. Формирование сводных итогов: а) распространение данных, полученных при выборочном наблюдении, на генеральную совокупность и расчет характеристик точности получаемых результатов. б) формирование итогов обследования в целом по России, в разрезе субъектов Российской Федерации, отраслей экономики и промышленности, форм собственности. Росстатом установлены основные методологические принципы наблюдения по форме № ПМ. Основу выборки составляет ЕГРПО. Используются информация титульно-адресной части регистра и некоторые показатели. Отбор предприятий осуществляется методом 20-процентной расслоенной оптимальной случайной выборки автоматизированным способом. Применяется разработанный А.А. Чупровым и Дж. фон Нейманом метод оптимального стратифицирования выборки по показателю «выручка». Расчет объема выборки производится автоматически исходя из условия, что относительная предельная ошибка репрезентативности не должна превышать 5%. Расслоение производится по трем признакам: • по территории (на основе кодов ОКАТО) выделяются 79 слоев; • по отраслям экономики (на основе кодов ОКОНХ) с выделением 63 слоев; • по формам собственности (на основе кодов ОКФС) с выделением 4 слоев; • по объему выручки - 5 слоев. Размещение выборки (отбор единиц, подлежащих обследованию) производится автоматически. В выборочную совокупность не включаются предприятия, не представлявшие отчетности за предыдущие два года. Информация по вновь созданным, не представленным в регистре предприятиям определяется методом досчета. Ежегодно производится актуализация генеральной совокупности объектов статистического наблюдения — в ее состав вклю- "-2394 161
чаются все вновь зарегистрированные в истекшем году организации. Систематически осуществляется ротация (частичная замена единиц) выборочной совокупности малых предприятий. Технологический цикл планирования выборки, выполняемый в регионах в автоматическом режиме, включает ряд последовательных процедур, в том числе: • формируется основа выборки на базе территориального раздела ЕГРПО; • из основы выборки исключаются предприятия, не представлявшие отчетность последние два года подряд; • производится разграничение единиц генеральной совокупности на три массива: массив нетипичных предприятий; основной массив предприятий; массив предприятий, по которым отсутствуют сведения о выручке (предприятия не сдали отчетность); • рассчитываются статистические характеристики по каждому из трех сформированных массивов на основе трех признаков - среднесписочная численность работников, выручка, выпуск товаров и услуг; • производится разграничение генеральной совокупности на слои; • рассчитывается необходимый объем выборки по каждому массиву двумя способами - для пропорционального размещения и для оптимального размещения (расчет для оптимального размещения производится по методу Неймана); • рассчитывается объем выборки в каждом слое двумя способами — для пропорционального и оптимального (по Нейману) размещения выборки; • проводится размещение выборки (отбор единиц — формирование списка подлежащих обследованию единиц). При расслоенном случайном отборе с общим объемом выборки п единиц объем выборки по отдельным слоям равен1 NhSh 1 См.: Методологические положения по статистике. Вып. 3 / Госкомстат России. - М., 2000. - С. 71-72. 162
где nh - число единиц, выбираемых из Л-го слоя; h - номер слоя; Л^ — объем Л-го слоя; S,, — дисперсия Л-го слоя: 5/7 = ■: N 'Л'— л>- » где N - число слоев; уы — базовое значение признака /-и единицы наблюдения Л-го слоя; У/, - среднее значение признака по А-му слою. После завершения процесса сбора заполненных формуляров наблюдения осуществляется формирование сводных итогов обследования малых предприятий, включающее следующие 13 операций: 1. Установка и настройка ПТС. 2. Ввод первичных отчетов. 3. Кодирование ответов. 4. Контроль первичных данных. 5. Обработка «неответов» (коррекция и восстановление данных) по трем группам предприятий: • предприятия, прекратившие или приостановившие свою деятельность, по которым данные не восстанавливаются; • предприятия, не представившие отчет, но достоверно известно, что они ведут финансово-хозяйственную деятельность. Восстановление данных производится путем перевзвешивания или присвоения неответившему предприятию значений показателей, средних по слою; предприятия, по которым неизвестно, действующие они или нет. Один из способов коррекции — восстановление «неответов» путем случайного подбора информации из резервного списка предприятий. 6. Агрегированный контроль — выявление нетипичных единиц. 7. Формирование сводных итогов. 8. Контроль сводных итогов. 9. Формирование выходных таблиц. 10. Корректировка сводных итогов с помощью поправочных коэффициентов. и* 163
11. Создание сводных итогов с учетом коррекции. 12. Контроль качества выходной информации. 13. Формирование выходных таблиц для передачи на федеральный уровень — в целом по России, по отраслям экономики, по формам собственности. Одной из трудноразрешимых проблем обследования малых предприятий остается недостаточный уровень достоверности выборочных данных из-за непредставления форм статистической отчетности и искажения величины отчетных показателей. В обоих случаях при обработке материалов выборочного обследования малых предприятий производятся корректировка и досчет данных. Технологиям такой обработки информации большое внимание уделяется в российской и зарубежной статистической практике1. Основной причиной искажения и непредставления отчетной информации является стремление скрыть фактические данные в целях снижения бремени налогообложения. При статистической обработке неответов применяют метод перевзвешивания или метод замещения недостающих параметров. Метод перевзвешивания состоит в том, что разработка итогов производится по представленным отчетам, а при распространении результатов выборочного обследования на генеральную совокупность доля каждого слоя определяется по сумме представленных отчетов и неответов. Такой же результат дает присвоение неответам средних значений показателей по слою. Другим способом восполнения неответов является метод замещения недостающих параметров из совокупности представивших отчеты предприятий. Недостающая информация «моделируется» и присваивается неответившему предприятию (отдельному показателю) одним из следующих приемов: а) случайный подбор предприятия-донора из того же слоя; б) логический подбор данных при неответах на отдельные вопросы в представленных отчетах; б) замещение неответившего предприятия ближайшим соседом из того же слоя; в) моделирование значений недостающих показателей у представивших отчеты предприятий с помощью регрессионных или иных математических моделей. 1 См.: Литтл Р. Дж., Рубин Д.Б. Статистический анализ данных с пропусками. - М.: Финансы и статистика, 1991; Методологические положения по статистике. Вып. 2. — М.: Госкомстат России, 1998. 164
Слабой стороной применяемых методов досчета является заложенная в них гипотеза о тождественности экономических показателей неответивших организаций показателям по остальным организациям, входящим в состав данного слоя. Детальная стратификация существенно снижает риск смещения, но не способна его устранить полностью. Выборочное наблюдение за деловой активностью малых предприятий промышленности по форме № ДАП-ПМ «Обследование деловой активности малого предприятия промышленности». Приоритетная роль в развитии экономики принадлежит промышленности, поэтому именно по малым предприятиям, осуществляющим свою деятельность в промышленности, производится обследование по форме № ДАП-ПМ. Обследование по форме федерального государственного статистического наблюдения № ДАП-ПМ проводится ежеквартально в целях оперативного наблюдения за краткосрочными изменениями экономических показателей. На основе получаемых данных может быть осуществлено прогнозирование циклов экономической активности малых промышленных предприятий, могут выявляться тенденции ожидаемой деловой активности и определяться перспективы развития малого предпринимательства. Особенностью программы данного обследования является опрос мнений руководителей об основных направлениях деятельности малого предприятия, об их намерениях на ближайшую перспективу (3—4 месяца). Предприниматели дают оценку политики федеральных и местных органов в области экономики, определяют уровень использования производственных мощностей, оценивают роль факторов, ограничивающих рост производства, дают общую оценку экономической ситуации в целом. Анализ предпринимательской активности руководителей малых предприятий осуществляется по следующим основным направлениям: • индекс предпринимательской уверенности и его составляющие; • использование производственных мощностей; • численность занятых и прогноз ее изменения в ближайшие 3—4 месяца; • фактические и ожидаемые ценовые тенденции и уровень колебаний в запасах сырья и материалов, готовой продукции; • финансовая деятельность предприятий; 165
• факторы, ограничивающие рост производства; • инновационная деятельность; • оценка общей экономической ситуации1. Методика формирования выборочной совокупности при обследовании по форме № ДАП-ПМ примечательна в том отношении, что использована крайне редко встречающаяся в отечественной статистике модель многофазного отбора. Двухфазная выборка организована следующим образом. В качестве первой фазы выступает уже существующая выборка обследования малых предприятий по форме федерального государственного статистического наблюдения № ПМ «Сведения об основных показателях деятельности малого предприятия», из которой выделяются промышленные предприятия. Ранжированный перечень малых предприятий промышленности, подлежащих статистическому наблюдению по форме № ПМ, принимается за основу формирования выборки на второй фазе отбора. Из этой основы на второй фазе выборки производится систематическая (механическая) выборка. Минимально достаточным объемом выборки на второй фазе обследования для изучения деловой активности малых промышленных предприятий с учетом «неответов» признана выборка объемом в 300—360 единиц наблюдения. На второй фазе выборки предусмотрен следующий порядок отбора единиц. А. Обследуются все промышленные предприятия по списку единиц наблюдения, сформированному для выборочного наблюдения за деятельностью малых предприятий по форме № ПМ в пределах следующих отраслей промышленности: электроэнергетика; топливная промышленность; черная металлургия; цветная металлургия; стекольная и фарфорово-фаянсовая промышленность; мукомольно-крупяная и комбикормовая промышленность; медицинская промышленность; полиграфическая промышленность. Б. Для остальных отраслей промышленности производится механический отбор малых предприятий с дифференцированными долями отбора из списка единиц наблюдения, сформированного для выборочного наблюдения за деятельностью малых предприятий по форме № ПМ. 1 См.: Методологические положения по статистике. Вып. 3. — С. 78. 166
После сбора и редактирования первичной информации осуществляется распространение выборочных данных обследования деловой активности малых промышленных предприятий на генеральную совокупность в двух вариантах: а) по отрасли промышленности и б) по промышленности в целом. Для получения данных по генеральной совокупности на региональном уровне применяется особая процедура взвешивания. Полученные региональные итоги далее агрегируются по стране в целом. Статистическое наблюдение по форме № 11-МП «Сведения о наличии и движении основных фондов (средств) субъектов малого предпринимательства». Статистическое наблюдение за наличием и движением основных фондов малых предприятий по форме № 11-МП осуществляется в целях оценки наличия, движения, состава, износа, амортизации основных фондов, находящихся у субъектов малого предпринимательства. На основе этих данных составляется сводный баланс основного капитала по полной балансовой стоимости и с учетом износа. Генеральной совокупностью являются юридические лица — субъекты малого предпринимательства всех отраслей экономики на территории Российской Федерации. Итоги должны быть получены по стране в целом, по каждой отрасли экономики и по некоторым отраслям промышленности. Единицей наблюдения и единицей отбора является организация — субъект малого предпринимательства. В качестве основы выборки используется генеральная совокупность объектов статистического наблюдения, сформированная на базе ЕГРПО по состоянию на 1 января соответствующего текущего года. Отобранные субъекты малого предпринимательства группируются по отраслям экономики и отраслям промышленности. Таким образом, формируется перечень (каталог) объектов статистического наблюдения, в который дополнительно из базы бухгалтерской отчетности организаций заносится показатель наличия основных фондов на конец года по остаточной стоимости. Выборочная совокупность формируется методом расслоенного случайного отбора. Основа выборки расслаивается по территориальному признаку и по видам экономической деятельности. Распределение выборки по слоям осуществляется на основании оптимального распределения Неймана. 167
При невозможности получения формы статистического наблюдения от организаций, попавших в выборку, осуществляется восстановление недостающей информации методом присвоения средних значений показателей по слою, в состав которого входит неответившая организация. 5.2. Выборочные обследования индивидуальных предпринимателей Если обследования малых предприятий и фермерских хозяйств проводятся Росстатом на постоянной основе, то индивидуальное предпринимательство ранее непосредственно не являлось объектом статистического наблюдения со стороны органов государственной статистики в полном объеме, на постоянной основе и по единой методике. Отдельные категории индивидуальных предпринимателей обследовались в выборочном порядке. Основным источником информации о деятельности индивидуальных предпринимателей являлись данные о государственной регистрации, декларациях, имеющихся в налоговых органах, данные ЕГРПО и др. Часть информации получали методом «досчетов». Начиная с 2000 г. стали проводиться регулярные выборочные наблюдения за деятельностью индивидуальных предпринимателей в розничной торговле и на автомобильном транспорте. С 1 января 2004 г. изменился порядок государственной регистрации индивидуальных предпринимателей, что облегчило получение надежной информации об их деятельности. Особый характер имеет распределение индивидуальных предпринимателей по сферам деятельности. Подавляющая их часть занята в сфере розничной и оптовой торговли, достаточно распространенными являются такие виды деятельности, как ремонтные работы разного профиля, оказание транспортных услуг. Статистическое наблюдение за деятельностью индивидуальных предпринимателей — владельцев грузовых автомобилей. С 1996 г. на регулярной основе проводится ежеквартальное статистическое наблюдение за деятельностью индивидуальных предпринимателей - владельцев грузовых автомобилей. При организации этого обследования территориальные органы государственной статистики взаимодействуют с транспортной инспекцией своего региона. В транспортных инспекциях ведутся 168
регистры предпринимателей — владельцев грузовых автомобилей, имеющих лицензию на право заниматься перевозочной деятельностью в коммерческих целях. На базе этих регистров территориальными органами государственной статистики формируется стратифицированная основа выборки в виде пофамильного списка предпринимателей в алфавитном порядке. Каждому предпринимателю присваивается номер от 1 до N (N — общее число предпринимателей-грузоперевозчиков в регионе). Для формирования выборочной совокупности из этого списка производится случайный отбор с возвращением отобранных единиц в генеральную совокупность. В течение года в скользящем режиме обследуются все предприниматели. Доля отбора в слоях за каждый квартал составляет 25% от общего числа предпринимателей. Объем выборки (п) в каждом квартале определяется как произведение объема генеральной совокупности и доли отбора: п = 0,25 • N Далее определяется численность группы предпринимателей, подлежащих обследованию в течение недели (к). Для этого объем выборочной совокупности п надо разделить на 4 недели, в течение которых ежеквартально проводится обследование: к = п : 4. С использованием генератора случайных чисел производится извлечение выборочной совокупности к при наступлении очередной недели обследования, т.е. составляется список группы предпринимателей, подлежащих обследованию в течение предстоящей недели наблюдения. Поскольку применяется модель повторного отбора, возможны случаи, когда при составлении списка повторно выпадают одни и те же номера предпринимателей. В таких случаях повторяющиеся номера не включаются в выборочную совокупность и случайный отбор продолжается до получения необходимого недельного объема выборочной совокупности к. Всего за год составляется 16 списков по числу недель обследования. Все списки имеют равные объемы, а сумма единиц по 16 спискам равна объему генеральной совокупности N. Формирование каждого нового списка производится из полного объе- 169
ма генеральной совокупности N, поэтому возможно повторное обследование одних и тех же предпринимателей в течение одного и того же года. Таким образом, при данной технике формирования списков обследуемых один и тот же предприниматель не может быть повторно представлен в одном и том же списке, но может повторно появиться в другом списке. Общему числу таких повторных попаданий лиц в разные списки соответствует общее число предпринимателей, вообще не обследованных в данном году. Такой «дизайн» выборки (термин, используемый социологами и медиками для обозначения вида выборки и способа отбора единиц) интересен тем, что применяется достаточно редко встречающаяся в практике социально- экономической статистики модель повторного отбора. Следует отметить, что в данном случае, несмотря на реализацию схемы повторного отбора, математический аппарат повторной выборки нельзя использовать при выполнении расчетов выборочных параметров, поскольку генеральная совокупность остается конечной величиной и притом ограниченного объема. Следующим вопросом, требующим своего решения при планировании очередного квартального обследования индивидуальных грузоперевозчиков на автотранспорте, является распределение четырех недель наблюдения по месяцам и конкретным датам в пределах квартала. Обследование должно проводиться в каждом месяце. Следовательно, в двух месяцах работы будут вестись по одной неделе, в одном месяце - две недели (например, две недели в апреле, одна в мае и одна в июне). Составляется календарный план проведения обследования на квартал, т.е. определяются четыре недели, в течение которых обследуется работа предпринимателей с указанием точных дат начала и окончания каждой обследуемой недели. Естественно, что каждый из респондентов должен информировать о своей работе только в течение одной недели. Статистический учет индивидуальных предпринимателей, занимающихся производством промышленной продукции по форме № 1-ИП (пром) «Сведения о промышленной деятельности индивидуального предпринимателя». С первого квартала 2001 г. в соответствии с постановлением Госкомстата России от 24 ноября 2000 г. № 117 осуществляется ежеквартальный статистический учет индивидуальных предпринимателей, занимающихся производством промышленной продукции. 170
Основой выборки служит база данных ЕГРПО. Источниками информации о предпринимателях, не зарегистрировавших свою деятельность в установленном порядке и соответственно отсутствующих в ЕГРПО, могут служить материалы средств массовой информации, реклама, информация о товаропроизводителях на этикетках товара и т.п., что позволяет в некоторой степени восполнить недоучет поданной категории индивидуальных предпринимателей. Материалы выборочного обследования содержат информацию о произведенной за отчетный квартал продукции в натурально- вещественном измерении — в тоннах, штуках, куб. метрах и т.д. Регистрируются наименование каждого вида производившейся в отчетном квартале продукции, единица измерения и объем фактического производства за отчетный квартал. Эти данные потенциально представляют базу для оценки доли индивидуальных предпринимателей в производстве каждого отдельно взятого продукта. Однако получаемые выборочные показатели пока недостаточно репрезентативны. Единовременное выборочное обследование индивидуальных предпринимателей, занимающихся оказанием бытовых услуг населению. В 2002 г. в соответствии с федеральной программой статистических работ было проведено единовременное выборочное обследование индивидуальных предпринимателей, занимающихся оказанием бытовых услуг населению. В каждом субъекте Российской Федерации планировалось обследовать 20- 30 индивидуальных предпринимателей при условии обеспечения представительства по возможности более широкого круга различных видов бытовых услуг. Формирование списков обследуемых производилось на основе территориальных регистров индивидуальных предпринимателей. Программой обследования предусматривалось получение следующей информации: возраст предпринимателя, привлекает ли наемных работников, продолжительность работы в данной сфере, работает в собственном или арендуемом помещении, стоимость оказанных услуг за июнь 2002 г., предположения о перспективах своей деятельности, наиболее острые проблемы, с которыми приходится сталкиваться, и др. Наибольшую сдержанность предприниматели проявляли при ответах на вопросы о стоимостных показателях, нередко занижая их величину. 171
При анализе материалов данного обследования разграничивались следующие виды услуг: ремонт и индивидуальный пошив одежды, ремонт и индивидуальный пошив обуви, ремонт бытовой техники и металлоизделий, ремонт жилья, услуги фотоателье, парикмахерские услуги, ритуальные услуги, изготовление и ремонт мебели. Выборочные обследования индивидуальных предпринимателей, осуществляющих деятельность в розничной торговле, по форме № 1-ИНД (торг). По данным на конец 2006 г. в России в сфере розничной торговли осуществляли свою деятельность 1,3 млн индивидуальных предпринимателей, на долю которых приходилось около 47% общего объема розничного товарооборота в Российской Федерации1. При столь значительной роли индивидуальных предпринимателей в реализации товаров населению необходимо располагать достаточно детальной и достоверной информацией об их деятельности на российском рынке. Это необходимо для решения задач эффективного государственного регулирования отношений в сфере розничной торговли и успешной реализации социальных программ. Индивидуальные предприниматели, занятые в сфере розничной торговли, впервые стали объектами статистического учета в 2000 г. на выборочной основе. В 2000—2005 гг. они обследовались один раз в год, с 2006 г. — два раза в год. В настоящее время производятся выборочные обследования индивидуальных предпринимателей по форме федерального государственного статистического наблюдения № 1-ИНД (торг) «Сведения о деятельности индивидуальных предпринимателей в розничной торговле». Выборочному обследованию подлежит 5% индивидуальных предпринимателей, осуществляющих свою деятельность в сфере розничной торговли. В Статистическом регистре база данных «Индивидуальные предприниматели» стала формироваться в 2001 г. До ее оформления в качестве источника для построения основы выборки индивидуальных предпринимателей в торговле использовались списки торговых дислокаций, имеющиеся в органах местной исполнительной власти, которые регулируют работу потреби- 1 См.: Седова Е.И., Сабельникова М.А., Луппов А.Б. Планирование и проведение выборочных обследований индивидуальных предпринимателей, осуществляющих деятельность в розничной торговле // Вопросы статистики. - 2007. - № 1. - С. 28. 172
тельских рынков. При формировании выборочной совокупности индивидуальных предпринимателей производился механический отбор из основы выборки. В декабре 2003 г. постановлением Росстата были утверждены новые «Методологические положения по проведению выборочного наблюдения индивидуальных предпринимателей, осуществляющих деятельность в торговле». В новой методологии были приняты во внимание реальные условия в регионах России и учтен опыт статистических служб США, Италии, Индонезии при проведении аналогичных обследований. Принятая модель формирования выборочной совокупности индивидуальных предпринимателей в торговле является уникальной1. Особый интерес представляют следующие особенности данного проекта: • одновременное использование двух независимых основ выборки — списочной и территориальной (комбинированная основа выборки); • использование процедуры «пострасслоения», т.е. расслоения уже обследованных единиц выборки на этапе разработки итогов (при отсутствии на этапе проектирования выборки информации для построения расслоенной выборки); • формирование дополнительной выборки для замещения единиц, недоступных для обследования вследствие отказов респондентов предоставить информацию; • создание статистических цензов для отнесения предпринимателей к массиву экстремально нетипичных единиц, наблюдение которых следует осуществлять на сплошной основе. Существует строгое разграничение функций между федеральными и территориальными органами государственной статистики при подготовке к выборочному обследованию индивидуальных предпринимателей в торговле. На федеральном уровне разрабатывается методология выборочного обследования и определяется необходимый объем выборочной совокупности по каждому субъекту РФ. Размещение выборки по регионам осуществляется с учетом двух условий: распределения генеральной совокупности по регионам и необходимости сохранения одина- 1 Развернутое изложение методологии обследования индивидуальных предпринимателей в торговле — см. указанную выше статью Седовой Е.И., Сабельниковой М.А., Луппова А.Б. 173
ковой точности результатов обследования по всем субъектам РФ. Расчет объема выборки по каждому субъекту РФ производится Росстатом по формуле где п - заданный общий объем выборки в целом по Российской Федерации; nh - объем выборки в А-м субъекте Российской Федерации; Xh - показатель оборота индивидуальных предпринимателей торговли в А-м субъекте Российской Федерации по итогам предыдущего цикла обследования; CV(yh) — оценка коэффициента вариации показателя оборота индивидуальных предпринимателей торговли в А-м субъекте Российской Федерации по итогам предыдущего цикла наблюдения; а — параметр степени влияния величины регионального суммарного показателя на размещение объема выборки, который изменяется в промежутке от нуля до единицы. Информация о необходимом объеме выборки в субъектах РФ передается в региональные органы государственной статистики, где формируются конкретные перечни единиц выборочной совокупности и производится обследование. В регионах составляется комбинированная основа выборки, состоящая из территориальной и списочной основы. Формируются списки единиц наблюдения с использованием компьютерных программ. Единицами наблюдения выступают: • индивидуальные предприниматели в выборке, формируемой на списочной основе, составляющие 30% от всего объема выборки в регионе; • торговые места, принадлежащие индивидуальным предпринимателям, в выборке, формируемой на территориальной основе и составляющей 70% от всего объема выборки в регионе. В регионах может составляться дополнительная выборка, предназначенная для замены единиц в случаях отказа респондентов предоставлять информацию. Объем дополнительной выборки определяется в зависимости от доли неответов в предыдущем цикле обследования. 174
После завершения обследования производится корректировка массива информации с учетом неответов и выявленных нетипичных единиц совокупности. Процедура распространения данных комбинированной выборки предполагает определение суммарного значения показателя раздельно по каждой выборке (на территориальной основе и на списочной основе). Полученные две оценки показателя используются для расчета единой средневзвешенной оценки. Для выполнения расчетов используются следующие формулы: к=\ = pxYT+(l-p)xYc, где Y - суммарный показатель программы обследования по выборке в целом; YT — суммарный показатель программы обследования по выборке на территориальной основе; Yc - суммарный показатель программы обследования по выборке на списочной основе; К - порядковый номер единицы наблюдения в выборочной совокупности; wK — выборочный вес или фактор распространения, рассчитанный на стадии планирования выборки для к-и единицы; уК - значение признака у k-й единицы, полученное в ходе наблюдения; пт — число единиц наблюдения в выборочной совокупности на территориальной основе; пс - число единиц наблюдения в выборочной совокупности на списочной основе. Разработанная модель формирования выборочной совокупности с использованием комбинированной основы выборки была предварительно апробирована в марте 2006 г. в ходе пилотного обследования в двух регионах - в Самарской области и Республике Коми. При проведении пилотного обследования по форме № 1-ИНД (торг) тестировались процедуры и алгоритмы форми- 175
рования комбинированной выборки, проверялась надежность методики распространения выборочных данных на генеральную совокупность. 5.3. Специальные тематические обследования Программами статистических работ предусматривается проведение ряда специализированных тематических выборочных обследований субъектов хозяйственной деятельности. Среди них наиболее значимыми являются: обследование инвестиционной активности предприятий, статистическое наблюдение за объемом продаж товаров на рынках, выборочное обследование затрат организаций на производство и продажу продукции, единовременное выборочное наблюдение за деятельностью частных медицинских организаций, выборочное наблюдение за деятельностью организаций, оказывающих ритуальные услуги. Выборочное обследование инвестиционной активности промышленных предприятий по форме № ИАП. Постановлением Госкомстата России от 7 июля 2000 г. № 63 утверждена форма федерального государственного статистического наблюдения № ИАП «Обследование инвестиционной активности предприятий». Материалы обследования позволяют определить текущий уровень инвестиционной активности предприятий и намерения на ближайшую перспективу, оценить связь между состоянием основных фондов и потребностями в инвестициях, получить характеристики видов приобретаемого оборудования, выявить масштабы финансового лизинга и вторичного рынка оборудования. В качестве генеральной совокупности выступают промышленные предприятия различных отраслей промышленности всех форм собственности и всех размеров (крупные и средние предприятия, субъекты малого предпринимательства), зарегистрированные как юридические лица на территории регионов Российской Федерации. Производится расслоение генеральной совокупности по видам деятельности промышленных предприятий и по численности занятых на предприятиях. Составляются две основы 176
выборки: а) для крупных и средних предприятий и б) для малых предприятий. Количество отбираемых для обследования предприятий в каждом регионе в разрезе отраслей промышленности определяется в соответствии с «Методологическими указаниями по формированию выборочной совокупности и распространению данных на генеральную совокупность для обследования инвестиционной активности предприятий», утвержденными постановлением Госкомстата России от 7 июля 2000 г. № 63. Размещение заданного объема выборки для крупных и средних предприятий по группам по числу занятых осуществляется по формуле П: = П , Ч где ni -объем выборки для /-й группы (слоя) по численности занятых в отрасли промышленности региона; п = Хл,. -объем выборки для отрасли промышленности региона; Ч = 2Ч;. — общая численность занятых на предприятиях отрасли промышленности региона; Ч,. - численность занятых на предприятиях в /-и группе (слое) по численности занятых в отрасли промышленности региона. В случае отсутствия необходимого для отбора числа предприятий в слое обследуются все имеющиеся предприятия, а недостающее число предприятий распределяется по остальным слоям. Отбор предприятий. Отбор малых предприятий из основы выборки производится в каждой отрасли промышленности случайным способом. Отбор крупных и средних предприятий в каждой отрасли и в каждом слое, выделенном по численности занятых, осуществляется случайным способом, кроме тех отраслей промышленности, в которых число крупных и средних предприятий составляет 30 и менее. В последнем случае расслоение по численности занятых не производится и осуществляется механический отбор из ранжированного ряда по среднесписочной численности работников. 12-2394 177
Ежеквартальное статистическое наблюдение за объемом продаж товаров на рынках. Статистика розничной торговли представлена несколькими видами источников информации. Крупные и средние торговые организации представляют статистическую отчетность ежемесячно на сплошной основе. Малые торговые организации (юридические лица), вещевые, смешанные и продовольственные рынки обследуются в выборочном порядке ежеквартально. Индивидуальные предприниматели в розничной торговле обследуются два раза в год. Наблюдение за объемами продажи товаров на рынках проводится ежеквартально в форме опроса торгующих на рынках. Цель данного наблюдения — получить объективный показатель объема продажи товаров в расчете на одно торговое место на рынке в зависимости от его специализации и места нахождения (в городе или поселке городского типа, сельском населенном пункте) и оценить объем продажи в целом по всем рынкам в субъектах Российской Федерации и по стране в целом. Объектами статистического наблюдения являются рынки и торговые места на них. В круг обследуемых на рынке торговых мест входят места, отведенные для торговли товарами только физическим лицам (индивидуальным предпринимателям и частным лицам). Наблюдение не распространяется на торговые места, отведенные юридическим лицам и оптово-розничным ярмаркам, на которых торговля осуществляется, как правило, юридическими лицами. Статистическое наблюдение за торговым оборотом этих хозяйствующих субъектов осуществляется в режиме сплошного обследования крупных и средних организаций (формы федерального государственного статистического наблюдения № П-1 и № П-5(м)) и выборочного обследования малых предприятий (форма № ПМ). Подготовка к проведению наблюдения рынков и торговых мест включает два этапа. На первом этапе подготовки к наблюдению проводятся следующие работы: 1. Формируется перечень рынков и торговых мест, подлежащих обследованию. При этом необходимо соблюдать следующие условия: • обеспечить представительство всех типов рынков, имеющихся в субъекте РФ; 178
• количество отобранных для обследования торговых мест должно составлять не менее 5% от общего числа торговых мест на рынках в субъекте Российской Федерации. 2. Владельцу (руководителю) каждого из отобранных рынков направляется по одному экземпляру формы № 3-рынок для заполнения и представления территориальному органу Росстата не позднее 10 мая (10 октября) отчетного года. На втором этапе подготовки к наблюдению: 1. Осуществляется предварительный выход на отобранные рынки работников территориального органа Росстата для распределения числа торговых мест в соответствии с укрупненной торговой номенклатурой. 2. Заносятся данные о числе торговых мест по товарным группам в списки по каждому рынку, отобранному для обследования, с указанием числа торговых мест в разрезе товарных групп. 3. Определяется объем выборки торговых мест для каждой товарной группы. 4. Производится закрепление торговых мест за интервьюерами с учетом дневной нагрузки на одного интервьюера. Проведение наблюдения. Регистрация размеров продажи товаров и цен на рынках проводится по товарным группам по соответствующему типу рынков. Сбор данных в ходе наблюдения осуществляется экспедиционным способом специально уполномоченными интервьюерами при обходе торговых мест на рынке. Выборочное обследование затрат на производство и продажу продукции по форме 5-3. Начиная с 2005 г. проводится ежеквартальное выборочное статистическое наблюдение организаций по форме 5-3 «Сведения о затратах на производство и продажу продукции (товаров, услуг, работ)», утвержденной постановлением Росстата от 5 августа 2005 г. № 58. Отчетность представляют юридические лица, кроме субъектов малого предпринимательства, бюджетных и финансово-кредитных организаций. Обследуемая совокупность организаций формируется на основе классификатора видов экономической деятельности (ОКВЭД) с разграничением всех видов экономической деятельности на пять групп. По п е р в о й группе, включающей такие виды экономической деятельности, как добывающая промышленность, перерабатывающая промышленность, кроме легкой и пищевой, осу- 12* 179
ществляется механический отбор предприятий, производящих суммарно более 85% оборота в пределах каждого региона по соответствующим видам деятельности. По второй группе, включающей предприятия легкой и пищевой промышленности, отбираются методом механического отбора предприятия, производящие суммарно более 65% оборота в пределах каждого региона по соответствующим видам деятельности. Третью группу представляют предприятия с численностью работников более 15 человек, осуществляющие: торговлю автотранспортными средствами, их ремонт и техническое обслуживание; оптовую торговлю; деятельность всех видов транспорта; связь. По этой группе обследуются все предприятия. Четвертая группа представлена строительными организациями с численностью работников более 100 человек. Отбираются для обследования все предприятия. Кпятой группе относятся предприятия с численностью работников более 15 человек, осуществляющие розничную торговлю (кроме торговли автотранспортными средствами), ремонт бытовых изделий и предметов личного пользования. В этой группе методом механического отбора отбирается каждое третье предприятие. В качестве основы выборки используется перечень организаций, представивших за предыдущий год статистическую отчетность (сплошной учет) по форме № 1-предприятие «Основные сведения о деятельности организации». Не подлежат обследованию предприятия, находящиеся на стадии банкротства. При проведении механического отбора по первой, второй и пятой группам предприятия предварительно ранжируются по убыванию показателя «оборот» и рассчитывается кумулятивный итог. По отобранным предприятиям кумулятивный итог должен находиться в пределах, установленных для соответствующих групп предприятий. Формирование выборочной совокупности предприятий осуществляется территориальными органами государственной статистики. После формирования выборочной совокупности проводится ее проверка на отсутствие неблагоприятных факторов (предприятие на стадии банкротства или не представило отчетность в предыдущем периоде и др.). Предприятия с неблагоприятной 180
ситуацией заменяются на другие организации, осуществляющие такой же вид экономической деятельности. Единовременное выборочное наблюдение за деятельностью частных медицинских организаций по форме № 1-меду слуги. В целях получения информации о тенденциях развития сектора частных медицинских услуг в 2004 г. было проведено единовременное выборочное обследование по форме № 1-медуслуги «Сведения об оказании платных услуг частных медицинских организаций». На уровне центрального аппарата Росстата осуществлялась разработка методологии обследования, определялись программа и порядок организации наблюдения, формировались сводные итоги обследования. В регионах производились подбор и обучение кадров для проведения работ по организации выборочного наблюдения, осуществлялись сбор информации и контроль за качеством и достоверностью итогов обследования, производилась передача информации на федеральный уровень. Объектом наблюдения по форме № 1-медуслуги являлись юридические лица (в том числе малые предприятия) частной формы собственности, оказывающие платные медицинские услуги населению по следующим направлениям: доврачебная, скорая и неотложная помощь; амбулаторно-поликлиническая и стационарная помощь; проведение профилактических диагностических и лечебных мероприятий и медицинских экспертиз. О перспективах применения выборочного метода в целях изучения сферы медицинских услуг населению свидетельствует текст программы развития государственной статистики на 2007— 2011 гг. В этом документе указано, что намечается совершенствование информационной базы системы здравоохранения и медицинских услуг посредством проведения выборочных наблюдений. Выборочное наблюдение за деятельностью организаций, оказывающих ритуальные услуги, по форме № 1-ритуал. Федеральной программой статистических работ на 2004 г. было предусмотрено проведение единовременного государственного статистического наблюдения на основе формы № 1-ритуал «Сведения о деятельности организации, оказывающей ритуальные услуги». Целью обследования являлось получение информации о перспективах развития в России деятельности по торговле ритуальными принадлежностями и оказанию ритуальных услуг органи- 181
зациями и индивидуальными предпринимателями. Обследование по форме № 1-ритуал проводилось по итогам деятельности за 2003 г. Объектом наблюдения по форме № 1-ритуал являлись юридические лица и их обособленные подразделения (включая малые предприятия), предоставляющие ритуальные услуги, а также индивидуальные предприниматели, занимающиеся оказанием ритуальных услуг без образования юридического лица. К числу работ, выполнявшихся на федеральном уровне, относились: разработка программы, инструментария, организационного плана работ, разработка плана и выполнение работ по автоматизированной разработке сводных итогов обследования, подготовка профаммных средства для электронной обработки данных обследования на региональном уровне. При формировании выборочной совокупности использовалась основа выборки, сформированная привлечением информации на основе ЕГРПО о юридических лицах и регистра индивидуальных предпринимателей в рамках ЕГРПО с кодом по ОКВЭД - 93.03 «Организация похорон и предоставление связанных с ними услуг». 5.4. Выборочные наблюдения в статистике аграрного сектора экономики С переходом к рыночным отношениям в статистике сельского хозяйства, как и в других отраслях статистики, возросла необходимость более широкого применения выборочного метода при проведении статистического наблюдения. Основной задачей в данной области становится переход на единую систему выборочных наблюдений всех категорий производителей сельскохозяйственной продукции. В сельском хозяйстве России в настоящее время функционируют три категории хозяйствующих единиц: а) сельскохозяйственные организации; б) фермерские (крестьянские) хозяйства, которые могут быть как юридическими, так и физическими лицами; в) личные подсобные хозяйства населения. Для получения статистической информации о деятельности каждой категории хозяйств создана специальная система учета, в методо- 182
логическом обеспечении которой существенное место занимает выборочный метод. Базовым условием применения выборочного метода является наличие основы выборки. Как было указано в разд. 3.2, в рамках единой основы выборки - «Генеральной совокупности объектов статистического наблюдения» существует субрегистр «Сельскохозяйственные товаропроизводители», где учетными единицами являются сельскохозяйственные предприятия и фермерские хозяйства. Субрегистр используется в целях: а) получения сводных аналитических данных по генеральной совокупности в разрезе основных характеристик деятельности и б) применения в качестве основы выборки при организации сельскохозяйственных выборочных обследований. Этот субрегистр функционирует на федеральном и региональном уровнях, он имеет единую методологическую и программно-технологическую базу. Содержание субрегистра «Сельскохозяйственные товаропроизводители» соответствует стандартной схеме построения регистров и включает информационные блоки: идентификационный, классификационный, справочный, технологический, экономические показатели. Актуализация субрегистра «Сельскохозяйственные товаропроизводители» производится в регионах территориальными органами государственной статистики систематически по состоянию на начало каждого года. По данным ЕГРПО актуализируются: перечень предприятий; идентификационный, классификационный и справочный блоки информации. Экономические показатели актуализируются по материалам бухгалтерской отчетности, форм государственного статистического наблюдения, периодических сплошных учетов и других источников. В 1986 г. в составе единого субрегистра «Сельскохозяйственные товаропроизводители» был выделен частный субрегистр «Сельскохозяйственные предприятия», в котором по каждому предприятию представлены по 250 показателей. Субрегистр «Сельскохозяйственные предприятия» функционирует на региональном и федеральном уровнях. Такой автоматизированный банк индивидуальных данных позволяет отслеживать динамику производства в аграрном секторе, определять структурные параметры производства на основе группировок предприятий, осуществлять индексный и корреляционный анализ финансово- хозяйственной деятельности. Субрегистр «Сельскохозяйственные 183
предприятия» можно использовать как основу выборки сельскохозяйственных предприятий как в масштабах региона, так и страны в целом. В 1994 г. в составе субрегистра «Сельскохозяйственные товаропроизводители» был выделен еще один частный субрегистр «Крестьянские (фермерские) хозяйства», функционирующий только на региональном уровне. По каждому хозяйству представлена информация по 70 показателям. Субрегистр «Крестьянские (фермерские) хозяйства» может использоваться как основа выборки для проведения выборочных обследований фермерских хозяйств в регионе и получения репрезентативных данных по генеральной совокупности в пределах региона. Актуальной задачей статистики аграрного сектора российской экономики является всесторонний анализ экономического положения, результатов деятельности и тенденций развития сельских товаропроизводителей. Необходимую для такого анализа информацию можно получить при проведении специальных многоцелевых выборочных обследований. Начальным этапом в этой работе является формирование на основе субрегистра «Сельскохозяйственные товаропроизводители» и других источников выборочных сетей сельскохозяйственных организаций, фермерских хозяйств и хозяйств населения. Это существенная составляющая планомерного процесса создания единой научной методологии выборочного метода в сельскохозяйственной статистике, обеспечивающей: • централизованный порядок определения организационно- методических основ выборочных наблюдений; • повышение качества получаемой при выборочных наблюдениях статистической информации; • создание возможностей для комплексного изучения различных процессов в сельском хозяйстве в динамике; • экономию затрат на формирование выборки и проведение обследований; • возможность использования выборочной сети в течение ряда лет1. Формирование многоцелевой выборочной сети сельскохозяйственных организаций осуществляется по следующим правилам: 1 См.: Организация государственной статистики в Российской Федерации. — М.: Госкомстат России, 2004. — С. 302—304. 184
• источником информации, т.е. основой выборки, для формирования выборочной сети является субрегистр «Сельскохозяйственные предприятия»; • выборочная сеть создается для каждого региона РФ; • при многоцелевом назначении выборочной сети она должна формироваться с применением стратификации по основным показателям, характеризующим ресурсный потенциал организации: площадь сельхозугодий, среднегодовая численность работников, среднегодовая стоимость основных производственных фондов; • доля отбора единиц из генеральной совокупности должна быть дифференцирована по регионам в зависимости от: а) числа сельскохозяйственных организаций и масштабов вариации изучаемых показателей в пределах каждого региона; б) оптимального соотношения для каждого региона двух альтернативных условий — необходимой степени точности выборочных показателей и располагаемых финансовых ресурсов для проведения наблюдений; • единицей отбора и единицей наблюдения является сельскохозяйственная организация; • оценка репрезентативности многоцелевой выборки не может быть ограничена диагностикой только одного или нескольких показателей по классической схеме расчетов ошибки выборки. Необходимо, в частности, произвести предварительную оценку репрезентативности выборочной сети путем нахождения вероятностной оценки расхождения между генеральным и выборочным распределениями с помощью критерия согласия К. Пирсона1. Выборочная сеть крестьянских (фермерских) хозяйств создается на основе субрегистра «Крестьянские (фермерские) хозяйства» в форме выборки, стратифицированной по признакам «площадь выделенной земли» и «условное поголовье скота». Выборочная сеть фермерских хозяйств формируется на региональном уровне. Генеральной совокупностью являются все фермерские хозяйства региона, за исключением крупных, которые подлежат сплошному обследованию. Единица отбора и единица совокупности — фермерское хозяйство. 1 Пример расчета критерия Пирсона см.: Елисеева И.И. Общая теория статистики / И.И. Елисеева, М.М. Юзбашев — М.: Финансы и статистика, 2003. - С. 198-208. 185
Выборочная сеть хозяйств населения в сельской местности была создана в 1997 г. В качестве основы выборки используются списки плательщиков земельного налога. В связи с большим объемом генеральной совокупности (более 16 млн хозяйств) и огромным территориальным рассредоточением этого массива применяется модель четырехступенчатой механической территориальной выборки. В каждом субъекте РФ единицами отбора являются: на первой ступени - административный район, на второй - сельский округ, на третьей — населенный пункт, на четвертой — хозяйство населения. Единицей наблюдения выступает хозяйство населения, являющееся плательщиком земельного налога. На каждой ступени отбора формируется своя основа выборки. На первой ступени отбор единиц производится по принципу «серпантина» с использованием географических или топографических карт, чтобы обеспечить равную вероятность попадания в выборку территорий с разными природно-географическими условиями. Объем выборки устанавливается следующим образом: на первой ступени отбирается 25% административных районов региона, на второй ступени в отобранных районах отбирается 15% сельских округов, на третьей ступени в отобранных округах отбирается 10% населенных пунктов, на четвертой ступени в отобранных населенных пунктах отбирается 0,1% общей численности хозяйств населения во всем регионе. Своеобразие формирования выборочной сети хозяйств населения состоит в том, что шаг отбора устанавливается на каждой ступени путем деления общей площади земли, находящейся в распоряжении хозяйств населения на соответствующей ступени отбора, на запланированное число единиц отбора на каждой ступени. На базе выборочной сети хозяйств населения проводятся периодические и единовременные статистические обследования. Материалы обследований используются при расчете ряда макроэкономических показателей: объема выпуска продукции, промежуточного потребления, добавленной стоимости по отрасли. Данные о производстве в домашних хозяйствах необходимы также при разработке балансов продовольственных ресурсов и определении фондов потребления продуктов питания. 186
Начиная с 1998 г. проводятся регулярные выборочные опросы руководителей и специалистов сельскохозяйственных организаций по всем организационно-правовым формам хозяйствования. Эти обследования осуществляются Центром экономической конъюнктуры при Правительстве РФ и Федеральным агентством правительственной связи и информации при Президенте РФ. Для выработки эффективной стратегии развития сельского хозяйства на долгосрочную перспективу необходима достоверная информация о состоянии и ресурсном потенциале аграрного сектора российской экономики. Наиболее полноценным источником таких данных являются сельскохозяйственные переписи. В 2006 г. в рамках Всемирного раунда сельскохозяйственных переписей в Российской Федерации была проведена Всероссийская сельскохозяйственная перепись. Итоги переписи предназначены для решения ряда задач в области регулирования аграрного сектора экономики, а также для проведения актуализации генеральной совокупности сельхозпроизводителей, необходимой при организации выборочных обследований. Пробная сельскохозяйственная перепись состоялась в 2004 г. по состоянию на 1 августа в период с 1 по 25 августа. В основе своей перепись 2006 г. была сплошной, но элементы выборочного наблюдения в ней присутствовали. В выборочном порядке проводилась сельскохозяйственная перепись по садоводческим, огородническим, дачным, животноводческим некоммерческим объединениям граждан и по хозяйствам населения, расположенным в городах. Существенная роль будет принадлежать выборочному методу в реализации программы совершенствования статистического наблюдения в сельском хозяйстве в период 2007—2011 гг. Основным направлением развития статистики сельского хозяйства явится применение комбинированного метода наблюдения - сочетания периодически проводимых Всероссийских сельскохозяйственных переписей и выборочных обследований. Методологический аспект планируемого совершенствования системы статистического наблюдения в сельском хозяйстве с использованием выборочного метода состоит в следующем. 1. На базе информационного массива Всероссийской сельскохозяйственной переписи 2006 г. создание генеральной совокупности сельскохозяйственных производителей индивидуального сектора, включающего: крестьянские (фермерские) 187
хозяйства; индивидуальных предпринимателей; личные подсобные хозяйства; садоводческие и огороднические некоммерческие объединения граждан. 2. Разработка методологии и программы выборочного наблюдения за сельхозпроизводителями с учетом международной практики. 3. Создание алгоритмов формирования выборочных совокупностей и распространения их данных на генеральные совокупности1. Контрольные вопросы 1. Укажите основные различия в методике и организации статистического наблюдения за деятельностью малых предприятий и индивидуальных предпринимателей. 2. По каким критериям субъекты предпринимательской деятельности относят к малым предприятиям? 3. Какие слои и по какому принципу выделяются при выборочном обследовании малых предприятий? 4. Что понимается под актуализацией генеральной совокупности? 5. В чем заключаются основные трудности в получении достоверной статистической информации о деятельности малых предприятий? 6. Какие операции по планированию выборочных обследований малых предприятий выполняются в регионах? 7. Каковы перспективы изучения деятельности малых предприятий? 8. Как осуществляется обработка «неответов»? 9. Какова общая схема разработки итогов обследования малых предприятий? 10. Как изучается деловая активность малых предприятий? 11. Назовите основные виды выборочных обследований индивидуальных предпринимателей. 12. Как осуществляется формирование выборочной совокупности при обследовании инвестиционной деятельности промышленных предприятий? 1 О мероприятиях Федеральной целевой программы «Развитие государственной статистики России в 2007—2011 годах» // Вопросы статистики. - 2007. - № 2. - С. 9. 188
13. Каков порядок формирования выборочной сети подсобных домашних хозяйств населения в статистике сельского хозяйства? 14. Как формируется многоцелевая выборочная сеть сельскохозяйственных организаций? 15. Охарактеризуйте основные намечаемые подходы к совершенствованию статистики сельского хозяйства на базе применения выборочного метода в период 2007—2011 гг. Глава 6 ВЫБОРОЧНЫЙ МЕТОД В СТАТИСТИКЕ НАСЕЛЕНИЯ И РЫНКА ТРУДА Общее и совершенно правильное утверждение о том, что развитие в России новых экономических отношений «обусловило необходимость освоения и широкого применения в статистической практике выборочного метода наблюдения во всех отраслях статистики, а также новых методов обработки информации»1 (курсив наш. — Э.В.) может быть уточнено. В приведенной цитате слова о широком применении выборочного метода «во всех отраслях статистики» не следует понимать излишне прямолинейно, ибо они определяют лишь общую направленность процесса. В силу специфики задач статистического анализа и особенностей изучаемых явлений и объектов возможность и необходимость применения выборочного метода далеко не одинаковы в разных отраслях статистики. Так, статистика розничных цен на потребительские товары, статистика структуры личного потребления в разных социально-демографических типах домохо- зяйств основываются исключительно на материалах выборочных обследований. Но такую информацию, как основные показатели деятельности предприятий крупного и среднего бизнеса, Росстат по-прежнему получает на основе сплошной обязательной отчетности. 1 Методологические положения по статистике. Вып. 3. 189
Есть отрасли статистики, как, например, статистика занятости, в которых совмещаются два типа источников данных - сплошной учет и выборочные обследования. Статистика населения принадлежит к тем отраслям статистики, в которых выборочный метод обязательно применяется, но лишь в качестве дополнительного инструмента информационного обеспечения. 6.1. Значение выборочного метода в статистике населения В статистике населения выборочный метод используется в целях получения информации по широкому круга демографических проблем: при исследовании воспроизводства населения, при анализе миграции, состава населения по демографическим и социально-экономическим признакам, при исследовании влияния различных факторов на развитие состава населения. Общепризнанными направлениями использования выборки в статистике населения являются, например, совмещение в переписях населения сплошной и выборочной переписей, проведение специальных выборочных обследований репродуктивных установок населения, анамнестические (ретроспективные) обследования демографической истории поколения на основе индивидуальных данных. Информация об учете естественного и механического движения населения и переписи населения по основному разделу программы Росстат всегда получал и получает только путем сплошного учета. Для подтверждения приоритетности сплошного учета в статистике населения можно обратиться к такому авторитетному источнику, как рекомендации международных органов. В этих рекомендациях значительное внимание уделяется применению единой терминологии и единых программ сбора информации. Система статистического учета естественного движения населения, в соответствии с рекомендациями ООН, должна обеспечивать сплошной охват всех событий естественного движения населения во всех географических районах и среди всех групп населения (Принципы и рекомендации для системы статистического учета естественного движения населения, ООН, 2001, 5T/E5A/5TAT/5ER.M/l9/Rev.2). В рекомендациях ООН делается оговорка о том, что если все же для учета естественного 190
движения населения применяется выборочный метод, то выборочная совокупность должна быть сформирована таким образом, чтобы она была репрезентативной в отношении каждой группы населения, каждого региона или части региона страны. В международных рекомендациях регистрируемые при статистическом учете населения признаки подразделяются на основные и дополнительные. Основные признаки подлежат сплошной регистрации, а информация по дополнительным признакам может быть получена на основе репрезентативной выборки. Критерием отграничения основных признаков служат возможность использования получаемой при их учете информации для удовлетворения потребностей государственных органов в данных о демографической ситуации и демографических процессах в стране, а также пригодность этой информации в целях международных обобщений и сравнений. В российской статистике сбор основной «макродемографичес- кой» информации должен производиться и производится путем сплошного учета. Дополнительные, частные характеристики получают на основе выборочных обследований. Понятие макроде- мографической информации здесь применено по аналогии с общепринятым термином «макроэкономические показатели» как наиболее точно отражающее содержание и назначение демографических показателей, получаемых на сплошной основе. В пользу применения термина «макродемографические показатели» свидетельствует определенная аналогия с понятием «макроэкономические показатели». Макроэкономика и используемые для ее характеристики статистические показатели определяются, как известно, двумя обязательными признаками: 1) отнесенностью к уровню экономики (в том числе к ее крупным секторам) по стране в целом и 2) использованием базовых агрегированных показателей. В «Статистическом словаре» дано следующее определение: «Макроэкономика - часть экономической науки, исследует экономику как целое, в том числе ее важнейшие совокупности — домашнее хозяйство, бизнес, государственный сектор и т.д., на базе обобщенных (суммарных) экономических показателей (агрегатов)»1. Аналогичное по смыслу и более выразительное и полное определение содержится в «Большом экономическом словаре»: «Макроэкономика — 1. 1 Статистический словарь. - М.: Финстатинформ, 1996. - С. 209. 191
Метод экономического анализа, основанный на оценке агрегированных (всеохватывающих) показателей... 2. Экономическая наука, исследующая экономику как целое, а также важнейшие ее секторы (домохозяйства, бизнес, государственный сектор и т.д.)... и использующая для этого агрегированные макроэкономические показатели и их связи...»1. Таким образом, макроэкономические показатели характеризуют экономику: а) как целое б) с помощью «всеохватывающих» агрегированных показателей. Ряд частных, дополнительных показателей, пусть даже по экономике в целом, не могут быть, по-видимому, отнесены к макроэкономическим показателям. Например, уровень безработицы является макроэкономическим показателем. Но данные по стране в целом о распределении безработных женщин, имеющих несовершеннолетних детей, по способам поиска работы не следует, видимо, относить к макроэкономическим показателям. Это дополнительная, уточняющая характеристика безработицы, и получить ее можно на выборочной основе. Аналогичным образом можно, например, определить, что общий коэффициент рождаемости является «макродемографи- ческим» показателем, исходная информация для которого должна формироваться на сплошной основе, а показатель доли молодых семей, предполагающих иметь трех или более детей, является дополнительной характеристикой рождаемости, и его получают на выборочной основе. 6.2. Выборочный метод в переписях населения Выборочный метод, хотя и является дополнительным способом получения информации в статистике населения, находит достаточно широкое применение в данной отрасли статистики и в демографии. Наиболее масштабным является использование выборки при проведении переписей населения, где в дополнение к программе сплошной переписи предусматривается получить ответы на ряд вопросов в порядке 25-процентной выборки. Основой выборки при формировании выборочной совокупности при переписи населения является список жилых поме- Большой экономический словарь / под ред. А.Н. Азрилияна. доп. — М.: Институт новой экономики, 2004. — С. 487. - 6-е изд., доп. 192
щений, в которых есть постоянно проживающее население. Под жилым помещением понимаются квартира, одноквартирный дом. Списки жилых помещений формируются в пределах каждого инструкторского участка на основе материалов записных книжек переписчиков, полученных при проведении предварительного обхода переписчиками своих участков. Единицей отбора является жилое помещение. Отбор жилых помещений для выборочной переписи производится инструктором-контролером по следующей схеме. Время отбора - по мере окончания переписчиками предварительного обхода, но не позднее начала переписи. В отборе не участвуют жилые помещения, в которых не проживает постоянное население. Способ отбора - систематический (механический). При 25-процентной выборке шаг отбора составляет 4. Последовательность счетных участков при формировании выборочной совокупности в пределах инструкторского участка строго соответствует очередности завершения предварительного обхода переписчиками. Начинается отбор жилых помещений со счетного участка, переписчик которого первым завершил предварительный обход. В первом интервале отбора точка отбора определяется жеребьевкой — выбором по жребию одного из первых четырех жилых помещений. В методическом пособии для инструктора-контролера подробно описана техника жеребьевки: сделать четыре карточки с номерами «1», «2», «3» и «4», тщательно перемешать и вытащить одну из них. Если, например, по жребию было отобрано третье по списку жилое помещение, то далее отбираются помещения с номерами 7, 11, 15, 19 и т.д. В записной книжке переписчика имеется полный список жилых помещений по счетному участку. Инструктор-контролер подчеркивает в этом списке номера всех попавших в выборку жилых помещений. В остальных жилых помещениях этого счетного участка перепись проводится по программе сплошной переписи. После завершения отбора жилых помещений по первому счетному участку инструктор-контролер отмечает в своей записной книжке остаток жилых помещений в последнем интервале отбора. Отбор жилых помещений во втором счетном участке производится с учетом остатка помещений в последнем интервале отбора по первому счетному участку. Например, если остаток по первому счетному участку составил два помещения, то по 13-2394 193
второму участку отбираются жилые помещения с номерами 2, 6, 10 и т. д. Подобным же образом осуществляется продолжение отбора в остальных счетных участках. Таким способом обеспечивается непрерывность системы отбора по всему инструкторскому участку. Правильность проведенного отбора жилых помещений по всем инструкторским участкам в переписном отделе контролирует заведующий переписным отделом или его помощник. Проверяются соблюдение установленной процедуры отбора и процента отобранных жилых помещений, который должен быть в установленных пределах (обычно не ниже 24,9% и не выше 25,1%). Отбор может производиться ручным способом или с применением компьютерной технологии. В период проведения переписи населения вносить какие-либо изменения в перечень отобранных жилых помещений запрещается. Единицей наблюдения при выборочной переписи населения является домашнее хозяйство в отобранном жилом помещении. Если в жилом помещении (например, в коммунальной квартире) проживает несколько семей (домашних хозяйств), то они все подлежат выборочной переписи. Следовательно, имеет место особая разновидность гнездового (серийного) отбора. В классической модели гнездовой выборки каждая единица отбора состоит из некоторого числа единиц наблюдения. Поскольку меньшая часть семей (домохозяйств) проживает в коммунальных квартирах, то при выборочной переписи только в отношении этой части населения единица отбора включает несколько единиц наблюдений, а по остальному населению единица отбора и единица наблюдения совпадают. Распространение данных выборочной переписи населения на генеральную совокупность осуществляется при формировании сводных итогов по стране и по регионам по стандартным технологиям. При 25-процентной выборке достоверные (репрезентативные) результаты по генеральной совокупности могут быть получены по стране в целом, по субъектам РФ с делением на городское и сельское население, по достаточно крупным административным районам в пределах субъектов РФ. Следующая всероссийская перепись населения будет проведена в 2010 г. В соответствии с установившимся порядком ей будет предшествовать пробная перепись. Распоряжением Пра- 194
вительства РФ от 21 сентября 2006 г. пробная перепись населения была проведена в октябре 2008 г. Пробной переписью было охвачено ориентировочно 300 тыс. человек. Целью проведения пробной переписи населения является отработка организационно-методических вопросов и инструментария переписи. Проектом программы переписи 2010 г., апробация которого была проведена в ходе пробной переписи, предусмотрены краткая программа сплошной переписи и дополнительные вопросы, ответы на которые были получены в выборочном порядке. 6.3. Выборочный метод в демографических исследованиях В выборочном порядке получают информацию для углубленного исследования процессов брачности, разводимости, рождаемости, миграции населения, демографических установок населения. Как правило, такие обследования являются единовременными. В качестве генеральной совокупности выступает все население страны или население отдельных регионов. Важнейшим методическим вопросом является определение основы выборки. В связи с проводимой работой по созданию нового регистра — Государственной автоматизированной системы населения (ГАРН) — в перспективе появится надежная основа выборки для выборочных обследований занятости, социальных и демографических процессов, для проведения социологических исследований. Другим источником формирования основы выборки для подобных обследований являются материалы всероссийских переписей населения. В главе 2 были изложены методические основы создания территориальной выборочной сети на основе материалов переписи 2002 г. В 60—70-е гг. XX в. в нашей стране было проведено значительное число выборочных обследований населения, как на федеральном уровне, так и локальных, по самым различным проблемам демографического развития. На современном этапе практика выборочных обследований в целях изучения демографических процессов является крайне ограниченной. Но те немногие проекты, которые реализуются, "*• 195
отличаются комплексным характером решаемых задач, поддержкой ряда российских ведомств, использованием международного опыта в области методологии и организации обследования, помощью со стороны заинтересованных международных организаций. 6.4. Выборочное обследование населения по проблемам занятости Цель и задачи обследования. В условиях реформирования экономики России возникла необходимость перехода государственной статистики на новую систему анализа состояния и использования трудового потенциала страны, включая такие направления, как изучение масштабов и структуры безработицы, уровня экономической активности населения, тенденций занятости населения, конъюнктуры рынка труда. Для получения этой информации недостаточен традиционный источник данных в форме статистической отчетности организаций, так как в стране возникло огромное число индивидуальных предпринимателей, малых и средних организаций, появились многообразные и новые виды деятельности, существенно трансформировались формы трудовых отношений. Службы занятости населения также ограничены в своих возможностях обеспечения органов государственного управления и иных заинтересованных сторон информацией о занятости населения и безработице. В странах с рыночной экономикой накоплен опыт сбора информации по проблемам занятости путем обследования домашних хозяйств. С 1992 г. в России также стали проводиться выборочные обследования занятости населения путем обращения за информацией к домашним хозяйствам, что позволило получать комплексную информацию в динамике по самым различным аспектам трудовой активности и поведения на рынке труда. В условиях, когда единицей наблюдения является домохозяйство, обеспечивается возможность получения информации по таким вопросам, как качественный состав занятых экономической деятельностью, тенденции вторичной занятости, реальные масштабы безработицы в соответствии с критериями МОТ, продолжительность периода безработицы и способы поиска ра- 196
боты, состав экономически неактивных лиц и причины незанятости, мотивация поведения на рынке труда. Основные этапы формирования в России системы государственного статистического обследования населения по проблемам занятости. В 1991 г. в рамках реализации Государственной программы перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями рыночной экономики были проведены подготовительные работы по организации обследований населения по проблемам занятости. Методологическая база и порядок организации работ по формированию выборочной сети домохозяйств для проведения опроса населения по проблемам занятости были разработаны НИИ статистики Госкомстата России. Были сформированы исходные методические положения по вопросам о единице отбора и способах формирования выборочной совокупности, о единице наблюдения, основе выборки, программе наблюдения и др. В июне 1992 г. на территории Орловской области было проведено пробное обследование населения по проблемам занятости. В ходе этого обследования были апробированы разработанный инструментарий и методологические подходы к организации полевых работ. Первое полномасштабное обследование населения по проблемам занятости в Российской Федерации было проведено по состоянию на последнюю неделю октября 1992 г. Далее ежегодно стали проводиться обследования населения по вопросам занятости. Начиная с 1999 г. в соответствии с постановлением Правительства Российской Федерации «О присоединении Российской Федерации к Специальному стандарту распространения данных (ССРД) МВФ» от 26 сентября 1997 г. № 1226 обследования населения по проблемам занятости переведены на квартальную периодичность. Тем самым обеспечивалось соблюдение принятого в международной статистике правила публикации ежеквартальных данных о занятости и безработице. Для квартальных обследований населения по проблемам занятости была разработана новая модель формирования выборочной совокупности домашних хозяйств - независимые квартальные выборки, т.е. обновление выборки из квартала в квартал осуществляется на 100%. Такое построение выборки позволяет 197
объединять совокупности обследованных персон нескольких последовательных квартальных опросов, увеличивая таким образом размер анализируемой совокупности. Повторное включение адресов в выборку может производиться не ранее, чем по истечении двух лет. Объем выборки для квартальных обследований определен в размере 0,06% численности населения в возрасте 15-72 лет на квартал и 0,24% - на год. Научно-методологические основы обследования населения по проблемам занятости. 1. Понятийный аппарат. По мере накопления опыта постепенно совершенствовалась теоретико-методологическая база обследования. Достоверность материалов обследования в значительной мере зависит от научной строгости и четкости при определении понятийного аппарата. Одним из основных понятий при выборочном обследовании занятости населения является такая категория, как домохозяйство, выступающее в качестве единицы наблюдения. В соответствии с установленными Росстатом методическими положениями домашним хозяйством считается: • один человек, проживающий в отдельном жилом помещении или части жилого помещения, обеспечивающий себя всем необходимым для жизни и не объединяющий средства для ведения общего хозяйства с кем-либо из других лиц, проживающих в данном жилом помещении; • два человека или более, проживающие совместно в отдельном жилом помещении, его части или нескольких жилых помещениях и обеспечивающие себя всем необходимым для жизни посредством ведения общего хозяйства, полностью или частично объединяя и расходуя свои средства. Эти лица могут быть связаны отношениями родства или свойства либо быть не родственниками, либо и теми, и другими. 2. Разграничение полномочий. Как и при проведении любого статистического наблюдения, при обследовании населения по вопросам занятости необходимо предусмотреть четкое разграничение полномочий и обязанностей между двумя иерархическими уровнями системы государственной статистики — федеральным и региональным. На федеральном уровне разрабатывается комплекс основных методологических положений и осуществляются наиболее ответственные прикладные разработки. 198
На региональном уровне территориальные органы государственной статистики в соответствии с предписаниями Росстата осуществляют ряд мероприятий по проведению обследования. 3. Технологическая схема опроса. Методологическими положениями по проведению обследования предусмотрена стандартная технология опроса населения. Обследование населения по проблемам занятости с 1999 г. проводится один раз в квартал по состоянию на последнюю (критическую) неделю второго месяца квартала, т.е. февраля, мая, августа, ноября. Критическая неделя длится с понедельника по воскресенье. Опрос населения начинается в первый понедельник после критической (обследуемой) недели и проводится интервьюерами в течение последующих двух недель путем непосредственного посещения домашних хозяйств. 4. Формирование выборочной совокупности и проведение опроса. Модель формирования выборочной совокупности для квартальных обследований населения по проблемам занятости предполагает создание четырех независимых (непересекающихся) квартальных выборок, обеспечивающих представительные итоги в целом по России (по данным выборки каждого квартала) и по субъектам Российской Федерации (на основе объединения четырех квартальных выборок). Формирование выборки осуществляется централизованно на федеральном уровне в разрезе каждого субъекта Российской Федерации. Для обследования населения по проблемам занятости первоначально формируется годовой объем выборочной совокупности домохозяйств, который затем в случайном порядке распределяется на четыре равные части соответственно числу кварталов. Участвующие в обследовании домохозяйства могут повторно включаться в выборку лишь по истечении двух лет. Годовой объем выборочной совокупности по России в целом составляет около 260 тыс. лиц в возрасте 15—72 лет (приблизительно 120 тыс. домашних хозяйств), что соответствует 0,24% численности населения данного возраста. Таким образом, ежеквартально в целом по России обследуются около 65 тыс. лиц в возрасте 15—72 лет (около 30 тысяч домашних хозяйств), или 0,06% численности населения данного возраста. Заданная степень точности и надежность выборочных данных определяются следующими параметрами: 199
• в целом по России относительная стандартная ошибка репрезентативности не должна превышать 1,5% при уровне надежности F= 0,95 (/ = 1,96); • по крупным и средним регионам относительная стандартная ошибка репрезентативности не должна превышать 5% при уровне надежности F= 0,90 (/ = 1,645); • по регионам с небольшой численностью населения относительная стандартная ошибка репрезентативности не должна превышать 8—10% при уровне надежности F = 0,90 (/ = 1,645). По субъектам Российской Федерации применяется разная доля отбора в зависимости от величины дисперсии показателя «уровень безработицы» и численности населения в регионах, что позволяет обеспечить заданную точность итоговых выборочных показателей. Применяется двухступенчатая стратифицированная выборка. Основой выборки на первой ступени является совокупность счетных участков переписи населения 2002 г., которые сгруппированы (стратифицированы) по территориальному признаку на городские и сельские. Таким образом, на первой ступени выборка является стратифицированной, серийной, где в качестве серий выступают счетные участки. Общее количество счетных участков, подлежащих отбору на первой ступени, должно быть кратно четырем (обследование проводится в каждом из четырех кварталов). Результатом первой ступени отбора является выборочная совокупность счетных участков раздельно по городскому и сельскому населению в пределах каждого субъекта Российской Федерации. На второй ступени в отобранных счетных участках производится стратифицированный (расслоенный, типический) отбор домохозяйств. Основой выборки является перечень домохозяйств в отобранных на первой ступени счетных участках. Стратификация на второй ступени отбора производится по следующим признакам домохозяйств и их членов: • распределение домашних хозяйств по размеру, по формам собственности и по типу жилого помещения (отдельная квартира, коммунальная квартира, отдельный дом и др.); • распределение лиц по проживанию в домохозяйствах определенного размера (число членов домохозяйства), по возрас- 200
ту, полу, источникам средств существования, уровню образования, национальности. Расслоение на второй ступени выборки производится в целях: • обеспечения полного соответствия состава выборочной совокупности структуре генеральной совокупности по признакам, принятым за основу при расслоении генеральной совокупности, что способствует снижению величины ошибки репрезентативности; • повышения точности оценивания показателей за счет снижения величины дисперсии. Ежегодно осуществляется актуализация основы выборки, заключающаяся в ее корректировке с учетом введенных в эксплуатацию новых жилых зданий и помещений и изъятых из состава жилого фонда. На второй ступени выборки из стратифицированной основы производится отбор домохозяйств. Объем выборки домохо- зяйств определяется отдельно по каждому субъекту Российской Федерации по формуле расчета объема выборки при простом случайном отборе с учетом дисперсии по показателю «уровень безработицы» и заданной степени относительной точности по этому показателю. Отбор домашних хозяйств в новых домах производится в регионах по специальной схеме, разработанной Росстатом, и представляет отдельный дополнительный слой. Отбор домохозяйств в каждом слое осуществляется методом случайного отбора. Исключением являются слои, в которых объем выборки составляет три и менее домохозяйств. В таких слоях производится механический отбор домохозяйств. После того, как сформированы перечни единиц выборочной совокупности второй ступени (без поквартальной разбивки), организуется выверка всех адресов на предмет их существования и факта проживания по ним граждан. Жилые помещения, выпадающие из обследования в связи с тем, что к моменту выверки дом разрушен, поставлен на капитальный ремонт с выселением жильцов, сдан под офис и т.д., заменяются новыми адресами. Замена производится по разработанной Росстатом методике. Следующей операцией является распределение всего годового объема выборочной совокупности домохозяйств на четыре массива — для проведения опроса в каждом квартале. Формиру- 201
ются в случайном порядке четыре независимые подвыборки домохозяйств. Извлечение этих подвыборок производится на основе годового массива домашних хозяйств, построенного в региональном разрезе (отдельно по городскому и сельскому населению). Каждая из подвыборок формируется путем последовательного отбора случайных чисел. В каждом квартале обследуется одна из четырех подвыборок. Таким образом, к концу года наблюдением должна быть охвачена вся выборочная совокупность домохозяйств. Сроки проведения опроса установлены следующим образом: а) определяется критическая (наблюдаемая, отчетная) неделя, за которую будут собираться сведения; б) последующие две недели отводятся для работы интервьюеров. Общий порядок работ: в течение критической недели производятся предварительные обходы в целях оповещения населения о предстоящем обследовании, согласования даты и времени проведения опроса; опрос производится по месту жительства респондентов; инструкторы-контролеры организуют и контролируют работу интервьюеров. 5. Программа обследования населения по проблемам занятости. За период, истекший с момента проведения первых обследований населения по проблемам занятости, программа наблюдения несколько раз уточнялась и корректировалась при соблюдении преемственности ее общего содержания, что обеспечивает сопоставимость данных за разные годы и возможность оценки тенденций динамики исследуемых показателей. Анкета обследования включает более 70 вопросов, распределенных по ряду разделов. 6. Порядок разработки материалов обследования. Полученные массивы первичной информации первоначально обрабатываются на региональном уровне, где выполняются следующие операции: • ввод и контроль данных; • создание информационного массива по первичным признакам анкеты; • передача индивидуальных записей на федеральный уровень; На федеральном уровне производится следующий цикл работ: • контроль полученной с регионального уровня информации; 202
• создание объединенного информационного массива первичных записей; • автоматическая корректировка ответов на вопросы анкеты для отдельных категорий опрошенных; • формирование производных признаков; расчет индивидуальных весов; • создание базы микроданных; • формирование агрегированных данных в целом по Российской Федерации и по субъектам Российской Федерации; • формирование публикационных материалов; • доведение до территориальных органов государственной статистики сформированных информационных массивов микроданных. Контрольные вопросы 1. Раскройте смысл понятия «подвыборка». 2. Каков порядок применения выборочного метода в российских переписях населения? 3. Объясните причины разной степени распространенности выборочного метода в отдельных областях статистики. 4. При исследовании каких проблем наиболее широко применяется в статистике выборочный метод? 5. Каковы основные признаки макроэкономических показателей? 6. На сплошной или выборочной основе получают преимущественно исходную информацию для определения макроэкономических показателей? 7. Охарактеризуйте кратко этапы становления статистики занятости населения в России. 8. Какие задачи решает статистика занятости населения? 9. Как разграничены функции федеральных и региональных органов государственной статистики в осуществлении обследования занятости населения? 10. Какой вид выборки применяется при обследовании населения по проблемам занятости? 11. Какие операции по разработке материалов обследования занятости населения выполняются на региональном уровне? 12. Какие операции по обработке материалов обследования занятости населения выполняются на федеральном уровне? 203
13. Какими нормативно-правовыми актами регулируется обследование населения по проблемам занятости? 14. Какой государственный орган уполномочен публиковать официальные итоги обследования населения по проблемам занятости? Глава 7 ВЫБОРОЧНЫЙ МЕТОД В СОЦИАЛЬНОЙ СТАТИСТИКЕ Трудно переоценить значимость социальной статистики, обеспечивающей пользователей информацией об уровне и качестве жизни населения, эффективности реализации государственных социальных программ, факторах и условиях развития человеческого капитала в России. Ключевые параметры социальной статистики основываются на данных сплошного учета. Но часть информации может быть получена лишь путем проведения социальных выборочных обследований. На выборочной основе формируются показатели статистики бюджетов домашних хозяйств, статистики цен на потребительские товары и др. 7.1. Обследование бюджетов домашних хозяйств История изучения бюджетов домашних хозяйств в России охватывает период более 150 лет. Еще в середине XIX в. земские статистики проводили бюджетные обследования крестьянских хозяйств. Бюджеты семей городских рабочих стали обследоваться в начале XX в. В СССР была организована статистика бюджетов рабочих, служащих и колхозников. Все эти статистические работы проводились на выборочной основе. Развивались и совершенствовались методические основы бюджетных обследований. Если в СССР в качестве основы выборки использовались перечни предприятий и списки работников предприятий, то в настоящее время проводится территориальная выборка домашних хозяйств, что обеспечивает представитель- 204
ство в выборке всех слоев и категорий населения. Выборочные обследования бюджетов домашних хозяйств проводятся во всех субъектах Российской Федерации и охватывают около 49 тыс. домохозяйств. Обследование домашних хозяйств является многоцелевым и обеспечивает решение следующих задач. 1. Развернутый анализ уровня жизни населения. Для этого используются получаемые при обследовании данные о распределении населения по уровню материального благосостояния и уровню потребления, оценки величины денежных доходов и расходов и особенностей их структуры в различных социально- экономических и демографических группах населения, характеристики динамики уровня жизни населения, материалы о потреблении продуктов питания в различных группах населения. Бюджетные обследования дают также информацию о распределении населения по уровню бедности. 2. Получение информации, необходимой для определения макроэкономических показателей. Бюджетные обследования обеспечивают необходимые данные для составления счетов сектора «Домашние хозяйства» в системе национальных счетов. Материалы бюджетных обследований используются для формирования весовых коэффициентов, применяемых для расчета индексов потребительских цен. В качестве генеральной совокупности выступают все домашние хозяйства, находящиеся на территории РФ. Не включаются в обследование коллективные домохозяйства — школы-интернаты, дома интернаты для престарелых, религиозные общины и др. Основой выборки служат материалы переписей населения. Преимущество обращения к этому источнику данных о генеральной совокупности заключается в наличии готовой основы выборки на машинных носителях и в наличии на машинных носителях социально-экономической и демографической информации о единицах отбора на разных ступенях формирования выборочной совокупности - по конкретным домашним хозяйствам и их членам, по счетным участкам, по субъектам Российской Федерации. Территориальная выборка домашних хозяйств осуществляется в виде двухступенчатой вероятностной {случайной) выборки с использованием процедуры расслоения на каждой из ступеней отбора. Метод расслоения применяется в целях повышения 205
представительности выборочной совокупности домашних хозяйств по демографическим и социально-экономическим признакам. На первой ступени выборки производится отбор счетных участков с выделением двух слоев по признаку места проживания — городская местность и сельская местность. На второй ступени выборки по каждому отобранному счетному участку формируется выборка объемом в 25 домашних хозяйств. Алгоритм формирования выборки построен таким образом, чтобы в выборочной совокупности домашних хозяйств были по возможности пропорционально представлены все подслои, выделяемые по следующим группировочным признакам. А. Группировочные признаки для домашних хозяйств: 1) размер домохозяйства (1, 2, 3, 4, 5, 6, 7 и более человек); 2) принадлежность жилого помещения (государственное, частное); 3) тип жилого помещения (отдельная квартира, общая квартира, общежитие, съемное, другое); 4) наличие (отсутствие) в пользовании земельного участка. Б. Группировочные признаки для членов домашних хозяйств: 1) возраст; 2) пол; 3) источник средств существования; 4) уровень образования; 5) национальность. Домашнее хозяйство является единицей отбора на второй ступени и единицей наблюдения. Под домашним хозяйством понимается совокупность лиц, проживающих в одном жилом помещении или его части, как связанных, так и не связанных отношениями родства, совместно обеспечивающих себя всем необходимым для жизни, полностью или частично объединяя и расходуя свои средства. Обследование осуществляется путем непосредственного опроса членов домашних хозяйств и ведения в домашних хозяйствах записей о текущих расходах на потребление. Учетный период обследования отдельно взятого домашнего хозяйства охватывает один квартал. В течение трех месяцев установлены дифференцированные по видам показателей процедуры сбора данных. Каждое из обследуемых домашних хозяйств дважды в 206
течение квартала (два раза по одной неделе) в специальном дневнике домохозяйства (форма № 1-а) ведет записи, которые представляют собой подробный учет денежных расходов и количества продуктов, потребляемых в домохозяйстве. В промежутке между двумя дневниковыми обследованиями домашнее хозяйство в журнале домохозяйства (форма № 1-в) ведет записи, которые представляют собой учет покупок непродовольственных товаров, оплаты услуг и других расходов. По окончании каждого месяца текущего квартала в целях сбора дневниковых и журнальных записей интервьюеры посещают все обследуемые домашние хозяйства. При этом проводится промежуточный (месячный) опрос по программе опросного листа (форма № 1). По окончании квартала осуществляется опрос всех домашних хозяйств, подлежащих обследованию, по программе ежеквартального опроса. По завершении годичного цикла обследования проводится годовой опрос домашних хозяйств. Программа годового опроса включает в себя сбор данных о жилищных условиях домашних хозяйств, наличии в домашних хозяйствах предметов длительного пользования, обороте скота в личных подсобных хозяйствах, уровне образования членов домашних хозяйств. Процедура сбора данных по дневниковым и журнальным обследованиям организуется на принципах ротации домашних хозяйств в пределах одного счетного участка. Совокупность домашних хозяйств, обследуемых каждым интервьюером, подразделяется на три ротационные группы, выделяемые по признаку «тип домашнего хозяйства». Процедура обследования обеспечивает порядок, в соответствии с которым каждая из групп домашних хозяйств в течение месяца попадает под разные формы сбора данных. При распространении выборочных данных на генеральную совокупность производится взвешивание выборочных показателей. Веса для показателей по индивидуальным бюджетам домашних хозяйств рассчитываются ежеквартально. Вес определяется как величина, обратная вероятности отбора домашнего хозяйства. Вес корректируется с учетом варьирования размеров счетных участков и доли неответов. Общая сумма весов по всем отобранным домохозяйствам должна быть равна количеству до- мохозяйств в генеральной совокупности. Преобразование недельных дневниковых записей в квартальные осуществляется 207
умножением полученных значений показателей на коэффициент досчета. Итоги обследования разрабатываются в целом по Российской Федерации и по регионам. По всему комплексу переменных в пределах заданной меры точности надежные оценки могут быть получены только в целом по России. На уровне большинства субъектов РФ надежность оценок обеспечивается только по основным обобщающим показателям. 7.2. Выборочный метод в статистике цен на потребительском рынке Одним из существенных факторов, влияющих на благосостояние населения, является изменение цен на потребительские товары. Для оценки роли этого фактора в мировой практике и в России вычисляется индекс потребительских цен (ИПЦ). В России этот вопрос имеет особую остроту в связи с сохранением высоких темпов инфляции и связанной с этим необходимостью периодической индексации социальных расходов государственного бюджета, корректировки монетарной политики. Сложность заключается в том, что существует разрыв между реальным изменением стоимости жизни и официальным уровнем инфляции. Сокращение этого разрыва зависит от качества исходной информации о движении цен и методики ее обобщения. С вопросом о выборочном методе наиболее тесно связана первая составляющая — принципы и техники сбора данных о потребительских ценах. Общепринятым является метод использования фиксированной «корзины» потребительских благ в качестве основы для измерения стоимости жизни. Идея этого метода зародилась еще в начале XIX в. В настоящее время в западной статистике принято считать, что в основу индекса потребительских цен должна быть заложена концепция индекса стоимости жизни, измеряющего динамику затрат на поддержание на определенном уровне жизненного стандарта домашнего хозяйства. Это более широкое понятие, чем традиционная категория ИПЦ. В основе продвижения в направлении такого совершенствования показателя ИПЦ лежит определение новых подходов к формированию исходной информации. 208
Заслуживает внимания методология статистики потребительских цен в США, детальный анализ которой был осуществлен Н.И. Никитиной1. В 1997 г. Бюро трудовой статистики США (BLS) сообщило, что оно будет использовать теорию стоимости жизни в целях совершенствования ИПЦ. К числу причин неточности вычисляемого ИПЦ относятся такие условия, как эффект замещения товаров и услуг, качественные изменения потребительских благ, появление новых потребительских благ, для которых отсутствует цена базисного периода. Рассмотрим статистику потребительских цен в Российской Федерации. В СССР действовали строго фиксированные цены, и наблюдение за ними осуществлялось в порядке сплошного учета. Лишь с 1989 г. статистическое наблюдение за ценами было переведено на выборочную основу. С момента либерализации цен в январе 1992 г. органами государственной статистики стало осуществляться построение новой системы показателей, характеризующих уровень и динамику цен и тарифов. При этом учитывались как международный опыт, так и специфика условий российской экономики переходного периода. Федеральное государственное статистическое наблюдение за потребительскими ценами осуществляется в соответствии с разрабатываемой и утверждаемой Росстатом методологией и осуществляется на территории всех субъектов РФ. Регистрация цен на потребительские товары производится в организациях розничной торговли всех форм собственности и всех организационно-правовых форм, на рынках, в организациях общественного питания, в передвижной торговле, на объектах реализации товаров и услуг, принадлежащих индивидуальным предпринимателям. В городах отбор базовых торговых организаций для регистрации цен и тарифов производится экспертным методом. Отбор товаров-представителей и платных услуг для населения производится с соблюдением следующих правил: • Росстат в централизованном порядке разрабатывает единую для всех регионов репрезентативную выборку групп товаров и платных услуг, наиболее часто потребляемых населением. На основании этого потребительского набора осуществляется наблюдение за ценами и тарифами и рассчитывается ИПЦ; 1 См.: Никитина Н.И. Индекс стоимости жизни как направление усовершенствования индекса потребительских цен//Вестник Московского университета. Серия 6, экономика. - 2007. - № 1. - С. 26. 14-2394 209
• набор товаров и услуг подразделяется на три группы: продовольственные товары, непродовольственные товары, платные услуги, оказываемые населению; • под товаром-представителем понимается совокупность марок, моделей, артикулов и т.п. определенного вида товара с одинаковыми качеством, потребительскими свойствами и потребительским назначением; • Росстат централизованно устанавливает перечень товаров (услуг)-представителей, действующий в течение периода не менее одного года; • в каждом городе, участвующем в наблюдении за потребительскими ценами, специалисты территориальных органов государственной статистики самостоятельно отбирают конкретные товары из имеющегося в продаже ассортимента товаров данного наименования с учетом массовости спроса на эти товары и регулярности наличия их в продаже в базовой организации; • в каждом городе, участвующем в наблюдении за потребительскими ценами, должен быть произведен отбор по полному перечню товаров (услуг)-представителей, установленному Рос- статом. Регистрация цен на товары и тарифов на платные услуги производится с месячной периодичностью, время наблюдения ориентировочно 20—25-го числа. По ограниченному перечню товаров производится еженедельная регистрация цен. По каждому подлежащему наблюдению товару (услуге) необходимо в период обследования по 5—10 раз произвести регистрацию цен (тарифов). На основе полученной при регистрации цен информации производится расчет системы индексов цен, индекса потребительских цен. В Федеральной целевой программе «Развитие государственной статистики России в 2007—2011 годах» отмечено, что одним из важнейших элементов, определяющих точность расчета индексов цен, является объективно сформированная выборочная совокупность базовых организаций и качественно проведенный отбор товаров-представителей. В этой программе также отмечено, что «предполагается разработка концепции и методологии расчета индекса стоимости жизни, который, наряду с индексом потребительских цен, является важнейшим социально-экономическим показателем. 210
Актуальность его построения на этапе реформирования государственной статистики определяется кардинальными изменениями в системе обеспечения населения социальными услугами...»1. При решении данной задачи, несомненно, потребуется усовершенствовать порядок применения выборочного метода и обратиться к зарубежному опыту определения индекса стоимости жизни. 7.3. Выборочные обследования заработной платы Оплата труда является важнейшим индикатором уровня жизни и состояния населения страны и ее экономики. Анализ тенденций в сфере оплаты труда составляет актуальное направление статистических исследований. Наряду со сплошным учетом, органами государственной статистики, начиная с 1994 г., осуществляются выборочные обследования, направленные на получение информации по следующим вопросам оплаты труда: 1. Распределение работников по размеру среднемесячной заработной платы. 2. Затраты организаций на оплату труда. 3. Среднемесячная заработная плата работников органов исполнительной власти. 4. Среднемесячная заработная плата работников по профессиям и должностям2. Эта информация необходима для анализа масштабов дифференциации оплаты труда по территории, по видам экономической деятельности, группам профессий, по демографическим группам населения. На основе материалов выборочных обследований заработной платы определяется соотношение оплаты труда у разных категорий занятого населения с величиной прожиточного минимума, оценивается соотношение динамики оплаты труда и производительности труда. 1 О мероприятиях Федеральной целевой программы «Развитие государственной статистики России в 2007—2011 годах» // Вопросы статистики. - 2007. - № 2. - С. 8. 2 См.: Горбачева Т.Л., Белоконная Л.А., Жихарева О.Б. Новые подходы к организации статистического наблюдения за дифференциацией заработной платы по группам профессий и должностей // Вопросы статистики. - 2005. - № 10. - С. 27-31. 14* 211
В период с 1994 по 2000 г. обследования заработной платы проводились по выборочному кругу организаций-представителей, исключая субъекты малого предпринимательства. Начиная с 2001 г. Росстат перешел на новую научно обоснованную методологию ежегодных репрезентативных выборочных обследований заработной платы. Период наблюдения составляет один календарный месяц — апрель. Другим направлением обследований в области оплаты труда явилось статистическое наблюдение за объемом и составом затрат организаций на рабочую силу, которое стало осуществляться с 1995 г. на выборочной основе с периодичностью один раз в два года во всех регионах страны. С 1999 г. наблюдения за составом затрат организаций на рабочую силу стали проводиться по новой, более совершенной методологии. Новая модель построения выборочной совокупности обеспечивала возможность распространения выборочных данных на генеральную совокупность дифференцированно по субъектам Российской Федерации, по видам экономической деятельности, по формам собственности, по группам организаций с разной численностью работников. Программа обследования была приведена в соответствие с международными стандартами. Среднемесячные затраты организаций на рабочую силу определяются в расчете: а) на одного среднесписочного работника; б) на один отработанный час и в) на один оплаченный час. Начиная с 1994 г. в России стали проводиться выборочные обследования заработной платы работников по профессиям и должностям, получившие в международной практике название Октябрьских обследований. Такие обследования проводятся в октябре месяце в странах мира по рекомендации международной организации труда (МОТ) в целях получения сравнительных данных о покупательной способности заработной платы работников по 159 профессиям и 49 отраслям экономической деятельности. В российской статистике постепенно уточнялась программа Октябрьских обследований и совершенствовалась методика формирования выборки. Была утверждена форма № 57-т «Сведения о заработной плате работников по профессиям и должностям». Формирование выборочной совокупности осуществляется в порядке двухступенчатой выборки с применением особого по- 212
рядка отбора единиц на первой ступени. На первой ступени производится отбор организаций, на второй ступени в отобранных организациях производится выборка работников. На первой ступени в качестве основы выборки используется форма сплошной отчетности организаций № П-4 за август месяц. Генеральная совокупность организаций делится на два массива: 1. Организации с численностью работников 2000 человек и более. 2. Организации с численностью работников менее 2000 человек. Первый массив подвергается сплошному обследованию, второй обследуется в порядке расслоенной (стратифицированной) выборки. Таким образом, на первой ступени имеет место сочетание цензового и выборочного методов наблюдения. На второй ступени выборки производится отбор конечных единиц наблюдения — работников. Отбор осуществляется по всем организациям первого массива и попавшим в выборку организациям второго массива. В качестве генеральной совокупности на второй ступени выступают работники организации, полностью отработавшие обследуемый месяц. Распространение выборочных данных на генеральную совокупность производится на каждой ступени отбора с использованием весовых коэффициентов. Благодаря тому, что программа обследования и методология выборки согласованы с принципами и стандартами международной статистики труда и оплаты труда, обеспечена возможность сравнительного анализа ситуации в области оплаты труда в России и зарубежных странах. Информация по России включается в международные банки данных. 7.4. Локальные выборочные обследования Все рассмотренные нами статистические обследования являются федеральными выборочными наблюдениями. Лишь в отдельных случаях выборочные обследования организуются по инициативе территориальных органов государственной статистики и ограничиваются пределами соответствующих субъектов Российской Федерации. Примерами таких локальных работ могут 213
служить выборочное обследование домохозяйств Кировской области по проблеме бедности и анкетный опрос мнений пользователей статистической информации в Вологодской области. Региональное единовременное обследование «Оценка благосостояния населения Кировской области». По заказу Правительства Кировской области в 2005 г. территориальным органом Росстата по Кировской области был подготовлен аналитический материал «Проблемы бедности населения Кировской области». В продолжение этой работы в марте 2006 г. Кировстат провел региональное единовременное выборочное обследование домохозяйств в целях изучения информации об уровне жизни малоимущих слоев населения области1. Полученные материалы дополняют и углубляют данные федерального статистического наблюдения по обследованию бюджетов домашних хозяйств и по проблемам занятости населения. Как сообщается в опубликованной статье сотрудников Ки- ровстата, обследованием было охвачено 626 домашних хозяйств, из которых на долю городских домохозяйств приходилось 72% и на долю сельских — 28%, что соответствует реальной структуре генеральной совокупности. Опрос проводили опытные интервьюеры. Разработанная Кировстатом анкета содержала 33 вопроса о бюджете домохозяйства, о жилищных условиях, о факторах, влияющих на уровень жизни населения. Как и в подавляющем большинстве статистических публикаций, в указанной статье, к сожалению, отсутствует информация о способе формирования выборочной совокупности, о величине ошибок репрезентативности, о порядке распространения выборочных данных на генеральную совокупность. Изучение рейтинга статистической информации на основе метода анкетного опроса. На базе принятых Росстатом в 2001 г. «Основных методологических положений по оценке качества статистической информации» были разработаны методологические рекомендации по рейтинговой оценке качества статистических обследований, которые должны способствовать повышению качества представляемой пользователям статистической информации. 1 См.: Зорин Н.И., Кудрявцева P.M., Снигирева И.В. Оценка благосостояния населения Кировской области на основе единовременного выборочного обследования//Вопросы статистики. — 2007. — N° 3. — С. 52—57. 214
В условиях рыночной экономики информационные услуги занимают все более приоритетные позиции в системе общественных отношений. Производители информационных ресурсов, в том числе органы государственной статистики, ориентируются в своей деятельности на запросы потребителей информации. Этим определяется актуальность маркетинговых исследований рынка статистических информационных услуг. Однако о таком направлении аналитических работ в системе Росстата пока крайне мало сообщений. Уникальной в своем роде является публикация статьи об опыте исследования мнений пользователей статистической информации территориального органа Росстата по Вологодской области (Вологдастат)1. Вологдастатом, начиная с 1997 г., проводятся анкетные опросы пользователей статистической информации. В 1997, 1999, 2002 и 2005 гг. на вопросы анкеты отвечали представители Правительства области, органов исполнительной государственной власти, Законодательного Собрания области, территориальных подразделений федеральных органов исполнительной власти, администраций муниципалитетов, а также сотрудники банков, учебных заведений, библиотек, коммерческих структур. Анкета содержит вопросы об оценках качества, доступности, стоимости получаемых статистических услуг. Предлагается высказать предложения и рекомендации по совершенствованию информационной деятельности Вологдастата. В апреле-мае 2005 г. Вологдастат направил в организации 91 анкету, из которых 75 анкет было заполнено респондентами. Такой результат свидетельствует об успехе предпринятого обследования. Как известно, анкетные обследования по своей природе мало пригодны для получения информации, которая была бы достаточно репрезентативна относительно генеральной совокупности, а возврат анкет обычно колеблется на уровне около 30%. К сожалению, в опубликованной в журнале «Вопросы статистики» статье отсутствуют какие-либо оценки и дополнительная информация, по которым можно было бы судить о степени репрезентативности полученных данных. Не приводятся сведения о составе и объеме генеральной совокупности. Нет инфор- 1 См.: Митичева О.Н. Маркетинг статистической информации: итоги исследования//Вопросы статистики. — 2005. — № 10. — С. 57—59. 215
мации о том, какого уровня должностные лица и сотрудники осуществляли заполнение анкет. Однако общеизвестные недостатки анкетного метода сбора информации в некоторой мере смягчены благодаря тому, что разработка итогов обследования в основном осуществляется в разрезе различных категорий пользователей статистической информации. При таком подходе не имеют значения возможные нарушения пропорций между основными группами потребителей информации. Мы завершили рассмотрение вопросов теории и практики выборочных наблюдений в социально-экономической статистике. В следующей главе для сравнения приведен ряд примеров использования выборочного метода в нестатистических областях деятельности. Это позволит получить более полное представление о том, насколько велики и многообразны потенциальные возможности выборочного метода как инструмента получения информации по объекту в целом на основе наблюдения только некоторой его части. В пределах самой социально-экономической статистики не исчерпаны возможности использования выборочного метода. В Федеральной целевой программе развития государственной статистики России в 2007—2011 гг. указано, что для получения некоторых показателей потребуется проведение новых статистических работ, прежде всего выборочных наблюдений, нацеленных на выяснение мнений предпринимателей и населения по актуальным проблемам социально-экономического развития страны. В нашей стране реализуется проект «Разработка методологии статистики ИКТ в России в соответствии с международными стандартами», направленный на исследование состояния и тенденций динамики сферы информационно-коммуникационных технологий (ИКТ). В частности, актуальной задачей является общее повышение статистической грамотности населения, включая область ИКТ. Для продвижения в этом направлении признано необходимым осуществить методические работы по организации регулярных выборочных обследований и расширения навыков применения ИКТ населением. 216
Росстатом планируется разработать методологическую базу по расширению выборочной сети домашних хозяйств, предназначенной для обследований населения по проблемам занятости. Предстоит найти решения вопросов совершенствования организационно-методических основ некоторых федеральных выборочных обследований. Сохраняет свою актуальность проблема создания надежной основы выборки для обследования индивидуальных предпринимателей. Остается пока незавершенным проект создания территориальной выборки многоцелевого назначения на основе итогов переписей населения. Важной задачей является организация выборочных статистических наблюдений в сельском хозяйстве при использовании в качестве основы выборки материалов Всероссийской сельскохозяйственной переписи 2006 г. Контрольные вопросы 1. Охарактеризуйте задачи бюджетных обследований домохо- зяйств. 2. Что является основой выборки при обследовании бюджетов домашних хозяйств? 3. Какой вид выборки применяется при обследовании бюджетов домашних хозяйств? 4. Перечислите основные выборочные обследования, проводимые в целях изучения уровня жизни населения. 5. Какое выборочное наблюдение получило название Октябрьского обследования? 6. Когда в России статистика потребительских цен была переведена на выборочную основу? 7. Каковы основные методологические подходы в российской статистике цен? 8. Какие виды индексов цен применяются в российской статистике? 9. Что понимается под индексом потребительских цен? 10. Укажите основные правила отбора базовых организаций для наблюдения за потребительскими ценами. 11. Как производится формирование перечня товаров и услуг для наблюдения за ценами? 12. Изложите основные правила регистрации цен на товары и услуги. 217
13. Каковы правила отбора товаров-представителей? 14. Укажите единицы отбора на первой и второй ступенях выборочного обследования заработной платы работников по профессиям и должностям по форме № 57-т. 15. Что понимается под локальными выборочными обследованиями? 16. Возможны ли маркетинговые исследования в сфере государственной статистики? 17. Приведите пример использования анкетного наблюдения в практике органов государственной статистики. Глава 8 ВЫБОРОЧНЫЙ МЕТОД В НЕКОТОРЫХ ОБЛАСТЯХ НЕСТАТИСТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ Выборочный метод, подобно иным элементам статистической методологии, находит самое широкое применение не только в различных областях социально-экономической статистики, но и в самых разных отраслях деятельности, как пограничных с социально-экономической статистикой, так и достаточно далеких от нее. При наличии ряда общих подходов существуют специфические принципы и методы выборочных наблюдений, обусловленные особенностями объекта и предмета исследования в каждой конкретной области деятельности. 8.1. Выборочный метод в аудиторской практике Необходимость применения выборочного метода в аудите была признана еще в начале XX в. В западной науке систематически совершенствовались методы аудиторской деятельности и в том числе аудиторской выборки. Был создан Совет по аудиторским стандартам (ASB). Стандарты аудиторской выборки представлены в Руководстве по стандартам в области проведе- 218
ния аудиторских проверок (SAS) № 39, «Аудиторский выборочный метод» (AU, раздел 350.01)1. В России потребность в аудите возникла лишь в конце XX в. в связи с переходом к рыночным отношениям. Активно стал заимствоваться зарубежный опыт и адаптироваться к российским условиям. Основными целями аудита являются выражение мнения о достоверности финансовой (бухгалтерской) отчетности аудируемых лиц и о соответствии порядка ведения бухгалтерского учета законодательству Российской Федерации. Осуществление аудиторской деятельности урегулировано Федеральным законом «Об аудиторской деятельности». Существуют утвержденные постановлением Правительством Российской Федерации стандарты аудиторской деятельности, которые разработаны с учетом международных стандартов аудита. Стандартом № 1 предусмотрено, что в ходе аудита применяются выборочные методы и тестирование. Стандартом № 16 «Аудиторская выборка» установлены единые требования к выборочным проверкам в аудите, к методам отбора контролируемых элементов, подлежащих проверке в целях сбора аудиторских доказательств. Стандартом 16 определено, что под аудиторской выборкой понимается «применение аудиторских процедур менее чем ко всем элементам одной статьи отчетности или группы однотипных операций»2. В этом определении представлено более широкое, чем в математической статистике и общей теории статистики, толкование термина «выборка». Под выборкой в аудите понимается любой вид несплошного наблюдения. Такая расширительная в сравнении с математической статистикой интерпретация термина «выборка» представляет весьма распространенное явление. В аудите четко разграничиваются статистический и нестатистический подходы к выборочной проверке. Таким образом, в аудите понятие «статистическая выборка» соответствует понятию «выборка» в математической статистике. 1 Аудит Монтгомери/ФЛ. Дефлиз, Г.Р. Дженик, В.М. Рейли, М.Б. Хирш/ пер. с англ.; под ред. Я.В. Соколова. - М.: Аудит, Юнити, 1997. - С. 242. 2 Василенко А.А. Стандарты аудита. Изучайте и внедряйте. — Ростов- на-Дону: Феникс, 2006. - С. 272. 219
Применяемый в статистике термин «единица наблюдения» в аудите заменен на термин «элемент выборки». Элементами выборки могут быть натуральные объекты, виды операций, числовые показатели. Еще одним примером разного толкования терминов может служить понятие «ошибка выборки». В математической статистике и общей теории статистики это понятие полностью тождественно термину «ошибка репрезентативности». Но «Аудиторский словарь» содержит следующее определение: «Ошибка выборки - ошибка, не обнаруживаемая аудитором в силу применения аудиторской выборки. Для устранения ее негативного воздействия при расчете объема аудиторской выборки используется пониженный уровень существенности, увеличивая тем самым число отбираемых элементов»1. Использование разных терминов для обозначения одного и того же понятия и придание разного смысла одному и тому же термину в отдельных научных дисциплинах, даже достаточно близких, — весьма распространенное явление. В нормативно- правовых документах даются определения основных используемых терминов, чтобы правовая норма была всеми понята правильно. Но в научных публикациях, в учебной литературе не всегда достаточно строго придерживаются этого правила. Использование выборочного метода в аудите представляет заслуживающий внимания пример его применения за пределами социально-экономической статистики. В стандарте аудиторской деятельности № 16 указано, что аудитор при планировании своей работы выбирает один из трех способов отбора элементов для тестирования. Аудитор может: • отобрать все элементы (сплошная проверка); • отобрать специфические (определенные) элементы, что в статистическом понимании, видимо, наиболее близко к монографическому обследованию; • отобрать отдельные элементы (сформировать аудиторскую выборку). Выбор одного из этих методов или их сочетания зависит от обстоятельств проверки - аудиторского риска и эффективности аудита. 1 Аудиторский словарь/ СМ. Бычкова, М.В. Райхман, В.Я. Соколов и др.; под ред. В.Я. Соколова. — М.: Финансы и статистика, 2003. — С. 114. 220
Ценно, что в стандарте 16 «Аудиторская выборка» представлен ряд строго научных подходов к вопросам применения выборочного метода. Указано, в частности, что, исходя из цели и условий аудиторской проверки, необходимо определить, какая генеральная совокупность должна быть использована для выборочной проверки. Сделано предостережение о том, что статистические измерения риска (ошибок репрезентативности), связанного с использованием выборочного метода, правомерны только при условии полного соблюдения принципов статистической выборки. Дано строгое определение понятия «риск, связанный с использованием аудиторской выборки». При определении необходимого объема выборки аудитор ориентируется на допустимый уровень риска, который он готов принять на себя. Чем ниже допустимый уровень риска, тем большим должен быть объем выборки. Возможны два способа определения объема выборки: а) использование принятых в статистике формул для расчета необходимого объема выборки и б) принятие решения о необходимом объеме выборки на основе профессионального суждения аудитора, учитывающего роль основных факторов, от которых зависит необходимое число отбираемых элементов. В современных условиях в организациях возрастает интерес к проведению независимого внутреннего аудита, при этом существенно меняются его цели и содержание. Основной целью внутреннего аудита является снижение различного рода финансовых потерь организации. Усиливается роль аудита как источника оперативной информации для руководства о проблемных ситуациях. Внутренний аудит в наиболее продвинутых его формах способен сглаживать традиционный конфликт интересов проверяемых и проверяющих инстанций. В области методологического сопровождения деятельности аудитора в организации существенным моментом является профессиональное владение основами статистики, включая вопросы методов построения числовых индикаторов, использования выборочного метода при выполнении ряда операций. На корпоративном уровне с помощью выборочного метода осуществляется проверка (тестирование) эффективности системы внутреннего контроля и аудита в сфере бухгалтерского и финансового учета. Тестирование распространяется на все пять 221
элементов внутреннего контроля: контрольную среду, оценку рисков, контрольные процедуры, информационно-коммуникационную систему, мониторинг. 8.2. Выборочный метод как инструмент менеджмента качества Характерной особенностью современного этапа развития науки об управлении является расширение практики использования выборочного метода в микроэкономике — при проведении маркетинговых исследований, в менеджменте персонала, менеджменте качества и при решении целого ряда других вопросов управления предприятием, организацией. В этом разделе будет дан краткий обзор применения выборочного метода в менеджменте качества. Основным условием обеспечения конкурентоспособности организаций в любой сфере деятельности является высокое качество производимых товаров, услуг, работ. Рост актуальности проблем качества способствовал тому, что в 1980-е гг. Международной организацией по стандартизации были приняты международные стандарты качества ИСО серия 9000. Сформировалась самостоятельная область менеджмента — менеджмент качества, методология которого в зарубежной практике получила название TQM (total quality management), т.е. тотальное управление качеством. Система TQM призвана обеспечить эффективность и высокое качество всех аспектов деятельности и всех этапов воспроизводственного процесса в организации. При использовании менеджментом качества разработанной математической статистикой теории выборочного метода возникла необходимость формирования ряда специфических приемов его реализации с учетом целей и условий осуществления менеджмента качества1. Наиболее существенными особенностями применения выборочного метода в менеджменте качества, в отличие от выборочного метода в социально-экономической статистике, являются: 1 См.: Управление качеством: учебник / С.Д. Ильенкова, Н.Д. Ильенкова, B.C. Мхитарян и др.; под ред. С.Д. Ильенковой. — 2-е изд., пере- раб. и доп. - М.: ЮНИТИ-ДАНА, 2006. - С. 83. 222
• высокий уровень доступности единиц наблюдения в менеджменте качества, что исключает необходимость конструирования сложных схем отбора (видов выборочного наблюдения); • специфическая функциональная направленность задач, решаемых с помощью выборочного метода в менеджменте качества. В социально-экономических исследованиях с применением выборочного наблюдения решаются задачи получения информация широкого спектра практического использования, и поэтому нет жесткой однозначной связи между техникой выборки и целевым назначением результатов выборки. В менеджменте качества выборочный метод используется в форме прямого контроля, и результаты выборки непосредственно являются основанием для принятия конкретного решения, например, о приемке и выбраковке партии продукции; • в социально-экономической статистике выборочное обследование, как правило, проводится по широкой программе наблюдения, а в менеджменте качества при выборочном контроле фиксируются один или ограниченное число признаков, необходимых и достаточных для диагностики годности тестируемых объектов; • в социально-экономической статистике информация, полученная при выборочном наблюдении, предназначается преимущественно для решения стратегических задач управления на федеральном, региональном или местном уровнях. При преобладании стратегической целевой направленности выборочных обследований в социально-экономической статистике они проводятся обычно периодически с достаточно большим интервалом времени, а иногда и как единовременные. Выборочный метод в менеджменте как инструмент контроля качества предполагает его использование в режиме текущего наблюдения с краткими интервалами времени между точками отбора в непрерывном потоке материальных ценностей, составляющих результат производственного процесса; • существует принципиальное различие между формами организации выборочных обследований в социально-экономической статистике и в менеджменте качества. В социально-экономической статистике выборочные обследования имеют либо форму проводимых органами государственной статистики специально организованных наблюдений, либо это статистическая отчетность организаций, представляемая ими на выборочной 223
основе в органы государственной статистики. В менеджменте качества выборочное наблюдение обычно как бы «встроено» в производственный процесс, составляет один из его элементов. Характерной особенностью применения выборочного метода в менеджменте качества являются строгое следование принципам выборочного метода, основанным на математической теории вероятностей, и отказ от использования каких-либо упрощенных схем отбора, несовместимых с моделью случайного отбора. Относительная автономность данной области выборочных наблюдений привела, как это обычно происходит, к частичному отходу от понятийного аппарата, принятого в математической статистике, являющейся в действительности единой математической базой для развития прикладных выборочных наблюдений в различных областях знания. Применение выборочного метода в менеджменте качества нередко сопряжено с использованием иных, чем в математической статистике, терминов для обозначения одних и тех же понятий и с изменением содержания прежних терминов, употребляемых в математической статистике. Наиболее распространенной областью применения выборочного метода в менеджменте качества является выборочный приемочный контроль готовой продукции с разграничением годных и дефектных изделий. Изучаемым выборочным показателем является доля дефектных изделий. Если в социально-экономической статистике результатом выборочного наблюдения является получение информации о величине изучаемых показателей по выборке и значении ошибки репрезентативности, на основании которой вычисляются данные по генеральной совокупности, то в менеджменте качества при определении выборочной доли дефектных изделий может быть принято одно из трех решений: • партия изделий принимается; • партия изделий забраковывается; • необходимо продолжить контроль. Схема отбора в сочетании с принятым решением называется планом статистического контроля, под которым понимается «система правил, указывающих методы отбора изделий для проверки, и условия, при которых партию следует принять, забра- 224
ковать или продолжить контроль»1. План статистического контроля проектируются заранее с таким расчетом, чтобы вероятность риска производителя не превышала 0,05, т.е. составляла не более 5%. При этом под риском производителя (поставщика, риск первого рода) понимается риск того, что ошибочно будет забракована партия фактически годной продукции. Одновременно следует не превышать приемлемого уровня риска потребителя (риска второго рода), т.е. риска приемки продукции низкого качества, вероятность которого не должна превышать 0,05. Возможно применение следующих видов планов статистического контроля качества: одноступенчатые планы, двухступенчатые планы, многоступенчатые планы, последовательный контроль2. Наиболее простыми с точки зрения организации являются одноступенчатые планы, дающие, однако, менее точные результаты, чем другие виды планов. Используемое в менеджменте качества понятие «план статистической выборки» близко по смыслу к принятому в социально-экономической статистике понятию «вид выборочного наблюдения». Однако термины «одноступенчатый план», «двухступенчатый план», «многоступенчатый план» отнюдь не тождественны принятым в математической и социально-экономической статистике понятиям «одноступенчатая выборка», «многоступенчатая выборка». При использовании одноступенчатого плана статистического контроля действуют следующие правила: 1. Если среди отобранных в случайном порядке изделий число дефектных изделий не превысит установленного приемочного числа, то вся партия принимается. 2. Если среди отобранных в случайном порядке изделий число дефектных изделий превысит установленное приемочное число, то вся партия не принимается. При действии двухступенчатого плана приемочного контроля предусмотрены следующие правила. На первой ступени плана: • если среди отобранных в случайном порядке изделий число дефектных изделий не превысит установленного приемочного числа, то вся партия принимается; 1 Управление качеством: учебник — С. 84. 2 См.: Мхитарян B.C. Статистические методы в управлении качеством продукции. - М.: Финансы и статистика, 1982. - С 23-24. 15-2394 225
• если среди отобранных в случайном порядке изделий число дефектных изделий превысит установленное браковочное число, то вся партия не принимается; • если среди отобранных в случайном порядке изделий число дефектных изделий превысит установленное приемочное число, но будет меньше браковочного числа, то принимается решение о взятии второй выборки и осуществляется переход ко второй ступени. На второй ступени плана: • если суммарное число дефектных изделий, полученных на двух ступенях приемочного контроля, не превысит суммарного приемочного числа по двум ступеням, то партия изделий принимается; • если суммарное число дефектных изделий, полученных на двух ступенях приемочного контроля, превысит суммарное приемочное число по двум ступеням, то партия изделий не принимается. При многоступенчатом плане приемочного контроля действуют следующие правила. На первой ступени плана: • если среди отобранных в случайном порядке изделий число дефектных изделий не превысит установленного приемочного числа, то вся партия принимается; • если среди отобранных в случайном порядке изделий число дефектных изделий превысит установленное приемочное число, но будет меньше браковочного числа, превышающего приемочное число плюс единица, то партия бракуется; • если среди отобранных в случайном порядке изделий число дефектных изделий превысит установленное приемочное число, но будет меньше браковочного числа, то принимается решение о взятии второй выборки. На второй ступени плана: • если суммарное число дефектных изделий, полученных на двух ступенях приемочного контроля, не превысит суммарного приемочного числа по двум ступеням, то партия изделий принимается; • если суммарное число дефектных изделий, полученных на двух ступенях приемочного контроля, превысит суммарное браковочное число по двум ступеням, исчисленное как приемочное число на второй ступени плюс единица, то партия изделий не принимается; 226
• если суммарное число дефектных изделий, полученных на двух ступенях приемочного контроля, превысит суммарное приемочное число, но будет меньше суммарного браковочного числа, то принимается решение о взятии третьей выборки. На последующих ступенях контроль производится по той же схеме, за исключением последней ступени, где отсутствует переход к следующей ступени. Модель последовательного контроля отличается от двухступенчатого и многоступенчатого планов тем, что вопрос о числе ступеней принимается не заранее, а в зависимости от результатов предыдущих ступеней. При необходимости проведения более жесткого контроля качества применяется план усиленного контроля. Если качество изделий в целом высокое, то можно применить планы облегченного контроля. Таким образом, существуют три уровня статистического приемочного контроля качества изделий: нормальный, усиленный и облегченный. Выбор вида плана статистического приемочного контроля зависит от ряда условий: является техника контроля разрушающей или неразрушающей, какова стоимость процедуры контроля, насколько жесткими являются требования к качеству изделий, какие виды объектов подвергаются контролю. Для облегчения выбора вида плана приемочного контроля и правильной реализации выбранного плана создаются стандарты статистического контроля. Стандарты оформлены в виде ГОСТов. В современных условиях обеспечение качества становится одной из основных предпосылок конкурентоспособности фирм и производимых ими товаров. При этом только приемочного контроля недостаточно. Необходимо прежде всего предупреждать возможность появления дефектной продукции. Это достигается путем осуществления контрольных операций с применением выборочного метода на всех стадиях производства продукции, начиная с этапа проектирования нового продукта. Контрольные операции связаны с увеличением затрат на производство продукции. Снижение затрат и повышение эффективности статистического контроля качества достигаются на основе применения современной электронно-вычислительной техники, автоматизации измерительных процедур, совершенствования методики выборочного контроля. is* 227
8.3. Несплошные налоговые проверки Одной из функций налоговых органов является проведение камеральных и выездных налоговых проверок. Выездные проверки могут быть сплошными и несплошными. Понятие не- сплошной налоговой проверки имеет несколько значений: 1. Несплошной охват проверкой совокупности налогоплательщиков, состоящих на учете в конкретном налоговом органе. 2. Несплошной охват проверкой регистров финансового учета в проверяемых организациях. 3. Несплошной охват проверкой и совокупности налогоплательщиков, и регистров финансового учета. Выбор способа несплошного наблюдения определяется задачами проводимой конкретной налоговой проверки. В литературе, посвященной проблемам налогового контроля, разграничивают два основных способа отбора налогоплательщиков при несплошных проверках: случайный отбор и специальный отбор. Случайный отбор применяется в тех случаях, когда требуется получить общую оценку состояния налоговой дисциплины на контролируемой налоговым органом территории за счет репрезентативного отбора всех категорий налогоплательщиков. Специальный целенаправленный отбор заключается в выборе тех налогоплательщиков, у которых наиболее высока вероятность обнаружения налоговых нарушений. При специальном отборе обеспечивается высокая экономическая эффективность работы налогового органа за счет увеличения доначислений налоговых платежей в бюджет и наложения налоговых санкций1. В мировой практике налоговых проверок соотношение случайного и специального отбора отличается резким преобладанием метода специального отбора. В России в настоящее время случайный отбор налогоплательщиков при выездных налоговых проверках стал не актуален, сохраняется лишь практика специального отбора налогоплательщиков. В качестве единиц наблюдения при налоговом контроле могут выступать не только налогоплательщики, но и виды проверяемых документов. Проверка регистров финансовой отчетности 1 См.: Налоговый контроль: налоговые проверки и производство по фактам налоговых правонарушений: учебно-практич. пособие/под ред. Ю.Ф. Кваши. - М.: Юристъ, 2001. - С. 135. 228
может быть сплошной, и именуется она в налоговых органах комплексной проверкой. Несплошная проверка документов финансового учета в организациях заключается в том, что проверяется правильность начисления только конкретного вида налогов или платежей. Именуются такие проверки тематическими, и применяется специальный отбор вида проверяемых документов. Решения по вопросу о способе отбора налогоплательщиков или видов финансовых документов при конкретных налоговых проверках принимаются руководством каждого налогового органа. Общие правила проведения налоговых проверок, включая способы выбора проверяемых объектов, установлены Налоговым кодексом Российской Федерации. Рассмотрев особенности применения несплошного наблюдения при проведении аудита (см. разд. 8.1), проверках качества продукции (см. разд. 8.2) и налоговых проверках (см. разд. 8.3), можно обнаружить, несмотря на специфику каждой из этих сфер деятельности, ряд сходных условий, принципов и правил определения объектов наблюдения. 1. Основная направленность деятельности — осуществление контрольной функции, т.е. выявление случаев отклонения от установленных нормативов, правил, стандартов. 2. Способы определения нормативов, правил, стандартов качества жестко установлены нормативно-правовыми актами, ГОСТами, иными документами. 3. Способ использования полученной информации — выработка и реализация конкретных мер по устранению последствий выявленных отклонений и профилактике подобных отклонений в будущем. 4. Роль материальной (финансовой) составляющей в целевой ориентации деятельности — в качестве конечной цели доминирует выявление объемов и факторов прямых или косвенных материальных (финансовых) потерь, вызванных нарушением установленных стандартов, норм, правил. 5. Отношение к задаче обеспечения репрезентативности данных несплошного наблюдения относительно параметров генеральной совокупности — первостепенной является задача обна- 229
ружения основной массы допущенных отклонений, а проблема репрезентативности может быть: а) второй по своей значимости (контроль качества продукции); б) актуальной, наряду с другими критериями (аудит); в) мало значимой (налоговый контроль). 6. Отношение к использованию выборочного метода (случайного отбора) — является производным от ориентации в вопросе о репрезентативности, т.е. выборочный метод применяется в сочетании с другими видами несплошного наблюдения либо практически не используется. Возможны две основные целевые ориентации в определении способа отбора объектов контроля — случайный контроль и адресный контроль. Издержками адресного контроля могут явиться случаи возникновения «теневых» коррупционных отношений между контролирующими и контролируемыми структурами. 7. Степень строгости требований к следованию установленному принципу отбора при несплошном наблюдении — требование неукоснительного соблюдения. 8. Наличие объективных предпосылок для последовательного соблюдения принятого способа отбора единиц генеральной совокупности — нет препятствий для точного следования установленным правилам отбора единиц. 9. Степень соответствия между содержанием термина «выборочный метод» в математической статистике и в различных видах контрольной деятельности — нет полного соответствия, в одних случаях интерпретация идентична, в других — выборочный метод отождествляется с несплошным наблюдением. Выводы об особенностях применения несплошного наблюдения, и выборочного метода в том числе, в различных видах контрольной деятельности со всей очевидностью показывают, что контрольная деятельность принципиально отличается по своим задачам и условиям проведения отбора от исследований в области социально-экономической статистики. Вследствие этого для контрольной деятельности не являются однозначно оптимальными такие положения социально-экономической статистики, как: а) выборочный метод является наиболее полноценным научно обоснованным видом несплошного наблюдения; б) необходимо обеспечивать репрезентативность материалов выборочного наблюдения, чтобы его результаты были представительны для генеральной совокупности. 230
Более близкими к социально-экономическим статистическим исследованиям по своим задачам и условиям проведения являются маркетинговые и социологические исследования. 8.4. Выборочный метод в маркетинговых исследованиях Различные виды несплошных обследований широко практикуются в маркетинговых исследованиях, в которых, как обычно, выбор вида несплошного наблюдения зависит от цели и условий выполнения работ. Значительный блок задач маркетинговых исследований связан с изучением конъюнктуры рынка потребительских товаров, мониторингом структуры спроса и предложения на рынке, оценкой потребительских предпочтений. В качестве генеральной совокупности в таких исследованиях выступает население территории, соответствующей границам целевого рынка. Очевидно, что подобные обследования не могут быть сплошными. Помимо обычных мотивов замены сплошного обследования несплошным (экономия средств, ускорение работ), выдвигается и такая причина, как желание сохранить в тайне от конкурентов сам факт проведения конкретного маркетингового исследования. В научной и учебной литературе, посвященной проблемам маркетинга, представлены разнообразные подходы к вопросу об определении способов несплошного обследования. Преобладают две позиции: а) за основу формирования методов несплошных обследований в маркетинге принимается сложившаяся в статистической науке теория выборочного метода; б) дублируется социологический подход к методике несплошных обследований. При статистической ориентации несплошных маркетинговых исследований считается, что предпочтительным является выборочное наблюдение в форме случайной бесповторной выборки. Специально оговаривается, что должны строго соблюдаться три условия: • всем единицам совокупности должна быть обеспечена равная возможность быть отобранными; • генеральная совокупность должна быть достаточно большой; 231
• генеральная совокупность должна быть однородной с точки зрения исследуемых характеристик, свойств1. Отмечается также необходимость четкого отграничения генеральной совокупности с определением единицы наблюдения, территориальных границ генеральной совокупности и границ выборочного обследования во времени. Особое внимание уделяется качеству основы выборки и определению необходимого объема выборки. В условиях социологической ориентации несплошных маркетинговых исследований при определении методики несплошного обследования признается, что выборочный (вероятностный) метод обладает несомненными достоинствами, но далеко не всегда имеется возможность реализовать его на практике. Основным препятствием является принцип добровольности участия населения в обследовании. Маркетинговая информация должна быть средством ориентации в рыночном пространстве при определении предпринимателями путей эффективного развития своего бизнеса. Однако, как отмечают специалисты, в России маркетинговая информация отличается низкой достоверностью. К числу основных причин такой ситуации специалисты относят отсутствие в стране «единой национальной информационной системы, которая объединяла бы информационные потоки министерств и ведомств, профессиональных саморегулирующихся организаций и т.д.» и такой фактор, как «общепринятая практика искажения юридическими лицами всех возможных показателей своей деятельности, начиная от данных бухгалтерской отчетности и заканчивая ответами на вопросы анкет»2. 8.5. Особенности применения выборочного метода в социологии Особенности объекта и предмета полевых исследований в социологии создают объективные предпосылки к тому, что несплошные обследования являются основным источником 1 См.: Беляевский И.К. Маркетинговые исследования: информация, анализ, прогноз: учеб. пособие. - М.: Финансы и статистика, 2002. - С. 51. 2 Мусин М.М. Матрицы влияния. Концепция формирования услуг бизнес-консалтинга на основе матриц экономических интересов. — М.: РФМ-финанс, 2004. - С. 277. 232
информации. Сбор данных осуществляется с разной периодичностью - от единовременных обследований до ежеквартального мониторинга. В социологии наиболее распространенным способом формирования обследуемых совокупностей является квотный отбор. Одним из примеров реализации квотного отбора может служить крупномасштабное мониторинговое исследование динамики массового сознания и положения россиян, проводимое в стране начиная с 1992 г. Данный проект осуществлялся в период с 1992 по 2000 г. ежеквартально Российским независимым институтом социальных и национальных проблем совместно с Центром социального прогнозирования. В последующие годы мониторинг стал проводиться Институтом комплексных социальных исследований РАН с периодичностью 2—3 раза в год. Особенности предмета и объекта социологического исследования определяют значительное разнообразие подходов к формированию выборки и организации обследования. Например, Фондом ИНДЕМ в 2001 и 2005 гг. проводились исследования коррупции в России. Были сформированы две независимые выборки - граждан и предпринимателей. По материалам опроса этих двух совокупностей формировались выводы о «рынке деловой коррупции» в России1. Всероссийский центр изучения общественного мнения (ВЦИОМ) проводит еженедельные опросы общественного мнения по разнообразной тематике по общероссийской выборке объемом в 1600 человек с охватом около 150 населенных пунктов в 45 областях, краях и республиках. Социологические исследования затрагивают самые разнообразные сферы жизни человека и общества, и соответственно применяются различные способы формирования эмпирической базы этих разработок. Вместе с тем в социологии существует ряд общих подходов к отбору наблюдаемых объектов. Во-первых, при формировании собственно социологической информации практически исключена возможность получения данных сплошного учета. Действительно, характер необходимой информации таков, что она отсутствует в полном объеме в уже существующих базах данных сплошного учета и ее можно получить только с помощью специально организован- 1 См.: Сатаров Г. Как измерять и контролировать коррупцию//Вопро- сы экономики. - 2007. - JSfe 1. - С. 4-10. 233
ных обследований. Объектом наблюдения в социологии является все население страны или его отдельные категории. При столь большой численности генеральной совокупности полностью исключается возможность сплошного социологического обследования. Во-вторых, при проведении социологических обследований затруднительно реализовать в чистом виде выборочный метод в его строго математико-статистическом понимании и приходится обращаться к разного рода упрощенным схемам отбора единиц наблюдения. Если Росстат располагает для проведения выборочных социально-экономических обследований достаточно качественными основами выборки, то в социологии надежные основы выборки отсутствуют. В-третьих, сама природа исследуемых в социологии закономерностей допускает менее жесткие требования к точности материалов несплошного наблюдения, чем в социально-экономической статистике. В-четвертых, преобладающие в социологии оценочные характеристики не имеют точной количественной единицы измерения, и эта неопределенность усиливается за счет субъективизма индивидуальных мнений-оценок (в социально-экономической статистике, как правило, определяется точная количественная мера объективно заданных параметров). Следовательно, нет настоятельной необходимости добиваться высокоточных схем формирования выборочной совокупности для минимизации ошибок репрезентативности, если регистрируемая информация не обладает таким же уровнем точности (подобно тому, как для взвешивания разных типов товаров применяются весы с разным допуском погрешности). Использование выборочного метода и иных видов несплошных наблюдений в нестатистических сферах не ограничено рассмотренными в этой главе примерами. Выборочный метод составляет неотъемлемый элемент научных исследований, экспериментальных и прикладных разработок в медицине, психологии, технике, биологии, геологии и других сферах, когда необходимо оценить неизвестные свойства генеральной совокупности. При этом нередко используемый математический аппарат является значительно более тонким и сложным, чем в экономических исследованиях. 234
Контрольные вопросы 1. Что понимается под аудиторской выборкой? 2. Перечислите основные виды элементов аудиторской выборки. 3. Какие факторы определяют объем выборки при аудиторской проверке? 4. В чем заключается отличие задач использования выборочного метода при независимом внутреннем аудите и при внешнем аудите? 5. Каковы основные различия в применении выборочного метода в менеджменте и в социально-экономической статистике? 6. Что понимается под многоступенчатым планом статистической выборки в менеджменте качества и под многоступенчатой выборкой в социально-экономической статистике? 7. Что понимается под последовательным выборочным контролем качества изделий? 8. От каких условий зависит выбор вида плана статистического контроля в менеджменте качества? 9. Каковы цели несплошных налоговых проверок? 10. Почему в налоговом контроле нет необходимости использования выборочного метода? 11. Укажите специфические особенности несплошных обследований при проведении различного рода контрольных операций. 12. Объясните, чем затруднено применение вероятностной выборки в маркетинговых исследованиях. 13. Что препятствует применению выборочного метода в социологических обследованиях? 14. Каков объект наблюдения в проводимых ВЦИОМ опросах общественного мнения? 15. Какие способы несплошного наблюдения преимущественно используются в социологии?
ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ 1 Таблица случайных чисел Ряд 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Колонка 12345 66194 78240 00833 12111 47189 76396 46409 74626 34450 36327 74185 12296 90822 72121 95268 92603 18813 38840 05959 85141 75047 30752 22986 99439 20389 39249 96777 04860 41613 17930 24649 79899 76801 36239 67890 28926 43195 88000 86683 99951 72486 17469 22111 81974 72135 77536 41623 60280 79152 41377 09091 90291 26903 33836 21155 59643 95260 82575 86692 93029 05173 33605 32918 42375 00794 31845 34061 49594 63636 12345 99547 24837 67299 61270 05755 62423 32483 87286 93723 33005 84825 62873 88925 96591 25684 75884 05275 28624 53758 99212 31074 68032 42187 90348 11881 68256 29481 10798 00403 53836 25736 54308 81002 38140 67890 16625 32511 68215 58036 03834 27618 09083 46772 49023 28701 09934 37943 99610 90305 08151 93424 01223 67157 16562 32685 38172 62871 62295 66036 71685 36359 20063 50492 03656 53692 75231 59358 30397 65731 12345 45515 70880 11274 64192 43782 84184 76175 42243 58432 34710 99103 25584 42772 10189 61816 72586 79607 51986 41081 51403 03718 58781 84295 48399 65452 20250 09398 52655 77580 67135 83808 56462 52728 39788 67890 67953 22070 55624 90611 90599 78922 19985 68046 67083 49359 09325 09609 60561 79778 58555 85903 95426 42865 38012 31926 32119 34143 30634 73451 89047 68686 01843 33359 87772 98102 98917 58166 15101 06872 12345 12108 52622 32991 15145 40282 73561 26309 44250 36876 50693 67389 63360 76873 68016 54305 30061 34900 14508 41230 69813 69506 68790 66562 26698 63669 05947 35139 94713 86877 61912 93829 97302 72070 38971 67890 57846 61881 17436 01748 51417 52818 91536 42439 93391 89311 45869 47270 04117 13747 86189 14457 09778 49315 20528 58781 67143 69766 31442 39437 02656 09335 61344 28393 57085 11246 99430 86828 33706 53363 236
Продолжение Ряд 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 Колонка 12345 07392 67133 77759 85992 79553 41101 36191 62329 14751 48462 29435 28340 02167 17864 79675 72335 49280 61870 43898 62993 33850 55336 70543 89382 37818 60430 82975 39087 55700 14756 32166 23236 45794 09893 54382 94750 70297 85157 11100 36871 67890 64449 04181 31504 72268 75952 17336 17095 63898 13151 59278 88105 29285 58940 00991 80605 82037 88924 41657 65923 93912 58555 71264 29776 93809 72142 22834 66158 71938 24586 23997 53251 73751 26926 20505 74598 89923 34135 47954 02340 50775 12345 17886 33874 32832 42920 54116 48951 32123 23268 93115 _, 44185 59651 12965 27149 39557 60059 92003 35779 07468 25078 30454 51438 88472 10087 00796 67140 14130 84731 40355 93247 78643 70654 31888 15130 14225 91499 37089 53140 32979 12860 30592 67890 63632 98835 70861 20810 65553 53674 91576 74283 01437 29616 44391 14821 80242 54981 35862 34100 00283 08612 86129 84598 85507 04334 10072 95945 50785 96593 19436 54324 32596 75912 92827 81718 82455 68514 14523 20048 33340 26575 74697 57143 12345 53995 67453 15152 29361 47139 17880 84221 26091 56945 76537 74588 80425 10587 23588 00254 29879 81163 98083 78496 56095 71865 63919 55980 34101 22380 23298 55790 08401 11865 83832 63491 06546 78305 46427 68479 80336 42050 57600 96644 17381 67890 17574 59734 29733 51423 60579 45260 78902 68409 89661 19589 55114 16602 79786 81914 36546 46613 07275 97349 97653 20664 79488 36394 64688 81277 16703 56203 69229 26299 63397 32768 04233 83246 55058 56788 27686 94598 82341 40881 89439 68856 12345 22247 76381 75371 90306 09165 08575 82010 69704 67680 83139 80834 44653 34959 37609 21545 89720 89863 20775 91550 12872 76783 11095 68239 66090 53362 92671 28661 49420 44251 18928 33825 47651 52551 96297 46162 26940 44104 12250 28707 25853 67890 62607 63455 39174 73574 85490 49321 30874 82267 79790 28454 85686 70467 75339 13128 78179 13274 02348 45091 08078 64647 31708 92470 20461 88872 44940 15925 13675 59208 43189 57070 69662 04877 47182 78822 83554 36858 82949 73742 25815 35041 237
Продолжение Ряд 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 Колонка 12345 23913 79348 92074 06873 12478 57175 91616 78025 27587 16690 70183 90730 10934 82462 27463 02979 46888 53638 82433 35766 10853 20341 54458 26337 34314 28603 67890 48357 36085 54641 21440 37622 55564 11075 73539 67228 20427 58065 35385 93242 30166 10433 52997 69929 83161 61427 31672 42581 27398 90542 66530 23729 10708 12345 63308 27973 53673 75593 99659 65411 80103 14621 80145 04251 65489 15679 13431 79613 07606 09079 75233 08289 17239 50082 08792 72906 77563 16687 85264 68933 67890 16090 65157 54421 41373 31065 42547 07831 39044 10175 64477 31833 99742 24590 47416 16285 92709 52507 12639 89160 22795 13257 63955 51839 35179 05575 34189 12345 51690 07456 18130 49502 83613 70457 59309 47450 12822 73709 82093 50866 02770 13389 93699 90110 32097 08141 19666 66948 61973 17276 52901 46560 96855 92166 67890 54607 22255 60103 17972 69889 03426 13276 03197 86637 73945 16747 78028 48582 80268 60912 47506 37594 12640 08814 65581 24450 10646 53355 00123 23820 15181 12345 72407 25626 69593 82578 58869 72937 26710 12787 65530 92396 10386 75573 00906 05085 94532 53693 10067 28437 37841 84393 52351 74692 83281 44546 11091 66628 67890 55538 57054 49464 16364 29571 83792 73000 47709 49325 68263 59293 67257 58595 96666 95632 49892 67327 09268 12847 15890 16602 48438 19177 79896 79821 58599
ПРИЛОЖЕНИЕ 2 Значение интеграла вероятностей F{t) 1 +/е~2Л F(t) = F(t) - вероятность того, что ошибка репрезентативности выборочной оценки генерального параметра заключена в границах от — г средних ошибок репрезентативности до +/ средних ошибок. Например, F(2) = 0,9545 (в таблице приведены значения после запятой). t 0,0 0,1 0,2 0,3 0?4 0,5 0?6 0,7 0,8 0,9 1,0 и 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 Сотые доли / 0 0000 0797 1585 2358 3108 3829 4515 5161 5763 6319 6817 7287 7699 8064 8385 8664 8904 9108 9281 9425 9545 9643 9722 9785 9836 9876 9907 9931 9949 1 0080 0876 1663 2434 3182 3899 4581 5223 5821 6372 6875 7330 7737 8098 8415 8690 8926 9127 9297 9438 9556 9652 9729 9791 9840 9879 9909 9933 9950 2 0160 0955 1741 2510 3255 3969 4647 5285 5878 6424 6923 7373 7775 8132 8444 8715 8948 9146 9312 9451 9566 9660 9736 9797 9845 9883 9912 9935 9952 3 0239 1034 1819 2586 3328 4039 4713 5346 5935 6476 6970 7415 7813 8165 8473 8740 8969 9164 9327 9464 9576 9669 9743 9802 9849 9886 9915 9937 9953 4 0319 1114 1897 2661 3401 4108 4778 5467 5991 6528 7017 7457 7850 8198 8501 8764 8990 9182 9342 9476 9586 9676 9749 9807 9853 9889 9917 9939 9955 5 0399 1192 1974 2737 3473 4177 4843 5497 6047 6579 7063 7499 7887 8230 8529 8788 9011 9199 9357 9488 9596 9684 9755 9812 9857 9892 9920 9940 9956 6 0478 1271 2051 2812 3545 4245 4909 5527 6102 6626 7109 7540 7923 8262 8557 8812 9031 9216 9371 9500 9608 9692 9762 9817 9861 9895 9924 9942 9958 7 0558 1350 2128 2886 3616 4313 4971 5587 6157 6679 7154 7580 7959 8293 8584 8836 9051 9233 9385 9512 9615 9700 9768 9822 9866 9898 9926 9944 9959 8 0638 1428 2205 2961 3688 4381 5035 5646 6211 6729 7199 7620 7995 8324 8611 8859 9070 9249 9399 9523 9625 9707 9774 9827 9869 9901 9927 9946 9960 9 0718 1507 2282 3035 3752 4448 5098 5705 6265 6778 7243 7660 8030 8355 8638 8882 9089 9265 9412 9534 9634 9715 9780 9832 9872 9904 9929 9947 9961 239
Продолжение t 2,9 3,0 3,1 3,2 3,3 3,4 3,5 Сотые доли / 0 9963 99730 99807 99863 99903 99933 99953 1 9964 99739 99813 99867 3,6 3,7 3,8 2 9965 99747 99819 99872 999 И 99937 99957 3 9966 99755 99825 99876 3,9 4,0 4,2 4 9967 99763 99831 99880 999904 999937 999973 5 9968 99771 99837 99884 4,4 4,6 4,8 6 9969 99779 99842 99888 9999892 9999957 9999984 7 9970 99786 99847 99892 5,0 5,0 6,0 8 9971 99793 99853 99896 9 9972 99800 99858 99900 99999943 99999996 999999998
ПРИЛОЖЕНИЕ 3 Значение /-критерия Стьюдента / ст. — кратность средней ошибки репрезентативности оценок генерального параметра, необходимая для того, чтобы вероятность превышения ошибкой заданной фаницы составляла 0,1; 0,05; 0,01 при числе степеней свободы d.f. Значение /-критерия Стьюдента при уровне значимости 0,10, 0,05,0,01. Число степеней свободы d.f. 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 Р 0,10 6,3138 2,9200 2,3534 • 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 1,7959 1,7823 1,7709 1,7613 1,7530 1,7459 1,7396 0,05 12,706 4,3027 3,1825 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 2,2010 2,1788 2,1604 2,1448 2,1315 2,1199 2,1098 0,01 63,657 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693 3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 Число степеней свободы d.f 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 оо р 0,10 1,7341 1,7291 1,7247 1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973 1,6839 1,6707 1,6577 1,6449 0,05 2,1009 2,0930 2,0860 2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423 2,0211 2,0003 1,9799 1,9600 0,01 2,8784 2,8609 2,8453 2,8314 2,8188 2,8073 2,7969 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500 2,7045 2,6603 2,6174 2,5758 16-2394 241
ПРИЛОЖЕНИЕ 4 Формулы средних ошибок выборки Вид выборки Модель выборки Средняя ошибка выборки для показателя средней доли Простая случайная М1-и>) N . Серийная П Г Стратифицированная, пропорциональная П N \\*\-w)(x_n_ п N Стратифицированная, равномерная П N N Стратифицированная, оптимальная П ,w,(l-w,)Nf N N \ S^ 242
Продолжение Вид выборки Серийная, стратифицированная, пропорциональная Многоступенчатая Модель выборки П Б Средняя ошибка выборки для показателя средней ё доли ё Сумма ошибок репрезентативности, вычисленных по отдельным ступеням L2 . ^2 #1 +— V п\ 2 пгп2 *П — повторная; **Б — бес повторная. Приведенная в приложении 4 система формул содержит ряд элементов, о способах определения которых необходимо дать специальные пояснения. При простой случайной выборке дисперсия средней вычисляется по сгруппированным данным по формуле 1*4 По несгруппированным данным расчет производится по формуле 16* выборочная средняя; индивидуальные (групповые) значения показателя по отдельным единицам (группам единиц) совокупности; число единиц в отдельных группах. 243
В условиях серийного отбора в качестве единиц отбора выступают серии, соответственно, генеральная совокупность состоит из R серий, а выборочная совокупность - из г серий. При не- стратифицированной серийной выборке дисперсия средней и доли определяется при равновеликих сериях: - дисперсия средней, - дисперсия доли, где jj. - среднее значение признака в /-и серии; W; - показатель доли в /-и серии. В условиях пропорциональной стратифицированной выборки расчет дисперсий для показателей средней и доли производится путем нахождения средних из дисперсий по отдельным стратам: где а? - дисперсия в /-й страте; л, - число единиц в /-й страте; w. - показатель доли в /-й страте. При стратифицированной выборке с равномерным размещением выборки по стратам дисперсия средней и дисперсия доли определяются как простые средние арифметические из дисперсий по отдельным стратам: 244
При серийной стратифицированной пропорциональной выборке показатели дисперсий средней и доли определяются по формулам ч= In ' где rf — число серий, отобранных в /-й страте; 5? - межсерийная дисперсия средней в /*-й страте; xi с-2 — межсерийная дисперсия доли в /-й страте. При многоступенчатой выборке в формуле, приведенной в приложении 4, приняты обозначения: лр /?2, ... — объем выборки на первой, второй и т.д. ступенях отбора; (Хр JlX2, ... — средние ошибки выборки на первой, второй и т.д. ступенях отбора.
КРАТКИЙ СЛОВАРЬ ТЕРМИНОВ Актуализация основы выборки - осуществление мер по устранению устаревшей информации и приведению основы выборки (базы данных) в соответствие с текущим состоянием единиц генеральной совокупности. Анамнестическое выборочное обследование - ретроспективное выборочное обследование, при котором информация собирается путем опроса людей о событиях прошедшего времени по их воспоминаниям. Виды статистического наблюдения по полноте охвата совокупности - по полноте охвата изучаемой совокупности различают сплошное и несплошное статистическое наблюдение. Несплошное наблюдение, в свою очередь, подразделяется на несколько разновидностей, в том числе к нему относится выборочное наблюдение. Выборочная дисперсия - вычисленная по выборочной совокупности дисперсия, являющаяся смещенной оценкой дисперсии по генеральной совокупности, определяется как средняя арифметическая оценка квадрата отклонений наблюдаемых значений признака от их среднего значения. Выборочная разработка материалов сплошного наблюдения — использование выборочного метода на этапе разработки итогов сплошного наблюдения. Применяется в целях: а) ускоренного получения по сокращенной программе предварительных итогов обследования; б) получения дополнительной информации с применением расширенной программы разработки итогов, построения сложных экономико-математических моделей; в) выполнения многовариантных поисковых экспериментальных расчетов. Выборочное наблюдение - вид несплошного статистического наблюдения, основанного на принципе случайного (вероятностного) отбора, проводимого в целях последующего распространения полученных данных на генеральную совокупность. Генеральная совокупность — исчерпывающее множество реально или гипотетически существующих явлений или объектов определенного типа (например, все субъекты хозяйственной деятельности, все население, все домохозяйства в пределах страны или иной изучаемой территории). Термин применяется идя обозначения исходной общей совокупности, на основе которой формируется выборочная совокупность. Государственное статистическое наблюдение — статистическое наблюдение, проводимое в соответствии с утвержденным планом 246
работ Росстата и направленное на получение данных, предназначенных для информационно-аналитического сопровождения функций государственного управления разных уровней и для предоставления иным пользователям. Единица наблюдения — единица совокупности, подлежащая обследованию при проведении статистического наблюдения. Единица отбора — единица наблюдения или группа единиц наблюдения (серия), принятая за основу формирования выборочной совокупности. Единый государственный регистр предприятий и организаций (ЕГРПО) - государственная автоматизированная информационная система, содержащая учетные данные о хозяйствующих субъектах, прошедших государственную регистрацию на территории РФ. Используется как основа выборки при статистических обследованиях предприятий и индивидуальных предпринимателей. Комбинированный метод наблюдения — сочетание сплошного и выборочного наблюдения. Имеет две разновидности: а) чередование во времени сплошного и выборочного наблюдения; б) одновременное проведение сплошного и выборочного наблюдения. Малая выборка - выборка, объем которой меньше той ее величины, при которой распределение вероятностей ошибок репрезентативности соответствует закону нормального распределения Лапласа. Метод основного массива (цензовый метод) - вид несплошного направленного отбора, при котором наблюдению подлежат наиболее крупные единицы совокупности, вносящие основной вклад в формирование итоговых обобщающих показателей. Устанавливается единый критерий отбора единиц (ценз). Микроперепись населения — выборочное обследование населения, проводимое в период между двумя всеобщими переписями населения по более широкой программе, чем всеобщие переписи. В России микропереписи при пятипроцентной доле отбора были проведены в 1985 и 1994 годах. Многоступенчатая (многошаговая) выборка — вид выборки, при котором выборочная совокупность формируется поэтапно путем комбинирования серийной выборки и простой выборки либо комбинирования нескольких серийных выборок с переходом на каждой последующей ступени к более мелким видам серий. Многоцелевая выборка — общая выборка относительно большого объема, предназначенная для проведения ряда обследований единого объекта наблюдения по различной проблематике. Многоцелевая выборочная сеть — выборочная стратифицированная совокупность большого объема, предназначенная к использованию в течение длительного периода для проведения наблюдений 247
по различной тематике. Пригодна для работы как со всей выборочной сетью, так и с отдельными ее частями, выделенными путем стратификации или создания подвыборок. Подлежит периодической актуализации. Направленный отбор - способ извлечения выборки, при котором применяется объективный критерий отбора. Примером направленного отбора может служить цензовый отбор. Несплошное статистическое наблюдение — статистическое наблюдение, при котором обследуется только часть генеральной совокупности. В зависимости от способа формирования этой обследуемой части определяется вид несплошного наблюдения. Основа выборки - полный перечень единиц генеральной совокупности с указанием адресных данных и некоторых признаков. Используется при формировании выборочной совокупности методом случайного или систематического (механического) отбора. При серийном отборе основой выборки является перечень серий (гнезд) в генеральной совокупности. При стратифицированной выборке используется независимая основа выборки по каждой страте. Относительная ошибка репрезентативности — выраженное в процентах отношение ошибки репрезентативности выборочного показателя к среднему значению этого показателя. Ошибка выборки — см. Ошибка репрезентативности. Ошибка выборочной доли - расхождение между показателем доли по выборочной совокупности и величиной того же показателя по генеральной совокупности. Используются четыре вида данного показателя: средняя ошибка доли, предельная ошибка доли, относительная величина средней ошибки доли, относительная величина предельной ошибки доли. Ошибка выборочной средней — расхождение между показателем средней по выборочной совокупности и величиной того же показателя по генеральной совокупности. Используются четыре вида данного показателя: средняя ошибка средней величины, предельная ошибка средней величины, относительная величина средней ошибки средней, относительная величина предельной ошибки средней. Ошибка репрезентативности (представительности) выборочных оценок - различие между выборочной оценкой и тем значением параметра генеральной совокупности, который был бы получен при сплошном наблюдении всех единиц генеральной совокупности. Ошибки наблюдения (регистрации) - погрешности, возникающие вследствие неправильной записи ответов в формулярах наблюдения. Могут носить случайный и систематический (направленный) характер. Встречаются как при сплошном, так и при несплош- 248
ном наблюдении. Но в условиях несплошного наблюдения при относительно малых объемах наблюдаемой совокупности имеется возможность более эффективно осуществлять профилактические меры по предупреждению ошибок наблюдения. Повторный отбор — процедура отбора, при которой каждая отобранная единица возвращается обратно в генеральную совокупность и существует вероятность того, что она может быть вновь отобрана. Предельная ошибка выборки — предельно возможная величина расхождения между значением конкретного показателя по генеральной и выборочной совокупностям. Причины применения выборочного метода — физическая невозможность или экономическая нецелесообразность сплошного наблюдения, экономия ресурсов (финансовых затрат, затрат времени и труда), снижение ошибок регистрации, контроль качества материалов сплошного наблюдения. Пробная перепись населения - несплошное монографическое обследование населения, проводимое в нескольких регионах страны в период подготовки очередной всеобщей переписи населения в целях апробации инструментария и организационно-методических основ предстоящей переписи. Простая выборка — простейший вид выборки, в котором в качестве единицы отбора выступает единица наблюдения и не производится стратификация генеральной совокупности. Расслоенная выборка — см. Стратифицированная выборка. Систематический (механический) отбор — способ формирования выборочной совокупности, при котором отбор единиц из основы выборки производится строго через равные интервалы (постоянный шаг отбора). Шаг отбора вычисляется как отношение объема генеральной совокупности к объему выборочной совокупности. Чтобы при систематическом отборе был реализован принцип случайности отбора, единицы в основе выборки должны располагаться в случайном порядке либо их строго ранжируют по величине существенного признака. Случайная выборка, случайный отбор - выборка, при осуществлении которой каждая единица генеральной совокупности имеет равную с другими единицами возможность быть отобранной. Совокупность — фундаментальное понятие теории статистики, означающее множество исследуемых статистикой объектов или явлений, объединенных общими признаками и представляющих частные случаи проявления общей закономерности, единого процесса или элементы единой системы. Сплошное статистическое наблюдение — наблюдение, при котором обследуются все единицы изучаемой генеральной совокупности. 249
Средняя (стандартная) ошибка выборки - базовая количественная характеристика точности оценивания выборочных показателей, определяет среднюю величину возможного отклонения выборочного показателя от его величины по генеральной совокупности. Статистическая оценка — получаемый при выборочном наблюдении показатель, являющийся приближенной оценкой значения этого показателя по генеральной совокупности. Стратифицированная (расслоенная, типическая, типизированная, районированная) выборка - вид выборки, при котором генеральная совокупность предварительно подразделяется на страты (слои, типы, районы) с тем, чтобы производить независимое формирование выборочной совокупности раздельно по выделенным стратам. Таблицы математической статистики — содержат значения различных функций распределения случайных величин, значения случайных чисел. В расчетах, выполняемых при проектировании выборки или обработке материалов выборочного наблюдения, используются таблица интеграла вероятностей Лапласа, таблица распределения Стьюдента, таблица случайных чисел. Факторы, влияющие на величину ошибки репрезентативности (выборки), — объем выборочной совокупности, доля выборочной совокупности в объеме генеральной совокупности, степень однородности единиц генеральной совокупности, способ формирования выборочной совокупности (вид выборки). Ценз - фиксированные значения одного или нескольких признаков единиц наблюдения, служащие основанием для отнесения единиц к исследуемой совокупности. Цензурированная выборка — выборка, состав которой откорректирован путем изъятия единиц отбора с экстремальными значениями существенных признаков.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Беляев Ю.К. Вероятностные методы выборочного контроля / Ю.К. Беляев. - М.: Наука, 1975. 2. Выборочные наблюдения в статистике СССР. - М.: Статистика, 1968. 3. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике / В.Е. Гмурман. — М.: Высшая школа, 1998. 4. Гнеденко Б.В. Курс теории вероятностей / Б. В. Гнеденко. — М.: Наука, 1988. 5. Гурьев АЛ. Происхождение выборочного исследования и первые его опыты в России // Вестник статистики. - 1921. - № 1-4. 6. Дружинин Н.К. Выборочное наблюдение и эксперимент / Н.К.Дружинин.- М., 1977. 7. Дружинин Н.К. Выборочный метод и его применение в социально-экономических исследованиях/ Н.К. Дружинин. - М.: Статистика, 1970. 8. Елисеева И.И., Юзбашев М.М. Общая теория статистики: учебник / под ред. И.И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2008. 9. Йейтс Ф. Выборочный метод в переписях и обследованиях / Ф. Йейтс; пер. с англ. Е.И. Арона; под ред. А.Г. Волкова. - М.: Статистика, 1965. 10. Кауфман АЛ. К вопросу о выборочном исследовании / А.А. Кауфман. - СПб., 1911. 11. Кирьянов В.Б. Выборочная модель. Лекции по теории вероятностей и математической статистике / В.Б. Кирьянов. - СПб.: Изд-во СПбГУЭФ, 2001. 12. Ковалевский А.Г. Основы теории выборочного метода / А.Г. Ковалевский // Уч. зап. Саратовского ун-та. — Саратов, 1924. 13. Кокрен У. Методы выборочного исследования / У. Кокрен; пер. с англ. - М.: Статистика, 1976. 14. Крамер Г. Математические методы статистики / Г. Крамер; пер. с англ. - М.: Мир, 1975. 15. Крамер Г. Математические методы статистики / Г. Крамер; пер. с англ; под ред. А.Н. Колмогорова. — М.: Иностранная литература, 1948. 16. Кремлев И.Д. Вопросы учета деятельности малого предпринимательства / И.Д. Кремлев // Вопросы статистики. - 2004. - №6. 251
17. Методологические положения по статистике. — Вып. 3. — М.: Госкомстат России, 2000. 18. Мозер К. Методы социального исследования / К. Мозер. - Вып. 1. - М., 1969. 19. Организация государственной статистики в Российской Федерации. — М.: Госкомстат России, 2004. 20. Соколов А. К. Методика выборочной обработки первичных материалов профессиональной переписи 1918 г. / А.К. Соколов// История СССР. - 1971. - № 4. 21. Степанов СВ. Нейронная интерпретация выборки для структурного статистического моделирования совокупности предприятий / СВ. Степанов // Вопросы статистики. - 2004. - № 6. 22. Уилкс С. Математическая статистика / С. Уилкс. — Пер. с англ. — М.: Наука, 1967. 23. Федеральная целевая программа «Развитие государственной статистики на 2007—2001 годы» http:// www.rdstat.aaanet.ru/fcp/fcp.htm 24. Феллер В. Введение в теорию вероятностей и ее приложения / В. Феллер. - М.: Мир, 1984. 25. Чернышева Т.М. Создание территориальной выборочной сети многоцелевого назначения на основе материалов всероссийской переписи населения 2002 г. / Т.М. Чернышева, Г.Е. Шевердова // Вопросы статистики. - 2006. - № 12. 26. Четвериков Н. О выборочном исследовании / Н. Четвериков // Вестник статистики. — 1919. — № 8—12. 27. Чупров А.А. Очерки по теории статистики / А.А. Чупров. — М.: Статиздат, 1959. 28. Шварц Г. Выборочный метод / Г. Шварц. — М., 1978. 29. Юзбашев М.М. Расчет объема выборки для надежного установления связи /М.М. Юзбашев // Вопросы статистики. — 2004. — №6. 30. Янсон Ю. Теория статистики / Ю. Янсон. - СПб., 1913.
ОГЛАВЛЕНИЕ Предисловие 3 РАЗДЕЛ I. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ И ОРГАНИЗАЦИОННЫЕ ОСНОВЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ 5 Глава 1. Выборочный метод в социально-экономической статистике 5 1.1. Несплошные наблюдения в современной статистике 6 1.2. Виды несплошных наблюдений 16 1.3. Выбор вида выборки 28 1.4. Применение выборочного метода на разных этапах статистического исследования 42 1.5. Исторические корни выборочного метода в России 45 Контрольные вопросы 54 Глава 2. Организация выборочных обследований 54 2.1. Основные процедуры при организации выборочных обследований 55 2.2. Проектирование выборочного обследования 56 2.3. Основа выборки '. 68 2.4. Способы формирования выборочной совокупности 82 2.5. Проведение выборочного обследования и разработка итогов 93 Контрольные вопросы 99 РАЗДЕЛ И. МАТЕМАТИЧЕСКИЙ АППАРАТ И ПРИЕМЫ, ИСПОЛЬЗУЕМЫЕ В ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЯХ 101 Глава 3. Математические основы выборочного метода 101 3.1. Основные понятия и термины 101 3.2. Средняя ошибка репрезентативности при случайной выборке. Ее сущность и способы вычисления 103 253
3.3. Вероятностные оценки ошибки репрезентативности и доверительные границы оценок 113 3.4. Сочетание выборочного метода с группировкой — стратифицированная выборка и ее ошибка репрезентативности 117 3.5. Определение объема выборки, необходимого для обеспечения заданной точности и надежности выборочных оценок 118 3.6. Средняя ошибка репрезентативности показателей вариации 123 3.7. Серийная и многофазная выборки 126 3.8. Факторы и правила, определяющие величину ошибки репрезентативности 128 3.9. Малая выборка 131 3.10. Средняя ошибка репрезентативности признака-произведения 132 3.11. Выборка во времени 133 Контрольные вопросы 136 Глава 4. Расчетные процедуры при выборочных обследованиях 137 4.1. Предварительные расчеты при планировании выборочного обследования 138 4.2. Определение необходимого объема выборочной совокупности 141 4.3. Проведение отбора единиц и организация обследования 146 4.4. Характеристики точности выборочных данных и оценка параметров генеральной совокупности .. 148 Контрольные вопросы 155 РАЗДЕЛ III. ПРАКТИКА ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЙ 157 Глава 5. Выборочные обследования в сфере экономики 157 5.1. Выборочные обследования малых предприятий .... 157 5.2. Выборочные обследования индивидуальных предпринимателей 168 5.3. Специальные тематические обследования 176 5.4. Выборочные наблюдения в статистике аграрного сектора экономики 182 Контрольные вопросы 188 254
Глава 6. Выборочный метод в статистике населения и рынка труда 189 6.1. Значение выборочного метода в статистике населения 190 6.2. Выборочный метод в переписях населения 192 6.3. Выборочный метод в демографических исследованиях 195 6.4. Выборочное обследование населения по проблемам занятости 196 Контрольные вопросы 203 Глава 7. Выборочный метод в социальной статистике 204 7.1. Обследование бюджетов домашних хозяйств 204 7.2. Выборочный метод в статистике цен на потребительском рынке 208 7.3. Выборочные обследования заработной платы 211 7.4. Локальные выборочные обследования 213 Контрольные вопросы 217 Глава 8. Выборочный метод в некоторых областях нестатистической деятельности 218 8.1. Выборочный метод в аудиторской практике 218 8.2. Выборочный метод как инструмент менеджмента качества 222 8.3. Несплошные налоговые проверки 228 8.4. Выборочный метод в маркетинговых исследованиях 231 8.5. Особенности применения выборочного метода в социологии 232 Контрольные вопросы 235 Приложения 236 Краткий словарь терминов 246 Библиографический список 251
Учебное издание Васильева Эвелина Карловна Юзбашев Михаил Михайлович ВЫБОРОЧНЫЙ МЕТОД В СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙ СТАТИСТИКЕ Заведующая редакцией Л.А. Табакова Редактор Е.А. Рыжова Младший редактор Н.А. Федорова Художественный редактор Ю.И. Артюхов Технический редактор В.Ю. Фотиева Корректоры Н.Б. В тору шина, Т.М. Васильева Компьютерная верстка О.В. Фортунатовой Оформление художника В.П. Григорьева ИБ № 5227 Подписано в печать 20.04.2009. Формат 60x90/16. Гарнитура «Тайме». Печать офсетная. Усл. печ. л. 16,0. Уч.-изд. л. 14,62. Тираж 1500 экз. Заказ № 2394. «С»032 Издательство «Финансы и статистика» 101000, Москва, ул. Покровка, 7 Телефоны: (495) 625-35-02, 625-47-08 Факс (495) 625-09-57 E-mail: mail@finstat.ru http://www.finstat.ru Издательский Дом «ИНФРА-М» 127282, Москва, ул. Полярная, д. 31 в Тел.: (495) 380-05-40, 380-05-43. Факс (495) 363-92-12 E-mail: books@infra-m.ru http://www.infra-m.ru Отпечатано с готовых диапозитивов в ОАО ордена «Знак Почета» «Смоленская областная типография им. В. И. Смирнова». 214000, г. Смоленск, проспект им. Ю. Гагарина, 2.