Текст
                    Теория на извадковите изследвания
(РЕЧНИК НА ОСНОВНИ ТЕРМИНИ И ПОНЯТИЯ)
Речникът на основните термини и понятия е изготвен от д-р Богдан Богданов
с любезното съдействие на г-н Стефан Цонев

Автокорелационни
съвкупности
Autocorrelated
populations
2. Агрегиране
/съвкупност/
Aggregation
3. Административен
източник
Administered source
4. Актуализиране на
данни
1.

5.

Data update
Асиметрия

Наличие на времева компонента на зависимост, т.е всеки
елемент от статистическия ред да е корелиран с предходен.
Ако елементите са последователни, стъпката, наречена, "лаг"
е 1. Ако са през един, лагът е 2 и т.н.
Статистически единици групирани по определен признак
(признаци).
Законово и нормативно определен източник на информация,
който се използва за целите на статистическите изследвания.
Окончателни оценки от статистически изследвания към
определен момент. Актуализацията предполага предходен
вариант на данните. Първите данни, не могат да бъдат
класифицирани като "актуализирани". Напр.
Подобряване и допълване на съществуващите оценки за
дадено явление към определен момент.
Разпределение на статистически единици по определен
признак, което се различава от нормалното. Формулата за
измерване на асиметрията е следната:
m
 1 = 33 , където

 (x − x )
f

3

m3 =



f

- трети централен момент

(сума на

разликата между значенията на признака на отделните
единици от тяхната средна на трета степен умножена по
техният брой и разделена на общият брой единици);
 3 - стандартното отклонение на трета степен.
Теоретическата форма на нормалното разпределение е
камбана, разделена по средата от вертикална линия на две
симетрични части. Върху тази линия се намират средната,
(математическото очакване), медианата (средния член на
сортирания статистически ред) и модата (най-често срещаната
стойност от реда). При асиметричното разпределение имаме
разминаване между средна, медиана и мода.


Skeweness Асиметрична съвкупност Skewed population 7. Анализ на данни 6. Data analysis 8. Аналитична единица Analytical unit 9. Аналитична рамка 10. Analytical framework Аналитични изследвания Analytical surveys 11. База за записване Recording basis 12. Базисен период Base period 13 Безвъзвратен подбор Irretrievable selection 14. Без отговор Non-response 15. Бенчмаркинг Benchmarking 16. Биноминално вероятностно разпределение Binominal probability distribution 17. Биноминално разпределение Binominal distribution 18. Вариационен коефициент Coefficient of variation Съвкупност от единици, които са измесени вляво или дясно от центъра на тяхното разпределение (ляво или дясно изтеглена крива). Описание на дадено явление или процес по оценки от проведено статистическо изследване. Завършва с конкретни изводи, заключения и хипотези. Обекти на статистически наблюдения. Предварително дефинирани ограничителни условия за разработване на анализ на данни от статистически наблюдения. Статистически изследвания на общественозначими явления и процеси. Аналитичното изследване предполага модел на връзки и зависимости. Осъществява се чрез приложение на статистически инструментариум. Технически създадена специална система за отразяване на информацията от проведени статистически изследвания. Период определен за начален, с който се сравнява последващото развитие на изучаваното явление. Подбор, при който веднъж избраните единици, не участват в следващи извадки. Единица/и на статистическо изследване от която (които) не са получени желаните данни по една или друга причина. Белязана единица на статистическо наблюдение по определено значение на даден признак. В много случаи се използва, като определен “стандарт”. Разпределение, при което единиците от статистическия ред са независими една от друга и могат да имат само две стойности с еднаква вероятност. Статистическо разпределение, където единиците на наблюдение се разпределят по определен признак с две значения, в зависимост от честота на изпитанията. Характеристика на статистически ред, равна на частното от дисперсията разделена на средната, умножено по 100, ако е в %. Среща се като елемент от формула за определяне обема на извадка при зададена максимална грешка в %.
19. Верижен индекс Ред от съотношения между оценките от дадено статистическо изследване. Всяка оценка е последователно знаменател в Chain index съотношението с предходната. 20. Вероятност, която е Вероятност, пропорционална на стойността на отделната пропорционална на единица. Например извадка, при която големите предприятия оцененият размер попадат в извадката с вероятност пропорционална на големината им, а не на броя им, който в съвкупността е относително малък. Пример с реални данни: 2 извадки с макс. грешка 5% и равнище на значимост 95% 1.Извадка, с вероятност пропорционална на броя (размера на групата) Групи по Брой Брой в % на брой заети предприятия извадката извадката от в общия брой съвкупностт в а съкупността 1 - 15 16 - 351 352 - 8217 8218 - 13857 Общо 314599 23657 618 3 338877 10089 759 20 1 10869 3.21 3.21 3.24 33.33 3.21 2. Извадка, с вероятност пропорционална на размера на единиците Групи по Брой Брой в % на брой заети предприятия извадката извадката от в общия брой съвкупностт в а съкупността 1 - 15 16 - 351 352 - 8217 8218 - 13857 Общо 314599 23657 618 3 338877 447 596 283 3 1329 0.14 2.52 45.79 100.00 0.39 В пример 1 извадките са пропорционални на броя в групата от генералната съвкупност - около 3.21%, като наймногобройната група от най-малки предприятия има и найголяма извадка. (В последната група има 33%, защото няма как да вземем 3.2% от тези предприятия). В пример 2 първа група с най-малки предприятия е представена с едва 0.14% извадка, следващата, с 13 пъти по малко предприятия има 17 пъти по голям дял извадка (2.52%) и така до групата на най-големите, която е с 100% извадка. Probability proportional При втория пример, необходимия размер на извадката е само to estimate size 1329 предприятия. 21. Вероятностно Вероятността, с която се осъществява подбора на единиците за извлечение, наблюдение, когато имат различни значения на признака. пропорционално на Например даден преброителен участък съдържа 120 размера домакинства, които са разпределени по брой на членовете, както следва: 10 – едночленни; 20 – двучленни; 30 –
тричленни; 50 – четиричленни; 10 – петчленни. Трябва да бъдат избрани 6 домакинства за наблюдение. Стартовото число е 5, подборната стъпка 20 (120 : 6 = 20). Следователно първото домакинство е едночленно, тъй като № 5 е в групата на едночленните домакинства. Следващото е № 25 (5 + 20 = 25), попада в групата на двучленните; № 45 – тричленно; № 65 – четиричленно; № 85 и № 105 – също са четиричленни Probability proportional домакинства. По този начин пропорционално на размерът им to size са избрани домакинствата за наблюдение. 22. Вероятност Число, характеризиращо степента на възможност за поява на Probability случайно събитие. 23. Вероятностно разпределение Probability distribution 24. Взаимопроникващи подизвадки Interpenetrating subsamples 25. Време на прекъсване на поредицата Time series break 26. Времеви обхват 27. Time coverage Въпросник 28. Questionnaire Възвратен подбор 29. Reflexive selection Вътрешногнездова корелация 30. Intracluster correlation Географско разслоение 31. Geographical stratification Гнездова извадка Cluster sampling Разпределение, при което значенията на променливите се появяват с определена вероятност. Поредица от случайни извадки от единици (обекти на статистическо наблюдение), които се формират независимо една от друга и са в състава на една обща извадка. Определен момент, в който е направена промяна в методологията на статистическото изследване и оценките стават методологически несравними. Времевите отграничения, които се вземат предвид, когато се осъществява дадено статистическо наблюдение и се разработват оценките от него. Документ (анкетна карта, дневник, формуляр и т. н.), които се използва при статистически наблюдения за получаването на точно определена информация. Единиците на наблюдение имат повече от един шанс за попадане в извадката за наблюдение. Коефициента на вътрешногнездова корелация измерва корелацията между единиците по даден признак в определен район. Когато е налице пълна вътрешногнездова корелация, точността на извадката се влошава. Степента на вътрешногнездова корелация зависи от типа на гнездата (населени места, домакинства, предприятия и други) и от характера на признака, по който се осъществява изследването. Степента на корелация е сравнително по-голяма при такъв тип гнезда, съдържащи по-малък брой елементарни единици. Организационно удобства, създадени, за да се получат определени данни за обекти на статистическо изследване, при което слоевете са компактни територии, като например градските райони. Разслоението се прави с цел увеличаване на точността на оценките, доколкото са налице много фактори, по силата на които лицата от един район притежават сходство в своите основни характеристики. Многостепенна извадка от единици за наблюдение. Например при наблюдение на домакинствата по определени признаци извадката може да се формира на две степни. На първа степен се избират преброителни участъци (гнезда), а на втора – домакинствата от вече избраните гнезда.
32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. Горна граница доверителност на Достигнатото най-висока стойност на интервала, в който се съдържа изчислената оценка на параметър. Това е резултат от проведено представително извадково статистическо изследване. Изчислява се като сума от оценката плюс Upper confidence limit максималната грешка при определено равнище на значимост. Грешен отговор Невярно информация, получена на въпрос от проведено Response error статистическо изследване. Грешка В смисъл грешка, получена при провеждане на статистическо Error изследване (изчерпателно или извадково). Грешка на анкетьора Грешка получена, като резултат от непознаване инструментариума на провежданото статистическо Interviewer error изследване. Грешка в извадката Грешки, придружаващи оценките от провежданите (извадкови грешки) представителни извадкови изследвания. Дължи се на извадковия характер на изследването, където се наблюдава представителна част от генералната съвкупност. Ако извършим множество извадки от същата съвкупност, грешката Sampling error на средната от оценките ще клони към нула. Грешка на оценката Виж “Грешка в извадката”. Error of estimation Грешка при измерване Measurement error Грешка при кодрането Coding error Грешки в изследването Errors in surveys Данни Data Двустепенна извадка Two-stage sampling Двуфазна извадка Two-phase sampling или Двоен подбор Double sampling Дизайн на въпросника Неправилно отразяване и регистрацията на информацията при изследването. Грешно класифициране на получената информация. Отнасяне на получените данни към кодове, не съответстващи на тяхното съдържание. Следствие на инструментариум, които не съответства на наблюдавания процес или явление. Информация, получена в резултат от проведено статистическо изследване. Извадка, при която на първа степен се избират изходни единици, а на втора степен се избират елементи от тях. Изследване, при което, за да се оцени теглото на определен слой (променлива) се планира извадка с по-голям обем, отколкото се предвидено в началната фаза. Оформление на въпросника за респондентите на статистически изследване: начин на задаване на въпросите; вид на събираната информация; подреждане на рубриките; бележки към въпросите; кратки инструкции; насочващи Questionnaire design указания и т. н. Динамични редове Характеризират развитието на определен показател във времето. Компонентите на всеки динамичен ред са: тренд; Time series сезонна компонента; остатъчен (случаен елемент). Дискретно, Прекъснато честотно разпределение, при което честотите са равномерно еднакви за всички значения на признака. То има за графичен разпределение образ права линия, успоредна на абцисната ос. Рядко се среща при емпиричните изследвания, но е добър еталон при статистическия анализ. Като такъв се използва например при Discrete uniform изучаване на диференциацията на доходите, когато се distribution построява кривата на Лоренц.
47. Дисперсия Стандартното отклонение на квадрат, което се изчислява от отклоненията на осредняваните величини от средната аритметична, разделена на броят на наблюдаваните единици: (  x−x  = N 2 48. 49. 51. 52. 53. 54. 55. 56. 57. 2 Variance Доверителен интервал Интервалът, в който се намира истинският параметър на генералната съвкупност x 0 . Крайните стойности на интервала са неговите граници. Пример: границите, в които се намира стойността на истинския параметър се намират по формулата: x − 2.58 x  x0  x + 2.58 x , Confidence interval Доверителен коефициент Confidence coefficient 50. ) Където: x 0 е истинският параметър; x е оценката за параметъра по данни от извадка; 2.58 е гаранционен множител (намира се в таблица);  x е стандартна грешка на оценката. Гаранционен множител, чрез който се изразява доверителната вероятност. Табулиран, неговите стойности са в таблицата за нормално разпределение. Най-често се използват стойностите: z = 1, в интервала x  1 x , което означава, че се обхваща 68.27% от площта под нормалната крива; : z = 1.96, в интервала x  1.96 x , което означава, че се обхваща 95%; z = 2.58, в интервала x  2.58 x , което означава, че се обхваща 99% от площта и т. н. за Инструментариум за провеждане на дадено статистическо изследване. of Документация методологията Documentation methodology Долна граница на Виж „Доверителен интервал”. доверителност Lower confidence limit Достоверност Понятие за качеството на статистическите данни. Най-често се свързва наличието или отсъствието на нестохастични грешки Accuracy на оценките. Достъпност Понятие за възможността да бъде осъществено наблюдението Accessibility на респондентите, попаднали във формираната извадка. Дублирана извадка Виж взаимопроникващи извадки. Replicated sampling Единица В смисъл на статистическа единица – обект на наблюдение. Unit Единично наблюдение Наблюдение на статистическа единица, група от единици или Single observation извадка, формирана с определени цели. Ексцес Отклонение от нормалото статистическо разпределение по отношение на върховата изтегленост на кривата. Ексцесът може да бъде положителен или отрицателен. Изчислява се формулата: m  2 = 44 , където  (x − x ) f 4 m4 =  f - четвърти централен момент (сума на разликата между значенията на признака на отделните
58. Kurtosis Елемент Element 59. Елемент от данните 60. Data element Загуба 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. единици от тяхната средна на четвърта степен умножена по техният брой и разделена на общият брой единици);  4 - стандартното отклонение на четвърта степен. Част, група от единици, разглеждани като елементи на наблюдавана съвкупност. Информацията за определени значения на признаците, по които се наблюдават единиците в съвкупността. Например: среден доход само на тричленни домакинства. В смисъл на загуба на статистическа информация в резултат на нарушени процедури, необходими за осъществяването на едно статистическо изследване. на В смисъл на защита анонимността на респондентите, участващи в статистическите изследвания. Loss Защита статистическите данни Statictical Data Protection Извадка без заместване Sampling without replacement Извадка от населението Sampled population Извадка със заместване Sampling with replacement Извадково изследване Извадка, в която отпадналите от наблюдение единици не се заместват с други. В смисъл на представителна извадка, възпроизвеждаща характеристиките на генералната съвкупност с предварително планирана точност на оценките за тях. Извадка, при която избраните случайно единици за наблюдение нямат втори шанс за попадане в извадката. Изследване осъществявано чрез изучаване на част (извадка) от генералната съвкупност, която може да бъде от физически лица, домакинства, семейства или различни обекти (предприятия, ведомства, жилища, стопанства и т. н.). Извадковото изследване може да бъде представително т. е. да възпроизвежда характеристиките на генералната съвкупност. Извадковото изследване може да бъде и непредставително, Sample survey като данните от него се използват за специфични потребности. Изменение В смисъл изменение на процедурите при осъществяването на едно статистическо изследване. Най-често промените се правят с цел да се актуализира начина на изследване на дадено явление и процес, които се развиват и еволюират в определена Change степен и аспект. Измерение Визира признаците, по които се наблюдават единиците от Dimension извадката. Изследвана единица Статистическият обект на наблюдение. Виж “Извадково Observation unit изследване”. Изследване Получаване на данни от специално осъществено изследване за удовлетвореността на мнението и оценките на потребителите за качеството, потребителите надежността и бързината, с която се удовлетворяват техните User satisfaction survey потребности от статистическа информация. Източник В смисъл източник на статистически данни, който може да бъде резултат от проведено статистическо изследване, Source административни регистри, документи и т. н. Изучавана област Конкретно дефинирано явление и процес – обект на Domain of study статистическо изследване.
72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. Изходни единица (извадкова) В смисъл на единица, съдържаща подединици. Например изходните единици на статистически подбор могат да бъдат преброителни участъци (гнезда), съдържащи определен брой Рrimary (sampling) unit домакинства. Интеграция на данни Обединяване (агрегиране) на данни. Например данните за общите доходи на членовете от домакинствата се формират от различни източници (работна заплата, пенсии, социални Data integration помощи и т. н.). Интерполация Попълване на липсващи данни в статистически ред (в участъка между началото и края на статистическия ред – вариационен и динамичен), чрез който се изследва дадено явление или процес. В много случаи се използва и техниката на екстраполация, където се осъществява продължение на данните за статистическия ред. И двете процедури се осъществяват въз основа на използването на статистически методи и предполагат задълбочени познания за същността и Interpolation природата на изследваните явления и процеси. Информация В смисъл на статистическа информация, получена чрез Information статистическо изследване. Kачествени признаци Значенията на тези признаци се дефинират словесно. Например: пол; семейно положение; професия; образование и Attributes т. н. Квота Дефинирана по определени признаци група от обекти. Quota Квотна извадка Извадка, формирана от статистически единици по точно определени признаци. Само по тези признаци извадката се Quota sampling счита за представителна. Качество В смисъл качество на статистическите данни, което зависи от стриктното спазване на цялостната технология при Quality осъществяването на едно статистическо изследване. Класификация Класификацията е изчерпателен набор от отделни (дискретни) и взаимно изключващи се категории, които могат да бъдат свързани с една или повече изучавани/измервани променливи, регистрирани в статистическо изследване или в административен регистър при събиране и/или представяне на данни. Например: икономически дейности; професии; Classification продукти; болести; занятия и т.н. Кодиране Действие или процес на отнасяне на единиците на изучаваната съвкупност към подходящата класификационна групировка и присвояване на съответен код на единицата. Отнасянето и кодирането към определена позиция на класификацията се извършва на основата на определяне дали класифицираният Coding обект притежава или не даден признак/характеристики. Ковариация на Средна аритметична от произведението на разликите между извадковите средни извадковите средни и средните на генералната съвкупност. Има следният аналитичен вид: N −n 1 E y −Y x − X =  yi − Y xi − X , където: nN N − 1 y i и xi са двойка променливи, определени за всяка единица на съвкупността; Covariance of sample y и x - съответстващи средни за проста случайна извадка с обем n. means ( )( ) ( )( )
83. 84. 85. 86. 87. 88. 89. 90. Количествени данни Qualitative data Комбинирана оценка на отношение Combined ratio estimate Контрол на качеството на изследването Данни, изразени в мерни единици. Отношение между две оценки по данни от извадка. Дава се отговор на поредица от въпроси за точността и достоверността на събраните данни. Допълнително се осъществяват изследвания, доказващи точността и обхвата на данните от изследването. Например такива контролни изследвания за точност и обхват на данните се извършват Qualitative control непосредствено след преброяванията на населението и survey жилищния фонд. Контролирани Наблюдаване на част от единиците в извадката по признаци, експерименти които са важни. Оценките за тях се сравняват с оценки от друго изследване (контролна група), за да се даде отговор на Controlled experiments въпроса за статистическата значимост на отклоненията. Контролиран подбор Метод чрез който се увеличава вероятността предпочитани комбинации от единици да попаднат в извадката (и се намалява вероятността за не предпочитаните). Така може да се постигне по-малко разсейване в определени групи в сравнение Controlled selection със стратифицирания случаен подбор Конфиденциална Информация, при която се запазва анонимността на информация респондентите. Confidential data Концепционна схема Кратко и конкретно съдържание и описание на етапите и целите, определящи начина и подхода за реализирането на Concept scheme общественозначими идеи Корекция за Корекция на стандартната грешка, която се изразява с непрекъснатост множителя: 1 Correction continuity 91. 92. 93. for n , където n - обем на извадката Корекция за крайност Корекция на стандартната грешка, която се изразява с на генералната множителя: съвкупност n 1 − , където N n - отношение между обем на извадката и обема на N Finite population генералната съвкупност. correction Корелограма Графика, представяща коефициенти на корелация между двойки наблюдения. Например: графика изразяваща Correlogram зависимостта между различни източници на доходи. Корелационен Корелационният коефициент е число между -1 и 1, което коефициент измерва степента в която две променливи са линейно свързани. Ако зависимостта е идеално линейна, и двете променливи се изменят едновременно и е еднопосочно, коефициента е 1. В обратния случай, ако едната нараства, а другата намалява коефициента е -1. Различава се от функционалната зависимост, при която на всяко значение на независимата променлива съответства
94. Correlation coefficient Крайна корекция 95. End correction Критична стойност 96. Critical value Латински квадрати точно определено значение на зависимата променлива. Често пъти в статистическата литературата корелационната зависимост се нарича “смутена функционална зависимост”. Метод за претегляне на първият и последният член на систематично формирана извадка от съвкупност с наличието на линеен тренд. При използване на този способ на претегляне извадковата средна е равна на истинската средна за съвкупността. Теоретична стойност, която се намира в специално разработени таблици. Определя се при определени степени на свобода и зададено равнище на значимост. Използва се при проверка на хипотези относно разликата между средни величини и относителни дялове. Използва се когато единиците могат да бъдат представени в пространство, разграфено с мрежа от квадрати. Подходящ при изучаването на рядко срещани признаци. Прави се извадка и ако се попадне на рядко срещан признак, допълнително се изучават съседните квадрати. Пример е изучаването на видовото разнообразие в биологията. 97. 98. 99. Използват се при формиране на случайна извадка, с което Latin squares значително се подобрява точността на оценките. Липсващи данни, Обикновено е свързано с отсъствието на информация при информация провеждане на дадено статистическо изследване. Основните причините са нежеланието на респондентите да отговорят на определени въпроси или пропуски в инструментариума на Missing data изследването. Медиана Значение на признака на единицата в средата на статистическия ред, подреден низходящо или възходящо (по Median значенията на признака). Максимална грешка Произведението на гаранционният множител и стандартната грешка: Max. error 100. Методология 101. Methodology Метаданни Metadata set Δ = z x В смисъл на разработен инструментариум за осъществяване на статистическо изследване. Включва подхода и стратегията за провеждане на изследването: понятиен апарат; класификации и номенклатури; дизайн на извадката; програма и срокове за провеждане на всеки етап от изследването; техническо задание и програмно осигуряване. Възможно най-краткото определение е: “данни за статистически данни”. Статистическите метаданни представляват данни и друга документация, която описва обектите по формализиран начин. Те осигуряват информация за данните, както и за тяхното производство и използване. Статистическите метаданни описват процесите и инструментите свързани с производство и използване на статистически данни. Статистическите метаданни могат да бъдат класифицирани по различни начини, но има много важно различие между метаданни, необходими за търсене и показване на данни (структурни метаданни) и метаданни, които дават повече информация за дефинициите, методологиите, процесите и качеството (справочни метаданни).
102. Наблюдение 104. Observation Набор от данни Data set Навременност 105. Timeliness Неизвадкова грешка 106. Non-sampling error Неизместена оценка 103. 107. Unbiased estimate Нейманово разместване Работата на терена, включваща основно посещение на респондентите, интервюта и регистрация на данните, съответстващи на предварително подготвеният инструментариум за статистическото изследване. В смисъл на файлове с данни, резултат от проведено статистическо изследване. Резултати от проведено статистическо изследване, представени в предварително определени срокове и в съответствие с актуалността на наблюдаваните явления и процеси. Грешка, дължаща се на неслучайни фактори. Например: пропуски в инструментариума на изследването; нежелание на респондентите да представят исканата информация; некомпетентност на анкетьорските екипи при работата на терена. Оценка, получена без намесата на субективни фактори в пълно съответствие с условията за рандомизация при формиране на извадката. Обема на извадката при зададена точност се изчислява от предварителни данни за разсейването на изучавания признак. Ако това не възможно, се използват данни за друг, корелиран с изучавания признак. Голямото разсейване води до голяма извадка. Един от методите за намаляване обема на извадката при запазване на точността, е групиране (стратифициране) на единиците от съвкупността, така разсейването в отделните групи да е помалко от това на генералната съвкупност. Така сумата на извадките за отделните групи е по малка от обема на извадката при не стратифицирана съвкупност. Обема на извадките за отделните страти може да се определи: 1. пропорционално на броя на единиците в групата (пропорционален подбор) и 2. пропорционално на разсейването в групата (оптимален подбор). Neyman allocation 108. Оптималният подбор води до значително по-малка извадка в сравнение с пропорционалния. Носи името на Нейман (1934), но по-късно е открита публикация на Чупров (1925). Необходим размер на Извадка, съдържаща определен брой единици за наблюдение, извадката които осигуряват желаната точност на оценките за найважните показатели. Изследователите предварително определят обема на извадката в съответствие постигането на точност на оценките за определени показатели, които от своя страна имат фундаментално значение за анализа на резултатите от изследваното явление или процес. Формулата за определяне на размера на извадката при безвъзвратен подбор е следната: z 2 02 N n= 2 , където  X N + z 2 02 Size of sample needed z – гаранционен множител;  x - максимална грешка;  0 стандартно отклонение в генералната съвкупност; N – обем на генералната съвкупност.
109. 110. Неполучаване отговор No response Нормално разпределение на В смисъл на отсъствие на информация от респондентите при провеждане на статистическото изследване. Открито и описано от Карл Фридрих Гаус (1777 – 1855 г.) и Пиер Симон Лаплас (1749 – 1827 г.). Кривата, описваща нормалното разпределение е идеално симетрична с релеф на камбана. Практическият смисъл на това разпределение е свързан с централната пределна теорема и други теореми. От тях следва, че каквото и да е разпределението в дадена генерална съвкупност, при достатъчно голям брой извадки тяхното разпределение задоволително ще се апроксимира с нормалното разпределение. Средната на извадките ще имат нормално разпределение с обща средна аритметична, равна на средната аритметична на генералната съвкупност и дисперсия  02 т. е. n пъти по-малка от дисперсията на генералната n съвкупност (стандартното отклонение съответно е 0 ). Тази n ситуация създава големи възможности за анализ и особено за оценяване параметрите на генералните съвкупности по характеристиките на извадките. 111. Normal distribution Обект Object 112. Област на извадката 113 114. 115. 116. За пръв път закономерността за приближението на разпределението на извадковите средни към нормалното разпределение с увеличаване обема на извадките е обобщено в теоремата на Ляпунов (1857 – 1918 г.) и се нарича централна пределна теорема. В смисъл на обект - единица на статистическо наблюдение. Определя се от генералната съвкупност, от която се излъчва извадката за наблюдение. Например това може да бъде населението на страната, домакинствата, семействата, Area sampling предприятията и други. Област н изучаване Оценки за точно дефинирани групи на които е подразделена съвкупността за изследване. Например доходи на домакинствата с 0, 1, 2, 3 и повече деца до 14 годишна Domain of study възраст. Обобщени данни Данните могат да се сумират по точно определени признаци, което предполага еднаквост на мерните единици. Например общият доход на домакинствата е формиран от точно определени източници (работна заплата, пенсии, социални обезщетения, помощи, стипендии и други). При извадковите изследвания агрегираните данни се отличават с по-висока Aggregated data точност на оценките. Обработка на Изчислителни процедури, при които се определя размера на грешката стандартната (стохастичната) грешка на оценките от дадено извадково изследване. Подобни процедури се осъществяват и при изчерпателните изследвания, където се определят Processing error грешките на регистрация. Обработка на данните Дейност, при която се използват специално подготвени програми, чрез който се получават обобщаващи резултати (таблици, средни величини, относителни дялове, коефициенти за оценка на връзки и зависимости и други) от проведено
статистическо изследване. Data processing 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. Обхват В смисъл на предварително дефинирана методика, визираща: единиците за наблюдение; признаците, за които ще се събира информация; времето и пространството, в което се осъществява изследването. на Виж ”Необходим размер на извадката” Coverage Ограничения допустима грешка Limits of error tolerable Ограничение В смисъл на предварително дефинирани ограничителни условия (рамка), при които се осъществява дадено Constraint статистическо изследване. Описателни мерки Вербално описани етапите за осъществяване на Descriptive measures статистическото изследване. Описателно Извадковите изследвания условно може да се разделят на два проучване вида: описателни и аналитични. Целта на описателните изследвания се състои да се получат сведения за някакви големи групи: например, за броят на мъжете, жените и децата, гледащи една или друга телевизионна програма. При аналитичните изследвания се сравняват различни подгрупи съвкупности, за да се установи, съществува ли между тях някакво различие, което позволява да се построи и провери хипотеза за природата на силите, действащи в дадена Descriptive survey съвкупност. Оповестяване на Данните от статистическите изследвания се представят пред статистическите обществеността и се публикуват по точно определени правила данни и ред, установени със Закона за статистиката. Statistical disclosure Определение Кратко и точно обяснение на ключови понятия, използвани Definition при подготовката на едно статистическо изследване. Определение на Описание на променливите, съдържащи се във файловете с структура на данните информация – резултат от проведено статистическо Data structure изследване. definition Оптимално Процедура, извършваща с цел постигането на желаното разпределение в равнище на точност на оценките при сравняването на стратифицираната различните слоеве. По този начин се минимизират и разходите извадка за издръжка на изследването. Optimum allocation in Виж "Нейманово разместване" и "Вероятност, която stratified sampling пропорционална на оцененият размер" Отклонение В смисъл на изместване на оценките извън интервала (изместване) доверителност, като резултат най-често от отказа респондентите да участват или отговарят на въпроси провеждащото се изследване. Bias Относителна дисперсия Relative variance Относителна точност е на на от При достатъчно голям брой случайни извадки, сумата на техните отклонения около действителната величина ще клони към нула. При изместени оценки това не се случва. Отношение между стандартната грешка и оценяваната величина. Разпределение на изследваната съвкупност на слоеве, при което се понижава дисперсията и на единиците по определени
Relative precision Относително изместване Relative bias 130. Отчетна единица Reporting unit 129. 131. 132. 133. 134. 135. 136. 137. 138. 139. 140. 144. 145. Изместване на оценка, отнасяща се до отношение между две величини (променливи). Единица на статистическо наблюдение, за която се събират данни. Оформление изследването Survey design Оценяване на В смисъл на цялостно подготвен инструментариум на статистическо изследване. Multinominal distribution Понятие Виж "Биномиално разпределение", което е частен случай с две значения Определение на ключови елементи, специфични словосъчетания, фундаментални изрази (термини), чрез които се формира инструментариума на дадено статистическо изследване. Логическият ред, по които се осъществява статистическото изследване. В смисъл на поредица от файлове с данни, като резултат от проведено статистическо изследване. Числов израз на основни характеристики (показатели) на статистически разпределения, получени в резултат на проведени представителни извадкови статистически Estimation изследвания. Параметри Наименование на характеристики (показатели) на Parameters статистически разпределения. План за статистическа Включва начина за формиране на извадката и работата на извадка терен (график за реализация). Sampling plan Поверителност Запазване на анонимността на респондентите, участващи в Confidentiality статистическите изследвания. Повторно интервю Повторно посещение на респондентите, попаднали веднъж в дадено изследване. Целта е да се подобри достоверността на информацията, да се попълни липсващата информация и да се Reinterview сравнят резултатите от първото посещение. Погрешно заключение Извод, който е направен от недостоверни данни или оценки с Erroneous conclusion ниска стохастична точност. Подгрупа Ограничена подсъвкупност (слой) от статистически единици – част (елемент) от извадка, чрез която се осъществяват Stratum представителни статистически изследвания. Полиноминално Разпределение на статистическите единици на повече от две разпределение значения на признака. Concept 141. Последователност Consistency 142. Поток от данни Dataflow 143. признаци. Целта е да се увеличи точността на оценките. Правдоподобност Credibility Праг Threshold Преброяване населението Census Достоверна характеристика на изследваното явление или процес. Равнище, отграничение, разделителна линия. Например: праг на бедност – дохода в стойност, разделящ бедните от небедните слоеве на обществото. на Периодично изчерпателно изследване на населението. Целта е да се получи основна информация (пол, възраст, образование, професия, етническа принадлежност, вероизповедание и т. н.) за всички лица, които са постоянно население на страната. Обикновено се провежда веднъж на 10 години.
146. 147. 148. 149. 150. Представителна извадка Sampling Прекъсване Cut-off Прекъснати динамични редове Time series break Повторно извадка Repeated sampling Приблизителен 151. Approximate Признак Item 152. Приписване /вмъкване/ 153. 154. 155. 156. 157. 158. 159. 160. 161. 162. 163. Imputation Пробно изследване Pilot survey Проверка Verification Проверка на данни Data cheking Проверка на отчетността Record check Прозрачност Transparency Проста случайна извадка Извадка, която е формирана при осигурени необходими условия за рандомизация (случайност). всички Пресичане на редовете с данни. Динамични редове с оценки, които са съставени от различни наблюдения. В такива случаи задължително се поставя забележка, обозначаваща момента, от който данните стават относително несъпоставими, тъй като са резултат от различни наблюдения. Извадково изследване, провеждащо се регулярно. Целта е да се следят промените в изследваното явление или процес. Метод, който се използва при получаване на оценка на показател чрез допълнителни разчети. За целта се използва странична, допълнителна информация. Отличителна черта, белег на една или повече единици – обект на статистически изследвания. Присвояване на информация за наблюдавана единица. Обикновено това е метод, който се прилага, когато отсъства определен вид информация за единиците – обект на статистическо наблюдение. Изследване, което се провежда в реална обстановка, за да се апробира разработеният статистически инструментариум. В смисъл на контролни дейности за установяване спазване на етапите за провеждането на едно статистическо изследване. Процедура, включваща логически и формален контрол на данните от едно статистическо изследване. Дейности за установяване достоверността на попълнената информация в статистическата документация. Точно описание и спазване на реда, по който се осъществяват статистическите изследвания. Извадка, която се формира при спазване на условията за случайност. Всяка единица от генералната съвкупност е със равен шанс за попадане в извадката. Изключва Simple random преднамереност при избора на единиците за наблюдение. sampling Осъществява се на лотариен принцип. Противоречиви данни Обикновено това са данни, които очертава, взаимноотричащи се тенденции. При такива ситуации трудно се намира логиката Data confrontation в развитието на определено явление или процес. Проучване В смисъл на статистическо изследване. Survey Приспособяване (нагласяване) Процедура, при която оценките от дадено статистическо извадково изследване се превръщат в данни за генералната съвкупност. Например: оценките за заети и безработни от извадковото изследване на работната сила се превръщат в Adjustment брой заети и безработни за страната. Получване на данни Статистически данни, получени като резултат от проведено от изследване статистическо изследване. Survey data collection Процент на Относителен дял на респондентите, включени в извадката за неотгорили наблюдение, но отпаднали по една или друга причина.
Non-response rate 164. 165. 166. Първична извадка Primary sampling “unit” Първоизточник Pirmary source Равномерно разпределение 168. 169. 170. 171. 172. В смисъл на информация, получена в резултат от емпирично статистическо изследване. Биноминално разпределение, където в единият край на интервала има значение р, а на другият – q. Дисперсията на това разпределение е: S 2 = pqh 2 , където h е дължина на интервала. При p = q = ½, максималното значение на S е 0.25h. Съответно при S = 0.038h разпределението е равномерно. Rectangular distribution 167. Извадка, формирана от определената първа единица за наблюдение. Размер на извадката Обема на извадката се определя по определена формула – виж “Необходим размер на извадката”. Чрез обема на извадката се контролира точността на оценяваните показатели, при равни Sample size други условия. Размерност Показател, характеризиращ, сумата от съдържащите го Dimensionality елементи. Разпределение на Разпределение, изследвано и доказано от английския Стюдънт статистик Уилям Госет (1876 – 1937 г.) с псевдоним Стюдент и е известно като t – разпределение. Използва се при нормално разпределение на променливата и малък обем на извадката за намиране на доверителните граници на оценяваният параметър. При практическото използване на t – разпределението не се налага изчисляване на функция на плътността Р(t), тъй като има съставени таблици, където се Student t-distribution намира по зададени степени на свобода. Разпределение в Виж „Нормално разпределение”. камбановидна форма Bell-shaped distribution Разпространение на Публично оповестяване на данни от проведено статистическо данните изледване. Data dissemination Рамка Обхват на единиците за наблюдение по време и място. Frame 173. Регистър 174. Register Регистър метаданни Регламентирано и законосъобразно описание на обекти, които са единици на статистическо изследване (изчерпателно или извадково). Техните взаимоотношения определят характера на икономическото пространство. на Информационна система за регистриране на метаданни. Регистърът на метаданни е по същество база данни на метаданните, поддържаща функционалността на регистрация. При регистрацията се осъществяват три основни цели: идентификация, произход и контролиране на качеството. Идентификацията е извършена чрез определяне на уникален идентификатор (вътре в регистъра) за всеки обект регистриран там. Произходът се отнася до източника на метаданните и описания обект. Контролирането на качеството гарантира, че метаданните извършват работата, за която са предназначени. Регистър метаданни управлява семантиките на данните. Разбирането на данните е фундаментално за техния дизайн, хармонизация, стандартизация, употреба, повторна употреба,
175. Metadata registry Регресионен коефициент 176. Regression coefficient Регресионна оценка 177. Regression estimate Редактиране на данни 178. Data editing Референтен период 179. Referece period Референтни метаданни Reference metadata 180. Ротационна извадка 181. 182. 183. Rotation sampling Рядък признак Rare item Самостоятелно претеглена оценка Self-weighting estimate Систематична извадка Systematic sampling и обмен. Основният модел е предназначен да събира всичките основни компоненти на семантиките на данните, независимо от дадено приложение или тематична област. Регистрацията позволява да се идентифицират две или повече управлявани позиции, описващи идентични обекти. Тя идентифицира ситуации, където подобни или идентични имена са в употреба за управлявани позиции, които значително се различават в едно или повече отношения. Регресионният коефициент (вх/у) измерва влиянието на зависимата променлива (х) върху независимата променлива (у) при дадено регресионно уравнение: например у’ = а + вх. Коефициентът показва с колко се изменя у при изменение на х с определен брой единици (според приетата мярка). Регресионната оценка е оценката на регресинни коефициент вх/у по данни от статистическо извадково наблюдение. Оценката може да се направи и, когато се търси обратната зависимост - на зависимата променлива у от независимата променлива х. Тогава коефициентът на регресия ще бъде ву/х. Двата коефициента са обратни по смисъл, но не са взаимно обратни величини, тъй като зависимостта не е функционална. Процедура при която се използват статистико-математически методи с определена цел – например: изглаждане (изравняване) на динамичен ред с цел да се разкрие основната тенденция, съдържаща се в него. Други методи се използват, когато е необходимо да се разкрие и оцени сезонната компонента, съдържаща се в даден динамичен ред. Обикновено това е период, които е предварително определен за осъществяване на статистически изследвания в различни страни. Целта е да се постигне максимална и коректна сравнимост на данните от проведените изследвания. Това е особено важна стъпка при осъществяването на международни аналитичните сравнение на едни и същи социалноикономически процеси или явления. Например при международното изследване на бедността, безработицата, бюджетите на домакинствата и други. Референтните метаданни (виж “Метаданни”) са свързани с референтен период. В най-краткия смисъл - чрез тях се определят инструментариума, който е в основата на статистическите изследвания, представящи международно сравними данни по време и място. Извадка, разделена на подсъвкупности. Всяка подсъвкупност участва в статистическото наблюдение през определени интервали от време по точно установена програма и последователност. Признак на единици, които се срещат много рядко в общественото пространство. Например лица, притежаващи най-високата академична степен “академик”. Или лица, притежаващи най-високата военна степен “генералисимус”. Процедура, при която делът на подборът е еднакъв за всички слоеве. Такава разпределение на единиците се нарича пропорционално и осигурява равнопретеглена извадка. Извадка, която се формира от единиците на генералната съвкупност, като техният подбор се осъществява през определен интервал, наречен крачка на подбора.
184. 185. 186. 187. Случайна извадка Извадка, формирана чрез създаване и спазване на условията за рандомизация. Единиците за наблюдение, когато се формира извадкавата съвкупност, попадат в нея напълно непреднамерено. Предварително се създават условия, при Probability sampling които всяка единица има равен шанс за попадане в извадката. Списък (описание) на Списък, в който точно са представени данни за водещите първичните единици единици на статистическо наблюдение. Така например това могат да бъдат контролните райони по населени места от списъците за преброяването на населението и жилищния фонд Listing of primary units на страната през определена година. Средна квадратична Виж „Стандартна грешка на оценката” грешка Mean square error Средна стойност Изчислява се по формулата: N x=  Mean value 188. 189. 190. 191. 192. 193. Стандартно отклонение x i =1 N i , където - знак за сума; xi - осреднявана величина; N - брой случаи. Изчислява се по формулата: =  (x − x ) ,където N x - значения на осредняваната величина; x - средна величина; Standard deviation N - брой случаи. Стандартна грешка на Изчислява се по формулата: оценката   x = 0 , където n  0 - стандартно отклонение на генералната съвкупност; Standart error of the n - обем на извадката. estimate Стандартно При изчисляване на стандартните грешки на оценките, отклонение на получени от едно извадково изследване, обикновено извадката стойността на стандартното отклонение на генералната съвкупност е неизвестна величина. Тогава се изчислява стандартното отклонение по данни от извадката и се замества във формулата за изчисляване на стандартните грешки на The sample deviation оценките. Статистически На всеки етап от провеждането на едно статистическо контрол на процеса изследване се осъществява специфичен контрол, които се осъществява с цел да бъде отстранена опасността от появата Statistical process на нестохастични грешки и осигури максимална достоверност control на резултатите. Стойност на Издръжка (план-сметка) на статистическото изследване. проучването Включва разходите за заплати на методолози, анкетьори, Filed costs програмисти, формуляри, транспорт и т. н. Стратификация Процедура, която се осъществява за разслояване на генералната съвкупност по сходни признаци на единиците. Целта е да се редуцира разсейването, съществуващо в генералната съвкупност, като цяло. При формирането на извадката това е от голямо значение, тъй като се наблюдават
194. 195. 196. 197. 198. 199. определен брой случай от всеки слой с по-малко разсейване (в съответствие с желаната точност на оценките). Разходите по издръжката на изследването също съществено намаляват. Във всички случаи разходите са значително по-малки, отколкото при изследване, което се осъществява с използването на извадка, формирана на принципа на случайния подбор. на Виж „Стратификация”. Stratification Стратифициране случайна извадка Stratified random sampling Съвместяване, обединяване на слоеве Collapsed strata Съвкупност Population Съставна оценка Процедура, при която наблюдаваните единици в извадката дават информация, както за предходен период от време, така и Composite estimate за текущия период от време. Съчетаване Използва се в смисъл на: 1. Повторно изследване на една и съща съвкупност. 2. Създаване на масиви от данни, които са резултат от използването на единиците на наблюдение от различни изследвания, които се обединяват на базата на сходни основни признаци. По този начин се получават характеристики на статистически разпределения, които са предпоставка за покачествен, задълбочен и многостранен анализ на явленията и Matching процесите от действителността. Teриториална извадка Извадка, която е представителна за определено териториално Area sampling отграничение. 200. Tегло на подгрупата 201. Stratum weight Tекущи оценки Current estimates 202. 203. 204. 205. 206. 207. 208. Подход, който се използва, когато целевата съвкупност се отличава с голяма вариация. Осъществява се прегрупиране и формиране на слоеве, при което се редуцира вариацията. В смисъл на генерална съвкупност. 104 Изчислява се по формулата: N Wh = h , където N N h - брой единици в даден слой (подсъвкупност) на извадката; N - общ брой случаи в извадката. Оценки от регулярно, осъществяващо се статистическо изследване. Тегло Weight Тенденция Trend Термин Term В смисъл на претегляне на оценките от дадено статистическо извадково изследване. Компонент, съдържащ се в даден статистически ред. Техника на извадката Sampling technique Точкова оценка Дизайн на извадка. Определя се с цел да се оптимизират разходите и получат оценки с висока стохастична точност. Оценки получени в резултат от проведено извадково изследване. Същите са конкретни числови стойности – параметри на генералната съвкупност. Точност на оценките от дадено представително извадково изследване. Зависи от обема на извадката. Подбор на единици, при което извадката се формира на три степени. Например: на първа степен се избират контролни Point estimate Точност Precision Тристепенен подбор Виж „Понятие”
209. 210. райони; на втора – преброителни участъци; на трета – Threestage sampling домакинствата за наблюдения. Управление на Включва конкретни процедури и дейности с цел да се осигури качеството качеството на информацията от провеждането на дадено Quality management статистическо изследване. Функция за Разпределението на индискретна (непрекъсната) случайна плътността на величина се представя аналитично чрез функция на вероятността плътността на вероятностите (диференциална функция на разпределението). Например на функцията на плътността на нормално разпределение има вида: f (x ) = 1  2 − e (x − x ) 2 2 2 , където  = 3.141593; e = 2.718282;  - стандартно отклонение; x - значения на случайната величина; x = E (x ) -математическо очакване (средна density случайната величина). 211. 212. 213. Probability function Целева съвкупност Target population Целево население Target population Целенасочен подбор 214. Purposive selection Частична извадка Sampling fraction 215. Честота Frequency стойност на Съвкупността, която е обект на наблюдение. Виж „Целева съвкупност” Подбор, чрез който се формира извадка, която тематично отговаря на изследването на общественозначимо явление или процес. Подсъвкупност – съставна част от извадка. Брой на появяването на едно събитие (например: при хвърлянето на монета 100 пъти може да се разбере колко пъти е паднала “лице” и “гръб”). Брой на появяване на единици с едно и също значение на признака (пример: брой едночленни домакинства в извадка от 1000 домакинства).