Как сделать типическую выборку

Обновлено: 08.07.2024

При значительной колеблемости признака в генеральной совокупности, например, при обследованиях предприятий, когда представители различных отраслей значительно отличаются друг от друга, совокупность целесообразно предварительно раз бить на однородные в некотором смысле слова, типы или группы, а затем провести случайный (иди механический) отбор единиц наблюдения внутри полученных групп. Извлеченная подобным образом выборка будет типической (в зарубежной и переводной литературе она называется "расслоенной", или "стратифицированной").

Типическая выборка в статистической практике применяется гораздо чаще, чем остальные виды выборочного наблюдения. Так, при обследованиях населения в зависимости от целей исследования генеральную совокупность расслаивают по возрастному или социальному признаку, типу местности проживания (городское, сельское и т.д.). Поэтому типическая выборка дает более точные результаты.

Предположим, что генеральная совокупность объектов разбита на k групп, тогда

Объем извлекаемых единиц из каждой типической группы зависит от принятого способа отбора, их общее количество образует необходимый объем выборки:

Существуют следующие два вида организации отбора внутри типической группы: пропорциональный объему типических групп и пропорциональный степени колеблемости значений признака у единиц наблюдения в группах,

Отбор, пропорциональный объему типических групп, предполагает следующее число выборочных наблюдений в каждой из них:


где ni-- количество извлекаемых единиц для выборки из i-й типической группы;

n -- общий объем выборки;

Ni -- количество единиц генеральной совокупности, составивших i-ю типическую группу;

N -- общее количество единиц генеральной совокупности.

Описанный способ отбора наиболее часто используется на практике, причем извлечение единиц внутри групп происходит на случайной или механической основе, но независимо от других групп.

Формулы для оценивания средней ошибки выборки для среднего и доли представлены в таблице 2.[2]

Таблица 2. Формулы ля расчета средней ошибки при использовании типического отбора, пропорционального объему типических групп.


Если вариация признака в типических группах существенно отличается, то возникает желание прибегнуть к переменной доле отбора; чем больше колеблемость значений признаков внутри типической группы, тем большую долю отбора следует использовать для наблюдения. Таким образом, доля отбора становится прямо пропорциональна среднему квадратическому отклонению признака в этой группе ().

Подобный отбор дает наименьшую величину ошибки выборки, но практическое его использование крайне затруднено. Дело в том, что на практике почти никогда не знают величин генеральных групповых дисперсий ().

Приблизительные величины внутригрупповых среднеквадратических отклонений многие статистики (например, И. Г. Венецкий) рекомендуют определять до проведения основной выборки путем небольших пробных выборочных обследований. Тогда расчет количества извлекаемых единиц наблюдений из каждой группы проводится по формулам:


- при оценивании генерального среднего значения;


- при оценивании генеральной доли.

Главное преимущество этого способа отбора заключается в том, что использование переменной доли отбора, прямо пропорциональной вариации признака внутри типических групп, позволяет уменьшить общий объем выборки при сохранении заданной точности.

Средняя и предельная ошибки типической выборки, пропорциональной степени колеблемости значений признака у единиц наблюдения, вычисляются по формулам, представленным в таблице 3.

Таблица 3. Формулы для расчета средней ошибки выборки при использовании типического отбора, пропорционального степени колеблемости значений признака внутри типических групп.


Следовательно, типический отбор, пропорциональный вариации признака внутри типических групп, обеспечивает большую точность по сравнению с типическим отбором, пропорциональным объему типических групп. Причем, тем в большей степени, чем сильнее колеблемость признака внутри этих групп.

В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:

типическую (стратифицированную, районированную);

Случайная выборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.

В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой. При бесповторном способе отбора формула для расчета стандартной ошибки будет:

где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле. Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.

Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.

При чисто механической выборке вся генеральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора, и полученная выборка может оказаться смещенной. Объясняется это тем, что, во-первых, упорядочение единиц генеральной совокупности может иметь элемент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установлении начала отсчета может также привести к ошибке смещения. Однако практически легче организовать механическую выборку, чем собственно случайную, и при проведении выборочных обследований чаще всего пользуются этим видом выборки. Стандартную ошибку при механической выборке определяют по формуле собственно случайной бесповторной выборки.

Типическая (районированная, стратифицированная) выборка преследует две цели:

• обеспечить представительство в выборке соответствующих типических групп генеральной совокупности по интересующим исследователя признакам;

• увеличить точность результатов выборочного обследования.

При типической выборке до начала ее формирования генеральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число единиц отбора. В первом случае выборочная совокупность формируется с одинаковой долей отбора из каждой группы, во втором – с долей, пропорциональной ее доле в генеральной совокупности. Если выборка формируется с равной долей отбора, по существу она равносильна ряду собственно случайных выборок из меньших генеральных совокупностей, каждая из которых и есть типическая группа. Отбор из каждой группы осуществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке, как с равной, так и неравной долей отбора, удается устранить влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как обеспечивается обязательное представительство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии, а от величины средней из групповых дисперсий. Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку при прочих равных условиях стандартная ошибка типической выборки будет меньше стандартной ошибки собственно случайной выборки.

При определении стандартных ошибок типической выборки применяются следующие формулы:

• при повторном способе отбора

• при бесповторном способе отбора:

– средняя из групповых дисперсий в выборочной совокупности.

Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдельных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вторых, не устраняется влияние межсерийной вариации изучаемого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида выборки исследователю необходимо учитывать это обстоятельство.

В практике те или иные способы и виды выборок применяются в зависимости от цели и задач выборочных обследований, а также возможностей их организации и проведения. Чаще всего применяется комбинирование способов отбора и видов выборки. Такие выборки получили название комбинированные. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно случайной и т. д. К комбинированной выборке прибегают для обеспечения наибольшей репрезентативности с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.

При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квадратов ошибок соответствующих выборок.

Особенность многоступенчатой выборки состоит в том, что выборочная совокупность формируется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой ступени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На последней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выборочного обследования бюджетов домашних хозяйств на первой ступени отбираются территориальные субъекты страны, на второй – районы в отобранных регионах, на третьей – в каждом муниципальном образовании отбираются предприятия или организации и, наконец, на четвертой ступени – в отобранных предприятиях отбираются семьи.

Таким образом, выборочная совокупность формируется на последней ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, которое заключается в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из ступеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.

Сущность многофазной выборки состоит в том, что на основе первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки – следующую подвыборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее – вторую и т. д. Многофазную выборку целесообразно применять в случаях, если:

для изучения различных признаков требуется неодинаковый объем выборки;

колебание изучаемых признаков неодинакова и требуемая точность различна;

в отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать менее подробные сведения, а в отношении единиц каждой последующей фазы – более подробные.

Одним из несомненных достоинств многофазной выборки является то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной информацией на последующих фазах, информацией второй фазы – как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.

При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка может быть многофазной.

Стандартная ошибка при многофазной выборке рассчитывается на каждой фазе в отдельности в соответствии с формулами того способа отбора и вида выборки, при помощи которых формировалась ее выборочная совокупность.

Взаимопроникающие выборки – это две или более независимые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимопроникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги выборочных обследований. Взаимопроникающие выборки эффективны для оценки результатов обследования. Если в независимых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопроникающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.

Стандартная ошибка при взаимопроникающих выборках определяется по той же формуле, что и типическая пропорциональная выборка. Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов, поэтому исследователь должен учитывать это обстоятельство при проектировании выборочного обследования.

1. Определение выборочного наблюдения

Статистические исследования очень трудоемки и дороги, поэтому возникла мысль о замене сплошного наблюдения выборочным.

Основная цель несплошного наблюдения состоит в получении характеристик изучаемой статистической совокупности по обследованной ее части.

Выборочное наблюдение – это метод статистического исследования, при котором обобщающие показатели совокупности устанавливаются только по отдельно взятой части на основе положений случайного отбора.

При выборочном методе изучению подвергается только некоторая часть изучаемой совокупности, при этом подлежащая изучению статистическая совокупность называется генеральной совокупностью.

Выборочной совокупностью или просто выборкой можно называть отобранную из генеральной совокупности часть единиц, которая будет подвергаться статистическому исследованию.

Значение выборочного метода: при минимальной численности исследуемых единиц проведение статистического исследования будет происходить в более короткие промежутки времени и с наименьшими затратами средств и труда.

В генеральной совокупности доля единиц, которая обладает изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака – это генеральная средняя (обозначается х).

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частью (обозначается w), средняя величина в выборке – это выборочная средняя.

Если в период обследования будут соблюдены все правила его научной организации, то выборочный метод даст довольно точны результаты, и поэтому данный метод целесообразно применять для проверки данных сплошного наблюдения.

Этот метод получил широкое распространение в государственной и вневедомственной статистике, потому что при исследовании минимальной численности изучаемых единиц позволяет тщательно и точно провести исследование.

Изучаемая статистическая совокупность состоит из единиц с варьирующими признаками. Состав выборочной совокупности может отличаться от состава генеральной совокупности, это расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.

Ошибки, свойственные выборочному наблюдению, характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки, возникающие в ходе выборочного наблюдения, называются ошибками репрезентативности и делятся на случайные и систематические.

Если выборочная совокупность недостаточно точно воспроизводит всю совокупность из–за несплошного характера наблюдения, то это называют случайными ошибками, и их размеры определяются с достаточной точностью на основании закона больших чисел и теории вероятностей.

Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения.

2. Виды и схемы отбора

Размер ошибки выборки и методы ее определения зависят от вида и схемы отбора.

Различают четыре вида отбора совокупности единиц наблюдения:

4) серийный (гнездовой).

Случайный отбор – наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером.

Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку, например тиражи выигрышей, когда из общего количества выпущенных билетов в случайном порядке наугад отбирается определенная часть номеров, на которые приходятся выигрыши. При этом всем номерам обеспечивается равная возможность попасть в выборку.

Механический отбор – это способ, когда вся совокупность разбивается на однородные по объему группы по случайному признаку, потом из каждой группы берется только одна единица Все единицы изучаемой статистической совокупности предварительно располагаются в определенном порядке, но в зависимости от объема выборки механически через определенный интервал отбирается необходимое количество единиц.

Типический отбор – это способ, при котором исследуемая статистическая совокупность разбивается по существенному, типическому признаку на качественно однородные, однотипные группы, затем из каждой этой группы случайным способом отбирается определенное количество единиц, пропорциональное удельному весу группы во всей совокупности.

Типический отбор дает более точные результаты, так как при нем в выборку попадают представители всех типических групп.

Серийный (гнездовой) отбор. Отбору подлежат целые группы (серии, гнезда), отобранные случайным или механическим способом. По каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.

Повторный отбор. Каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку Это так называемая схема возвращенного шара.

Бесповторный отбор. Каждая обследованная единица изымается и не возвращается в совокупность, поэтому она не попадает в повторное обследование. Эта схема получила название невозвращенного шара.

Бесповторный отбор дает более точные результаты, потому что при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.

Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

Выборка называется многоступенчатой, если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

Многофазная выборка – на всех ступенях выборки сохраняется одна и та же единица отбора, но проводится несколько стадий, фаз выборочных обследований, которые различаются между собой широтой программы обследования и объемом выборки.

Характеристики параметров генеральной и выборочной совокупностей обозначаются следующими символами:

N – объем генеральной совокупности;

n – объем выборки;

X – генеральная средняя;

х – выборочная средняя;

р – генеральная доля;

w – выборочная доля;

? 2 – генеральная дисперсия (дисперсия признака в генеральной совокупности);

? 2 – выборочная дисперсия того же признака;

?– среднее квадратическое отклонение в генеральной совокупности;

?– среднее квадратическое отклонение в выборке.

3. Ошибки выборки

Каждая единица при выборочном наблюдении должна иметь равную с другими возможность быть отобранной – это является основой собственнослучайной выборки.

Собственнослучайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки или другим подобным способом.

Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.

Доля выборки – это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:



Собственнослучайный отбор в чистом виде является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.

Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.

Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):



Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки, ее еще называют ошибкой репрезентативности, представляет собой разность соответствующих выборочных и генеральных характеристик:

1) для средней количественного признака:

?х =|х – х|;

2) для доли (альтернативного признака):

Только выборочным наблюдениям присуща ошибка выборки

Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.

Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией ? 2 или w(l – w) – для альтернативного признака. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

1) для средней количественного признака:



где ? 2 – средняя величина дисперсии количественного признака.

2) для доли (альтернативного признака):



Так как дисперсия признака в генеральной совокупности ? 2 точно неизвестна, на практике пользуются значением дисперсии S 2 , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Формулы средней ошибки выборки при случайном повторном отборе следующие. Для средней величины количественного признака: генеральная дисперсия выражается через выборную следующим соотношением:



где S 2 – значение дисперсии.

Механическая выборка – это отбор единиц в выборочную совокупность из генеральной, которая разбита по нейтральному признаку на равные группы; производится так, что из каждой такой группы в выборку отбирается лишь одна единица.

При механическом отборе единицы изучаемой статистической совокупности предварительно располагают в определенном порядке, после чего отбирают заданное число единиц механически через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки.

При достаточно большой совокупности механический отбор по точности результатов близок к собственнослучайному Поэтому для определения средней ошибки механической выборки используют формулы собственнослучайной бесповторной выборки.

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка, используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.

Затем из каждой типической группы собственнослучайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей.

Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Серийная выборка предполагает случайный отбор из генеральной совокупности равновеликих групп для того, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

4. Способы распространения выборочных результатов на генеральную совокупность

Характеристика генеральной совокупности на основе выборочных результатов – это конечная цель выборочного наблюдения.

Выборочный метод применяется для получения характеристик генеральной совокупности по определенным показателям выборки. В зависимости от целей исследования это осуществляется прямым пересчетом показателей выборки для генеральной совокупности или методом расчета поправочных коэффициентов.

Способ прямого пересчета в том, что при нем показатели выборочной доли w или средней х распространяются на генеральную совокупность с учетом ошибки выборки.

Способ поправочных коэффициентов применяется, когда целью выборочного метода является уточнение результатов сплошного учета. Данный способ используется при уточнении данных ежегодных переписей скота у населения.

1. Определение выборочного наблюдения

Статистические исследования очень трудоемки и дороги, поэтому возникла мысль о замене сплошного наблюдения выборочным.

Основная цель несплошного наблюдения состоит в получении характеристик изучаемой статистической совокупности по обследованной ее части.

Выборочное наблюдение – это метод статистического исследования, при котором обобщающие показатели совокупности устанавливаются только по отдельно взятой части на основе положений случайного отбора.

При выборочном методе изучению подвергается только некоторая часть изучаемой совокупности, при этом подлежащая изучению статистическая совокупность называется генеральной совокупностью.

Выборочной совокупностью или просто выборкой можно называть отобранную из генеральной совокупности часть единиц, которая будет подвергаться статистическому исследованию.

Значение выборочного метода: при минимальной численности исследуемых единиц проведение статистического исследования будет происходить в более короткие промежутки времени и с наименьшими затратами средств и труда.

В генеральной совокупности доля единиц, которая обладает изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака – это генеральная средняя (обозначается х).

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частью (обозначается w), средняя величина в выборке – это выборочная средняя.

Если в период обследования будут соблюдены все правила его научной организации, то выборочный метод даст довольно точны результаты, и поэтому данный метод целесообразно применять для проверки данных сплошного наблюдения.

Этот метод получил широкое распространение в государственной и вневедомственной статистике, потому что при исследовании минимальной численности изучаемых единиц позволяет тщательно и точно провести исследование.

Изучаемая статистическая совокупность состоит из единиц с варьирующими признаками. Состав выборочной совокупности может отличаться от состава генеральной совокупности, это расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.

Ошибки, свойственные выборочному наблюдению, характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки, возникающие в ходе выборочного наблюдения, называются ошибками репрезентативности и делятся на случайные и систематические.

Если выборочная совокупность недостаточно точно воспроизводит всю совокупность из–за несплошного характера наблюдения, то это называют случайными ошибками, и их размеры определяются с достаточной точностью на основании закона больших чисел и теории вероятностей.

Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения.

2. Виды и схемы отбора

Размер ошибки выборки и методы ее определения зависят от вида и схемы отбора.

Различают четыре вида отбора совокупности единиц наблюдения:

4) серийный (гнездовой).

Случайный отбор – наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером.

Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку, например тиражи выигрышей, когда из общего количества выпущенных билетов в случайном порядке наугад отбирается определенная часть номеров, на которые приходятся выигрыши. При этом всем номерам обеспечивается равная возможность попасть в выборку.

Механический отбор – это способ, когда вся совокупность разбивается на однородные по объему группы по случайному признаку, потом из каждой группы берется только одна единица Все единицы изучаемой статистической совокупности предварительно располагаются в определенном порядке, но в зависимости от объема выборки механически через определенный интервал отбирается необходимое количество единиц.

Типический отбор – это способ, при котором исследуемая статистическая совокупность разбивается по существенному, типическому признаку на качественно однородные, однотипные группы, затем из каждой этой группы случайным способом отбирается определенное количество единиц, пропорциональное удельному весу группы во всей совокупности.

Типический отбор дает более точные результаты, так как при нем в выборку попадают представители всех типических групп.

Серийный (гнездовой) отбор. Отбору подлежат целые группы (серии, гнезда), отобранные случайным или механическим способом. По каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.

Повторный отбор. Каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку Это так называемая схема возвращенного шара.

Бесповторный отбор. Каждая обследованная единица изымается и не возвращается в совокупность, поэтому она не попадает в повторное обследование. Эта схема получила название невозвращенного шара.

Бесповторный отбор дает более точные результаты, потому что при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.

Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

Выборка называется многоступенчатой, если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

Многофазная выборка – на всех ступенях выборки сохраняется одна и та же единица отбора, но проводится несколько стадий, фаз выборочных обследований, которые различаются между собой широтой программы обследования и объемом выборки.

Характеристики параметров генеральной и выборочной совокупностей обозначаются следующими символами:

N – объем генеральной совокупности;

n – объем выборки;

X – генеральная средняя;

х – выборочная средняя;

р – генеральная доля;

w – выборочная доля;

? 2 – генеральная дисперсия (дисперсия признака в генеральной совокупности);

? 2 – выборочная дисперсия того же признака;

?– среднее квадратическое отклонение в генеральной совокупности;

?– среднее квадратическое отклонение в выборке.

3. Ошибки выборки

Каждая единица при выборочном наблюдении должна иметь равную с другими возможность быть отобранной – это является основой собственнослучайной выборки.

Собственнослучайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки или другим подобным способом.

Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.

Доля выборки – это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:



Собственнослучайный отбор в чистом виде является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.

Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.

Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):



Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки, ее еще называют ошибкой репрезентативности, представляет собой разность соответствующих выборочных и генеральных характеристик:

1) для средней количественного признака:

?х =|х – х|;

2) для доли (альтернативного признака):

Только выборочным наблюдениям присуща ошибка выборки

Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.

Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией ? 2 или w(l – w) – для альтернативного признака. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

1) для средней количественного признака:



где ? 2 – средняя величина дисперсии количественного признака.

2) для доли (альтернативного признака):



Так как дисперсия признака в генеральной совокупности ? 2 точно неизвестна, на практике пользуются значением дисперсии S 2 , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Формулы средней ошибки выборки при случайном повторном отборе следующие. Для средней величины количественного признака: генеральная дисперсия выражается через выборную следующим соотношением:



где S 2 – значение дисперсии.

Механическая выборка – это отбор единиц в выборочную совокупность из генеральной, которая разбита по нейтральному признаку на равные группы; производится так, что из каждой такой группы в выборку отбирается лишь одна единица.

При механическом отборе единицы изучаемой статистической совокупности предварительно располагают в определенном порядке, после чего отбирают заданное число единиц механически через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки.

При достаточно большой совокупности механический отбор по точности результатов близок к собственнослучайному Поэтому для определения средней ошибки механической выборки используют формулы собственнослучайной бесповторной выборки.

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка, используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.

Затем из каждой типической группы собственнослучайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей.

Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Серийная выборка предполагает случайный отбор из генеральной совокупности равновеликих групп для того, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

4. Способы распространения выборочных результатов на генеральную совокупность

Характеристика генеральной совокупности на основе выборочных результатов – это конечная цель выборочного наблюдения.

Выборочный метод применяется для получения характеристик генеральной совокупности по определенным показателям выборки. В зависимости от целей исследования это осуществляется прямым пересчетом показателей выборки для генеральной совокупности или методом расчета поправочных коэффициентов.

Способ прямого пересчета в том, что при нем показатели выборочной доли w или средней х распространяются на генеральную совокупность с учетом ошибки выборки.

Способ поправочных коэффициентов применяется, когда целью выборочного метода является уточнение результатов сплошного учета. Данный способ используется при уточнении данных ежегодных переписей скота у населения.

Читайте также: