Оценка ошибки выборки
 


Большинство данных получаемых в социологии и маркетинге получаются на основе выборочных исследований. Здесь приведены flash-ролики, позволяющие оценить ошибку простой случайной выборки.
Простая случайная выборка - выборка, при которой выборочная совокупность формируется случайным отбором объектов из всего множества исследуемых объектов.
Конечно, в исследованиях обычно используются более сложные типы выборки, но оценки ошибки с помощью формул для расчета простой случайной, дают достаточно качественную оценку качества выборки.
Обратим внимание на то, что большинство выборок являются хотя и случайными, но не простыми, а многоступенчатыми. На первой ступени отбора случайным образом отбираются места сосредоточения объектов исследования (например, для населения страны такими места сосредоточения являются населенные пункты), а на второй ступени внутри отобранных мест сосредоточения отбираются уже непосредственные участники исследования. При расчете ошибки для таких выборок следует помимо оценки ошибки по формулам для простой случайной выборки также рассчитывать и учитывать дизайн-эффект (влияние многоступенчатости на ошибку выборки). Механизмы для оценки дизайн-эффекта достаточно сложны и не приведены здесь, так как требуют непосредственного анализа имеющихся данных.

Для расчета объема простой случайной выборки следует указать следующие параметры.
Объем генеральной совокупности - общее количество объектов, среди которых проводится выборочное исследование. Следует отметить, что с увеличением числа объектов, среди которых проводится исследование, влияние данного параметра объем выборки уменьшается. Если объем генеральной совокупности более 10000 объектов, совокупность считается условно бесконечной и вместо точного указания ее объема (в тех случаях, когда он неизвестен) для расчета можно использовать число 10000.
Граничная ошибка - поскольку любое выборочное исследование несет в себе некую вероятность ошибиться, максимальное допустимое с точки зрения исследователя значение этого параметра учитывается при расчете объема выборки. Стандартом считается не превышать ошибку в 5%.
Доля исследуемого признака - данный параметр отображает долю в генеральной совокупности носителей исследуемого признака. Очень часто этот параметр бывает неизвестен, а также многие исследования посвящены одновременному изучению нескольких признаков. Поэтому обычно берется значение 0.5, как такое при котором объем выборки будет максимален и, следовательно, влияние описываемого параметра на ее объем будет учтено в любом случае.
Доверительная вероятность (в приведенных формах расчетах обозначается буквой P) - поскольку данный материал является лишь общим описанием, мы позволим себе дать поверхностную характеристику данному параметру как вероятности того, что заданная нами граничная ошибка не будет превышена. Все расчеты приводятся для двух доверительных вероятностей 99% и 95%. Отметим, что наиболее часто используется доверительная вероятность в 95%.
Также на этой странице приведена форма для обратной процедуры - расчета ошибки для заданного объема выборки.

Обратно

     

E-Mail: oca.feedback@gmail.com |  (c) OCA 2004 - 2018.