Выбрать главу

1. Основной вопрос при работе с выборкой – не «сколько?» (сколько человек опросить, чтобы было «репрезентативно»), а «как?» – как мы формируем выборку. Именно от подхода к формированию выборки будет в первую очередь зависеть, насколько репрезентирующими мнение генеральной совокупности получатся результаты.

2. Есть различные типы выборок, но «эталоном» является простая случайная выборка. Стоит подчеркнуть, что случайность здесь понимается в смысле того, что каждый респондент имеет равный шанс попасть в выборку. Например, если вы реализуете опрос по случайно отобранному почтовому адресу из базы рабочих почт сотрудников и у значимого числа сотрудников нет такой почты, лишение их шанса попасть в выборку не дает говорить о реализации полноценной случайной выборки из всей совокупности сотрудников. Другое дело, если исследователь берет актуальный поименный список всех сотрудников организации (1), с помощью генератора случайных чисел отбирает необходимое число людей для опроса (2), а затем опрашивает конкретных отобранных респондентов (3).

Простая случайная выборка – не единственный возможный подход к выборке и не всегда самый оптимальный. Например, возможен случайный отбор не людей, а отделений, с последующим сплошным/выборочным опросом в них (кластерная выборка). С одной стороны, это значимо экономит ресурсы, с другой – усложняет процесс расчета выборки и снижает точность результатов за счет таких явлений, как, например, дизайн-эффект[303]. Однако, опять же, методические нюансы построения выборок не являются предметом данной монографии и для ознакомления с рядом нюансов построения выборок читатель при необходимости может обратиться к предыдущим ссылкам, а также к специализированной литературе.

3. После решения вопроса «как?» можно наконец перейти к вопросу «сколько?». Для случайной выборки существуют формулы, позволяющие оценить степень ее соответствия генеральной совокупности. В случае простой случайной выборки число опрошенных зависит в от двух параметров – приемлемой для нас ошибки выборки (обычно берется 5 %) и приемлемой для нас доверительной вероятности (обычно берется 95 %). Что означают данные цифры? Приведем пример: если при указанных значениях мы получили, что у нас в выборке 50 % «промоутеров», то это значит, что с вероятностью 95 % (доверительная вероятность) число промоутеров среди всей генеральной совокупности варьируется в пределах 5 % (50 % ± 5 %), т. е. от 45 % до 55 %.

Формула случайной невозвратной[304] выборки следующая (Рисунок 17):

Рисунок 17. Формула для расчета случайной невозвратной выборки

где t – коэффициент, зависящий от выбранной доверительной вероятности (при 95 % он составляет 1,96);

s – доля респондентов, имеющих рассматриваемый признак (если она не известна, берется максимальное значение – 0,5);

Δ – предельная ошибка выборки в долях (зависит от приемлемой для нас ошибки выборки);

N – размер генеральной совокупности.

Для удобства существуют уже созданные калькуляторы выборки, использующие данную формулу, которыми можно воспользоваться при необходимости[305].

Парадоксальной на первый взгляд особенностью данной формулы является то, что начиная с определенного момента численность выборки не зависит от размера генеральной совокупности и, например, при заданных параметрах (95 % и 5 %) при любом размере генеральной совокупности теоретически будет достаточно 385 единиц наблюдений. С другой стороны, теория не всегда совпадает с практикой из-за искажений, связанных, например, с неответами респондентов и другими сложностями в реализации идеальной случайной выборки. Также объем выборки обычно увеличивают для того, чтобы подгруппы, по которым планируется анализ, были представлены в объеме, необходимом для достоверного анализа. Например, за необходимый минимальный размер интересующих нас подгрупп в выборке можно взять 30 наблюдений (как границу размера малых выборок) и с опорой на это оценивать необходимый объем всей выборки. Исходя из всего вышесказанного, увеличение объема случайной выборки приветствуется.

Стоит отметить, что обычно указанная формула или расчеты на ее основании встречаются в литературе и на нее ссылаются как на обоснование репрезентативности выборки. При этом авторы таких публикаций зачастую не упоминают, что формула относится исключительно к случайной выборке и если, например, вы опросили просто 400 сотрудников, без рандомизации (обеспечения случайности) их отбора, говорить о «репрезентативности» выборки со ссылкой на данную формулу нельзя.

вернуться

303

См. например: Shackleton N., Von Randow M., Greaves L. Methods of Sampling in Quantitative Health // Researching health: Qualitative, Quantitative and Mixed Methods / M. Saks, J. Allsop (eds.). London: Sage Publications, 2019. P. 235.

вернуться

304

Когда мы не опрашиваем в ходе одного исследования одних и тех же сотрудников (что почти всегда реализуется при опросах).

вернуться

305

Например, калькулятор, созданный авторами. URL: https://niioz.ru/mediko-sotsiologicheskie-issledovaniya/kalkulyatory/ (дата обращения 20.10.2021).