Как сделать обоснование выборки

Добавил пользователь Alex
Обновлено: 04.10.2024

Суть выборочного метода заключается в том, что по определённым правилам из общей численности, так называемой генеральной совокупности, отбирается ограниченное число людей, которое призвано в качестве своеобразной модели воспроизводить структуру объекта. На языке социологов эта группа людей именуется выборочной совокупностью, а процесс её расчёта – выборкой. Дадим определение каждому термину.

Генеральная совокупность – та часть объекта исследования, которая локализована по времени и территориально и на которую мы будем распространять все выводы исследования.

Выборочная совокупность – ограниченное правилами выборки число единиц наблюдения, отбираемых из генеральной совокупности, призванное в качестве своеобразной микромодели воспроизводить структуру генеральной совокупности.

Выборка – процесс отбора единиц наблюдения в состав выборочной совокупности по определённым правилам, определяемым целями и задачами исследования.

Цель отбора респондентов в состав выборки всегда состоит в получении такой совокупности респондентов, которая по своим качествам репрезентует ту, которую мы намереваемся изучить.

Репрезентативность – это свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем генеральной совокупности.

Выделяют две основных группы выборочных методов:

· Вероятностная выборка – это такие методы расчёта выборочной совокупности, для которых каждый элемент генеральной совокупности имеет определённую, заранее заданную вероятность быть отобранным.

· Невероятностная выборка – это такие способы отбора единиц, при которых мы не можем заранее рассчитать вероятность каждого элемента попасть в состав выборочной совокупности, что не всегда даёт возможность рассчитать, насколько репрезентативна выборка.

Вероятностные методы расчёта выборки:

· Лотерейный метод (метод жребия)

· Таблицы случайных чисел

· Метод систематической (механистической) выборки

Методы невероятностной выборки:

· Квотная выборка: создаётся на основе определённых заданных параметров объекта.

· Стихийные выборки: формируются произвольно и часто независимо от самого исследователя.

· Выборка снежного кома: применяется для отбора экспертов и редко встречающихся групп респондентов.

В нашем исследовании использовалась квотная выборка.

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.

Вне зависимости от метода расчета выборки нужно помнить о ключевых параметрах, влияющих на объем выборочной совокупности. Таких параметров мы выделим три – это общий объём, однородность и абсолютная ошибка.

Общий объем генеральной совокупности. Чем больше изучаемая генеральная совокупность, тем больший объем выборки нам может понадобиться для репрезентативного исследования. Однако это утверждение касается лишь определенного числового диапазона! Увеличение выборки идет не пропорционально увеличению генеральной совокупности. Ведь если речь пойдет о генеральной совокупности как о малочисленной величине, исчисляемой десятками и сотнями единиц, то целесообразно предположить, что чем больше будет объем выборки, тем точнее данные. В идеале можно и нужно стремиться, чтобы в таком случае выборка составляла не менее 50%, а то и 2/3 изучаемой генеральной совокупности. Если же (а чаще всего это так и есть) мы имеем дело с генеральными совокупностями, исчисляемыми десятками, сотнями тысяч и миллионами (например, население крупного города, региона, страны), то, конечно же, мы не будем опрашивать ни 50%, ни 25%, ни 10%. Нам понадобится значительно меньшее число участников опроса (респондентов). Стоит отметить, что при сравнении выборки при объеме генеральной совокупности в 100 тысяч и 1 миллион человек, разница в объеме выборки может составить всего несколько десятков респондентов (см. таблицу).

+ В этих случаях достаточным будет более 50% от объема выборки.

Источник: Мангейм Дж.Б., Рич Р.К. Политология: Методы исследования. – М., 1997. С.517.

Однородность генеральной совокупности. В данном случае речь идёт об однородности признаков у единиц генеральной совокупности. То есть чем более схожи между собой единицы генеральной совокупности, тем меньше потребуется объем выборки для представления репрезентативных результатов исследования. Причем под однородностью рассматриваемых признаков мы можем понимать и социально-демографические характеристики (пол, возраст, уровень образования, район проживания, социальное положение), ценностные и социально-политические ориентации, культурно-языковые различия, материальный достаток и т.д.

Размер ошибки (погрешности) выборки. Задачи и характер исследования определяют допустимый размер погрешности полученных данных. Самым оптимальным и часто используемым вариантом при расчете выборки является ошибка в 5%, она позволяет получить данные с высокой степенью репрезентативности и при этом не затратить много ресурсов на опрос излишнего числа респондентов. Для прикладного исследования нормальной будет выборка с ошибкой 4–5%. Ошибка выборки, рассчитываемой ВЦИОМ, ФОМ (для федеральных исследований), находится на уровне не ниже 2,5%. Стандартные выборки МАУ ИРСИ по г. Ярославлю обеспечивает ошибку выборки в диапазоне от 3,6 до 4,8%. Если говорить простым языком о том, что собой представляет ошибка выборки в 5%, то можно представить, что в случае проведения 100 одинаковых исследований по одной и той же теме и с одинаковым объемом выборки в 95 случаях из 100 результаты исследования будут совпадать с мнением всей генеральной совокупности. Однако в определенных случаях требуется снижение ошибки выборки, которое чаще всего производится посредством наращивания объема выборочной совокупности.

В зависимости от имеющихся ресурсов и задач исследования для формирования выборки существует несколько способов. В первую очередь нужно понимать, что отбор единиц в выборочную совокупность может происходить как случайным образом, так и неслучайным. Случайной или вероятностной выборкой можно назвать только ту выборочную совокупность, в которой соблюдается принцип равной вероятности для каждой единицы генеральной совокупности попасть в выборку. Такой способ формирования выборки наиболее актуален для небольшого объема генеральной совокупности, поскольку при изучении больших групп принцип равной вероятности для всех элементов генеральной совокупности соблюсти крайне затруднительно или нецелесообразно, с точки зрения высоких затрат ресурсов. Для соблюдения принципа равной вероятности случайной выборки зачастую используют механический отбор, такой отбор возможен только при наличии полного списка единиц генеральной совокупности, которые можно упорядочить по определенному признаку. В рамках механического отбора из списка выбирается случайным образом первый элемент, который служит отправной точкой, и каждый последующий выбирается через определенный шаг. Размер шага определяется частным размера генеральной совокупности и размера предполагаемой выборки K(шаг) = N(генеральная совокупность)/n(выборочная совокупность).

Другим способом для соблюдения принципа случайности в выборке может быть стратифицированный (районированный) отбор. Данный метод полезен в случае неоднородной генеральной совокупности и подразумевает разделение единиц генеральной совокупности, на более мелкие группы по определенным признакам. Внутри каждой выделенной группы производится отбор единиц в выборочную совокупность случайным образом или при помощи механического отбора. Наиболее корректно использовать этот метод в том случае, когда в результате разделения на группы по выбранным признакам внутри каждой группы образуется небольшое количество единиц, или когда существует полный список единиц каждой выделенной группы, что позволяет в дальнейшем отборе соблюсти принцип равной возможности для каждой единицы попасть в выборку.

Кластерный (гнездовой) отбор является еще одним методом при формировании случайной выборки, в рамках данного метода производиться случайным образом отбор целых групп (кластеров) из генеральной совокупности. Впоследствии производится отбор единиц из кластеров в выборочную совокупность, в зависимости от объема кластера это могут быть как и все единицы кластера, так и часть из них, отобранная случайным образом. Например, в случае отбора по территориальному признаку кластером могут служить населенные пункты, отобранные в случайном порядке. В зависимости от количества населения производится опрос всех жителей или только жителей, отобранных случайным образом. При наличии полного списка единиц в каждом кластере возможен отбор единиц с применением механического отбора.

Наиболее предпочтительным выглядит вариант с использованием квотной выборки. Суть данного метода сводится к тому, чтобы выделить несколько интересующих социальных групп по признакам, обусловленным задачами исследования. Далее необходимо рассчитать объем респондентов для опроса в каждой группе, то есть объем квоты для каждой группы, руководствуясь сохранением пропорций признаков генеральной совокупности в выборке. На примере гендерной характеристики можем представить, что если в генеральной совокупности соотношение женщин и мужчин 55% на 45%, то именно такое же соотношение женщин и мужчин должно быть в рамках выборочной совокупности.

Еще одним методом отбора для построения неслучайной выборки является метод основного массива, который подразумевает отбор единиц, имеющих наибольшую удельную значимость, по мнению исследователя; и если существует возможность, то отбирается абсолютное большинство единиц из генеральной совокупности. Данный метод может быть полезен, когда объектом для изучения являются узкая категория людей, специалисты той или иной отрасли. В случае необходимости проведения опроса, например среди медработников в регионе, отбирается несколько наиболее крупных медицинских учреждений как имеющих наибольший вес, и проводится опрос медработников данных учреждений. Но если количество медучреждений не столь велико, и возможен охват абсолютного большинства медработников, то проводится опрос более 50% медицинских работников региона.

Существует еще несколько вариантов составления выборочной совокупности, некоторые методы являются комбинированием уже перечисленных, но хотелось бы рассмотреть применение наиболее оптимальных методов построения выборки на примере населения г. Ярославля. Золотым стандартом, на наш взгляд, при проведении исследования, где в качестве генеральной совокупности выступают все жители Ярославля, является применение квотной выборки. Мы используем при расчете квот трехмерное распределение, а именно распределение по половому признаку, возрасту и району проживания, что позволяет в рамках выборочной совокупности повторить пропорции генеральной совокупности по указанным признакам. Такой подход позволяет учесть мнение всех категорий жителей Ярославля: мужчин и женщин, молодежи, работающего населения, пенсионеров, жителей всех районов города. При этом сохраняется удельная значимость каждой из указанных категорий так же, как в генеральной совокупности. Как это выглядит? Например, если в Ярославле в Дзержинском районе проживает гораздо больше жителей города, чем в Кировском районе города, то мнение жителей Дзержинского района имеют гораздо большее влияние на формирование мнения всего населения города, чем мнение жителей Кировского района. Наша задача состоит в том, чтобы сохранить подобную пропорциональность генеральной совокупности в рамках выборки. Если говорить о конкретных цифрах, то для репрезентативных результатов мнения жителей города с населением более чем 600 тыс. при использовании квотной выборки и соблюдением ошибки не более 5% достаточно опросить 400 человек. В случае, когда проблема исследования носит более дифференцированный характер, и предполагается, что данная проблема может затрагивать различные категории жителей по-разному, целесообразно расширить объем выборки до 500-600 человек.

В случае, когда проблема исследования носит общий или даже глобальный характер, и предполагается, что дифференциация по полу и возрасту, району проживания вряд ли может серьезно оказывать влияние на мнение респондента, может использоваться метод стихийной выборки. Метод стихийного отбора позволяет существенно сократить время и ресурсы на проведение исследования, однако в таком случае рекомендуется расширить объем выборки до 600, а в некоторых случаях до 750 или даже 1000 человек, чтобы минимизировать вероятность потери какой-либо категории респондентов в процессе проведения опроса.

Подводя итог, хочется сказать о том, что грамотно составленная выборка на сегодняшний день — это ключ к оперативному получению достоверной и актуальной информации, которая поможет в принятии правильных управленческих решений. Главное достоинство использования выборки — это, конечно же, экономия времени и трудовых ресурсов. Получаемая информация с течением времени и в зависимости от происходящих процессов в обществе может быстро терять актуальность и уже не отражать полной картины социальной реальности, что в свою очередь может повлечь принятие ошибочных решений. Отсюда можно сделать вывод о том, что исследование, задачей которого является получение объективной информации о текущем положении дел, проведенное в кротчайшие сроки с использованием грамотно составленной выборки, даст более актуальную информацию и объективную картину, чем исследование с большим охватом опроса в 6, 10, 15 и более тысяч человек. Исследование с бОльшим охватом респондентов требует бОльшего времени для проведения опроса, за этот период положение дел может значительно измениться, и ответы, полученные в начале исследования, могут к его окончанию стать устаревшими и неактуальными; как итог — будет потерян весь смысл такого исследования. Желаете получить достоверную, актуальную и надежную информацию по вашей проблеме в результате проведения социологического исследования? Специалисты МАУ ИРСИ помогут вам в этом!

Объектом исследования явилось молодое население Владивостока в возрасте от 18 до 35 лет. Выборочная совокупность в 30 человек гарантирует статистически значимые результаты опроса. Возрастные границы выборки формировались с учетом тенденции сдвига верхней возрастной границы молодежи к 35 годам. С учетом характера формирования объекта исследования основной массив опрошенных составили учащиеся и студенты образовательных учреждений Владивостока (колледжи, институты, университеты), а также выпускники вузов и специалисты. Соотношение опрошенных по возрасту, образованию и семейному положению представлены на рисунках 2.1 - 2.3. По гендерному соотношению - мужчин и женщин было одинаковое число (по 15 человек).

Рис. 2.1 Соотношение респондентов по возрасту

По возрасту, среди респондентов наибольшее преобладание составила категория молодых людей в возрасте от 19 - 30 лет - 50%, 32 % составили люди от 18 - 25. Наименьшее число, среди опрощенных - от 31 - 35 лет.

Рис. 2.2 Соотношение респондентов по образованию

Рис. 2.3 Соотношение респондентов по семейному положению

Анализируя планы юношей и девушек на перспективу, стоит обратить внимание на социальное самочувствие молодежи. Данное понятие характеризует общее мироощущение человека, общую оценку им своей жизни, отражает уровень социального оптимизма или пессимизма.

Тревожные настроения более характерны для девушек (14,6%), чем для юношей (6,4%). Юноши лидируют в спокойном восприятии будущего (25,6%), тогда как у девушек аналогичный показатель составляет 15,8%.

Среди выделенных потребностей получение образования удовлетворено в максимальной степени у пятой части молодежи 21,2%, в хорошей степени у 46,2%, средне - у 25,6%, низко - у 5,2%.

Интересно, что для девушек это более важно, чем для юношей (46,6 % и 39,7% соответственно). Для 25,4% выбор места учебы связан со стремлением стать квалифицированными специалистами. Менее значим мотив стать просто образованными людьми с широким кругозором, хорошим культурным уровнем (19,8%).

Читайте также: