<<

стр. 16
(всего 35)

СОДЕРЖАНИЕ

>>

различий между слоями, обычно создают одинаковые по объему выборки из каждого слоя.
Стратификационный метод обеспечивает наличие в выборке всех важных подгрупп, Это
особенно важно, если исследуемая характеристика неравномерно распределена среди элемен-


426 Часть II. Разработка плана исследования
тов генеральной совокупности. Например, распределение дохода семей неравномерно, так как
годовой доход большинства семей составляет меньше 50 тысяч долларов, и лишь немногие се-
мьи имеют годовой доход, равный 125 тысяч долларов и выше. Если применить простую слу-
чайную выборку, семьи с доходом 125 тысяч долларов и выше могут не быть адекватно пред-
ставлены. Стратифицированная выборка позволяет обеспечить соответствующее количество
таких семей в выборке. Она сочетает в себе простоту метода SRS с возможностью повышения
точности. Поэтому данный метод формирования выборки весьма популярен.

Кластерная выборка
В кластерной выборке (cluster sampling) изучаемая совокупность сначала делится на взаимо-
исключающие и взаимодополняющие подгруппы, или ююстеры (dusters). Затем с помощью ве-
роятностного метода выборки, такого как SRS, формируется случайная выборка кластеров. В
выборку включаются либо все элементы отобранного кластера, либо проводится их отбор веро-
ятностным методом, Если в выборку включаются все элементы каждого отобранного кластера,
то такая процедура называется одноступенчатой кластерной выборкой. Если выборка получена
с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называет-
ся двухступенчатой кластерной выборкой. Как показано на рис. 11.3, существуют два вида
двухступенчатой кластерной выборки — простая двухступенчатая кластерная выборка с ис-
пользованием SRS и вероятностная выборка, пропорциональная объему (PPS). Кроме того,
кластерная выборка может состоять из нескольких (больше двух) этапов, выступая как много-
ступенчатая кластерная выборка.

Кластерная выборка (cluster sampling)
Сначала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие
подгруппы, называемые кластерами. Затем с помощью вероятностного метода выборки, та-
кого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все
элементы отобранного кластера, либо проводится их отбор вероятностным методом.


Кластерная выборка

1,
4
Одноступенчатая Даухступенча




Вероятностная выборк
эрционаяьнаж

Рис. 11.3. Типы кластерной выборки

Основное различие между кластерной и стратифицированной выборкой состоит в том,
что в первом случае используются только отобранные подгруппы (кластеры), в то время как
в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбо-
ра. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффектив-
ность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки —
увеличение точности. По однородности и неоднородности критерии формирования класте-
ров прямо противоположны критериям формирования слоев. Элементы кластера должны
быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале
каждый кластер должен представлять собой небольшую модель генеральной совокупности.
При кластерной выборке основа выборочного наблюдения необходима только для кластеров,
которые вошли в выборку.

Глава 11. Выборка: планирование и проведение 427
Распространенная форма кластерной выборки — территориальная выборка (area sampling), в
которой кластеры состоят из географических территорий, таких как округа, жилые районы или
кварталы. Если отбор основных элементов проводится в один этап (например, исследователь
выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в вы-
борку), такой выборочный метод называется одноступенчатой территориальной выборкой. Ес-
ли отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает
кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выбор-
ку), такой метод называется двухступенчатой (или многоступенчатой) территориальной вы-
боркой. Отличительная черта одноступенчатой территориальной выборки заключается в том,
что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.

Территориальная выборка (area sampling)
Распространенная форма кластерной выборки, в которой кластеры состоят из округов, хи-
лых районов, кварталов или других географических территорий.

Как показано на рис. 11.3, существует два типа двухэтапной кластерной выборки. В одном
из них метод SRS применяется как на первом этапе (т.е. при выборе кварталов), так и на втором
(т.е. при отборе семей в кварталах). Этот метод называется простой двухступенчатой кластерной
выборкой. При использовании этого метода количество элементов (семей), отобранных на вто-
ром этапе, одинаково для каждого выбранного кластера (отобранного квартала). Следующий
пример иллюстрирует применение двухступенчатой территориальной выборки.

Пример. Богатые кварталы
Цель проекта маркетингового исследования — изучить поведение богатых покупателей.
С помощью простой случайной выборки отобрано 800 кварталов из перечня округов, жители
которых имеют средний доход, превышающий 50 тысяч долларов. Отбор проводился в шта-
тах, население которых, по данным переписи, представляет собой половину населения стра-
ны с наибольшим уровнем доходов. Маркетологи получили перечень фамилий и адресов
глав приблизительно 95% семей, зарегистрированных во время переписи в этих 800 кварта-
лах. Из 213 тысяч перечисленных семей 9тысяч были отобраны с помощью простой случай-
ной выборки (24].

Этот метод подходит в том случае, когда все кластеры равны по объему, т.е. каждый кла-
стер содержит примерно одинаковое количество единиц. Однако, если объемы различны,
простая двухступенчатая кластерная выборка может привести к ошибочным результатам.
Иногда, объединив различные кластеры, можно сделать их равными по объему. Если объе-
динить кластеры нельзя, следует воспользоваться вероятностной выборкой, пропорцио-
нальной объему (PPS).
При вероятностной выборке, пропорциональной объему (Probability Proportionate to size
Sampling— PPS) кластеры отбираются с вероятностью, пропорциональной их объему. Объем
кластера определяется количеством входящих в него единиц выборки. Поэтому на первом эта-
пе большие по объему кластеры имеют большую вероятность включения в выборку. На втором
этапе вероятность отбора единицы из выбранного кластера обратно пропорциональна его объе-
му. Поэтому вероятность включения в выборку будет равной для всех выборочных единиц, по-
скольку неравная вероятность включения на первой стадии отбора компенсируется неравной
вероятностью включения на второй стадии.

Вероятностная выборка, пропорциональная объему (Probability Proportionate to size
Sampling — PPS)
Метод отбора, согласно которому кластеры выбираются с вероятностью, пропорциональной
их обьему, а вероятность выбора единицы из отобранного кластера обратно пропорцио-
нальна его объему.



428 Часть II. Разработка плана исследования
Кластерная выборка обладают двумя основными преимуществами — выполнимость и низ-
кая себестоимость. Во многих ситуациях единственными легко доступными инструментария -
ми для изучения совокупности будут не элементы, а кластеры. Часто невозможно составить
список всех потребителей, входящих в состав определенной совокупности, принимая во вни-
мание ресурсы данного исследования и связанные с ним ограничения. Однако перечень гео-
графических территорий, телефонных кодов определенного района и других кластеров потре-
бителей получить довольно легко. Кластерная выборка наиболее эффективна с точки зрения
затрат. Однако несмотря на это преимущество, ей присущ ряд ограничений. В результате отбора
по кластерам создаются относительно неточные выборки. Кроме того, сложно сформировать
неоднородные кластеры, так как, например, семьи, живущие в одном квартале, имеют больше
схожих признаков, чем различий [25]. После кластерной выборки сложно рассчитать и оценить
статистику. Все преимущества и недостатки основных методов формирования выборки, в том
числе преимущества и недостатки кластерной выборки, приведены в табл. 11.3. Рис. 11.4 опи-
сывает процедуры формирования вероятностных выборок.

Таблица 11,3. Преимущества и недостатки основных методов формирования выборки
Метод Преимущества Недостатки

Детерминированная выборка
Нерепрезентативная выборка Наименьшая стоимость Необъективность отбора;
Наименьшая продолжительность выборка нерепрезентатаана; не рекомен-
ется
Наибольшее удобство отбора элементов ^ при проведении дескриптивного
или причинно-следственного исследова-
ния
Поверхностная выборка Не позволяет распространять полученные
Низкая стоимость,
результаты на генеральную совокупность;
удобство, небольшая продолжительность
субъективна
Квотная выборка Может регулироваться по определенным Необъективность отбора;
характеристикам не гарантирует репрезентативности
Позволяет оценить необычные для сово- Большая продолжительность
Выборка по принципу
"снежного кома" купности характеристики
Вероятностная выборка
Простая случайная выборка Сложно создать основу выборочного на-
Проста для понимания;
блюдения;
(SRS) результаты можно распространить на
генеральную совокупность большие затраты на проведение; низкая
точность;
не гарантирует репрезентативности
Позволяет увеличить репрезентатив- Может уменьшить репрезентативность
Систематическая выборка
ность; проще в применении, чем SRS; не
требуется основа выборки
Сложно выбрать подходящие переменные
Стратифицированная выборка Включает все важные подгруппы сово-
купности; для стратификации;
невозможно стратифицирование с учетом
высокая точность
многих переменных; большие затраты на
проведение
Легка в применении; Низкая точность;
Кластерная выборка
эффективна с точки зрения затрат сложно рассчитать и оценить результаты




429
Глава 11. Выборка: планирование и проведение
Простая случайная выборка
1. Выберите подходящую основу выборки.
2. Каждому элементу присвойте номер от 1 до Л' (объем целевой совокупности).
3. Выберите с помощью компьютера или таблицы простых случайных чисел (см. табл. J в
Приложении "Статистические таблицы") п (объем выборки) различных случайных чисел
между I к N. Для того чтобы воспользоваться табл. 1, выберите соответствуюшее количе-
ство разрядов (например, если N = 500, выберите три разряда). Произвольно выберите
первое число. Затем продолжите отбор по возрастанию или убыванию, пока не будет ото-
брано л-е количество разных чисел между 1 и Ж Обратите внимание, что нельзя выбирать
О, числа, больше N, и одинаковые числа.
4. Полученные числа будут порядковыми номерами элементов совокупности, которые
должны включаться в выборку.

Систематическая выборка
1. Определите подходящую основу выборки ,
2. Присвойте каждому элементу номер от 1 до N (объем популяции),
3. Определите интервал выборки, i, i = N/n. Если / — дробь, округлите ее до ближайшего це-
лого числа.
4. Выберите случайное число г между 1 и i, как для простои случайной выборки.
5. Систематическая случайная выборка состоит из элементов со следующими порядковыми
номерами: г, г + /, г + Д г + ,?/,/• + 41, ..., г+ (я-1)/.

Стратифицированная выборка
1. Выберите подходящую основу выборки.
2. Выберите переменную(ые) для стратификации и количество слоев, Н.
3. Разделите всю совокупность на Я слоев. Каждый элемент совокупности будет относиться
к одному из Н слоев на основе классификационной переменной.
4. Пронумеруйте в каждом слое элементы числами от 1 до Nk (объем популяции слоя А).
5. Определите для каждого слоя nh объем выборки при условии пропорциональной или не-
пропорциональной стратифицированной выборки.
Обратите внимание,
и



6. Создайте в каждом слое простую случайную выборку объема nh.

Кластерная выборка
Мы опишем процедуру создания двухступенчатой выборки PPS, так как этот метод при
меняют в большинстве случаев.
1. Присвойте номер от 1 до TV каждому элементу совокупности.
2. Поделите совокупность на С кластеров, из которых с будет включено в выборку.
3. Рассчитайте интервал выборки /, / = N/n. Если / — дробь, округлите ее до ближайшего це
лого числа.
4. Выберите случайное число г между 1 и /, как было сделано для простой случайной выборки.
5. Найдите элементы со следующими номерами: г, /• + /, r + 2i,r + 3i, ,.., r+ (c-1)/.
6. Выберите кластеры, в которые входят указанные элементы.


430 Часть II. Разработка плана исследования
7. Выберите единицы выборки из каждого отобранного кластера методом SRS или система-
тической выборкой. Количество единиц, отобранных из каждого кластера, приблизи-
тельно одинаково и равно п/с.
8. Если популяция кластера превышает интервал выборки /, этот кластер отбирается со
100-95 вероятностью и в дальнейшем не рассматривается. Рассчитайте новый объем попу-
ляции N*, количество кластеров, подлежащих отбору с* (= с - 1), и новый интервал вы-
борки ("*. Повторяйте эту процедуру до тех пор, пока в выборке не останутся только те кла-
стеры, популяция которых меньше, чем рассчитанный интервал выборки. Если Ь класте-
ров выбрано со 100-% вероятностью, отберите оставшиеся с˜Ь кластеров в соответствии с
пп. 1—7. Доля единиц, подлежащих отбору из каждого выбранного со ЮО-% вероятно-
стью кластера, равна n/N. Таким образом, из кластеров, отобранных со ЮО-% вероятно-
стью, получаем п = (n/N) (N, + N2 + ... + Nh) единиц. Следовательно, количество единиц,
полученных из кластеров, отобранных методом PPS, составит п* — п — пг.

Рис. 11.4. Процедуры создания вероятностных выборок


Другие методы вероятностной выборки
Кроме четырех основных, существует множество других методов вероятностной вы-
борки, большинство из которых — разновидности базовых. Они разработаны для решения
сложных проблем, возникающих в процессе выборки. Среди них определенную важность
для маркетинговых исследований представляет метод последовательной выборки и метод
двойного контроля,
При последовательной выборке (sequential sampling) отбор элементов генеральной сово-
купности проводится последовательно, при этом на каждом этапе собирается и анализирует-
ся информация и принимается решение о дополнительном отборе элементов популяции.
Объем выборки изначально не известен, однако, перед тем как начинать отбор, исследовате-
ли устанавливают критерии формирования выборки. На каждом этапе отбора такие крите-
рии определяют, продолжать выборку или получено достаточно информации. Метод после-
довательной выборки использовался, чтобы определить, какую из альтернатив предпочтут
потребители. В одном из опросов респондентов спросили, какую из альтернатив они пред-
почитают, и процесс отбора прекратили, когда собрали достаточно информации для опреде-
ления предпочтений потребителей. Этот метод также применялся для установления ценовой
разницы между обычной и усовершенствованной моделями потребительских товаров дли-
тельного пользования [26].

Последовательная выборка (sequential sampling)
Метод вероятностный выборки, согласно которому отбор элементов генеральной сово-
купности проводится последовательно, на каждом этапе собирается и анализируется ин-
формация и принимается решение о дополнительном отборе элементов генеральной со-
вокупности.

При использовании метода двойного контроля (double sampling), который еще называют ме-
тодом двухэтапнои выборки, некоторые элементы популяции отбираются дважды. На первом
этапе проводится выборка и собирается некоторое количество информации обо всех ее элемен-
тах. На втором этапе из элементов начальной выборки создается подгруппа и дальнейшая ин-
формация собирается уже об ее элементах. Этот процесс может состоять из трех или больше
этапов, и различные этапы могут проводиться как одновременно, так и в разное время. Метод
двойного контроля полезен, когда нельзя сразу воспользоваться основой выборки для отбора
конечных элементов выборки, но известно, что его элементы входят в более полную основу вы-
борки. Например, исследователь хочет отобрать в определенном городе семьи, которые пьют
яблочный сок. Исследуемые семьи входят в совокупность всех городских семей, но исследова-


Глава 11. Выборка: планирование и проведение 431
тель не знает, какие из них любят яблочный сок. При применении метода двойного контроля
маркетолог на первом этапе создает основу выборочного наблюдения, состоящую из всех семей.
Основу выборки можно приобрести или составить, воспользовавшись городской адресной
книгой. Далее методом систематического случайного выбора проводится отбор семей для опре-
деления количества купленного яблочного сока. На втором этапе будут отобраны семьи, упот-
ребляющие яблочный сок, и стратифицированы в соответствии с количеством потребляемого
яблочного сока. Затем создается стратифицированная случайная выборка и задаются детальные
вопросы относительно потребления яблочного сока [27].

Метод двойного контроля (double sampling)
Метод выборки, в соответствии с которым некоторые элементы совокупности отбираются
дважды.


Выбор между детерминированной
и вероятностной выборкой
Решение о применении детерминирошнного или вероятностного метода выбора элемен-
тов изучаемой совокупности должно приниматься на основе таких факторов, как характер
исследования, относительная величина систематических ошибок и ошибки выборки, из-
менчивость совокупности, а также на основе статистических и операционализационных со-
ображений (табл. 11.4). Например, в поисковых исследованиях полученные данные счита-
ются предварительными, а применение вероятностной выборки необоснованным. С другой
стороны, вероятностная выборка предпочтительна в итоговом исследовании, в котором ис-
следователь использует полученные результаты для оценки доли рынка. Вероятностная вы-
борка позволяет осуществить статистическое распространение полученных результатов на
изучаемую совокупность.
В ряде случаев маркетинговое исследование требует повышенной точности при оценке
характеристик совокупности. При этом желательно применение вероятностной выборки,
которая поможет избежать необъективного отбора и рассчитать ошибку выборки. Однако
применение вероятностной выборки не всегда дает точные результаты. Если исследование
характеризуется большой величиной систематических ошибок, детерминированная вы-
борка предпочтительнее, поскольку суждения исследователя позволяют лучше контроли-
ровать выборочный процесс.
Еще один фактор — однородность совокупности с учетом исследуемых переменных.
В неоднородной совокупности предпочтительнее вероятностный метод, поскольку в данном
случае важно сохранить представительность выборки. Вероятностная выборка предпочти-
тельнее с точки зрения статистики, так как она лежит в основе наиболее распространенных
статистических методов.

Таблица 11.4. Детерминированная и вероятностная выборка: за и против
Условия, благоприятные для использования
Факторы детерминированной выборки вероятностной выборки
Природа исследования Поисковой Итоговое
Относительное соотношение между величи- Систематическая ошибка больше Ошибки выборки больше
ной систематических ошибок и ошибок вы-
борки
Изменчивость изучаемой совокупности Низкая Высокая
Статистические соображения Неблагоприятные Благоприятные
Операционализационные соображения Благоприятные Неблагоприятные



432 Часть II, Разработка плана исследования
Однако применение вероятностной выборки сопряжено со сложностями и требует от ис-
следователей более высокого уровня статистической подготовки. Она, как правило, более доро-
гостоящая и занимает больше времени, чем детерминированная выборка. При проведении
маркетинговых исследований часто сложно доказать обоснованность дополнительных затрат
времени и денег. Поэтому на практике обоснование того или иного метода выборочного на-
блюдения определяется задачами исследования.

Применение детерминированного
и вероятностного методов выборки
Детерминированная выборка используется при тестировании идеи нового товара, упаковки
и названия продукции, а также анализе эффективности рекламы, для которых обычно не тре-
буется распространение результатов на всю целевую совокупность. Предметом таких исследо-
ваний является определение различных частей выборки, члены которых дают различные отве-
ты или выражают различные мнения. При создании выборки для этих исследований исполь-
зуются такие методы, как интервью-"перехваты" в торговых центрах с использованием
квотной выборки.
С другой стороны, вероятностная выборка применяется, когда необходимо точно опреде-
лить рыночную долю компании или объем продаж на всем рынке. Вероятностная выборка ис-
пользуется в исследованиях общенационального рынка, которые предоставляют информацию
по категориям продуктов и частоте использования различных торговых марок, а также о психо-
логических и демографических характеристиках потребителей. Исследования с использовани-
ем вероятностной выборки обычно применяются в телефонных опросах. При использовании
стратифицированного и систематического методов для отбора респондентов применяют слу-
чайный набор телефонных номеров.

Международные маркетинговые исследования
При проведении международных маркетинговых исследований составление плана выбо-
рочного наблюдения нередко вызывает затруднения. При определении изучаемой совокупно-
сти следует учитывать ряд факторов. Элементы, соответствующие критериям отбора
(респонденты), могут отличаться друг от друга в разных странах. Так, в Соединенных Штатах
Америки дети играют важную роль при покупке детских сухих завтраков. Однако в странах, где
господствуют авторитарные методы воспитания, элементом, соответствующим критериям от-
бора, будет мать. В Соединенных Штатах Америки женщины играют главную роль при покуп-
ке автомобилей и других товаров длительного пользования, а в странах, где господствующее
положение в обществе занимают мужчины, например на Ближнем Востоке, такие решения
принимают именно они. Доступность респондентов при проведении наблюдения в разных
странах различна. Например, в Мексике посторонние не могут запросто входить в дома людей,
принадлежащих к высшему классу, которые ограждены высокими стенами и охраняются мно-
гочисленными слугами. Кроме того, нумерация жилых домов и названия улиц могут отсутст-
вовать, что значительно затрудняет поиск выбранных семей [28].
Создание подходящей основы выборки — также сложная задача. Во многих странах, осо-
бенно в развивающихся, нельзя получить достоверную информацию об изучаемой совокупно-
сти из вторичных источников. Официальные данные отсутствуют или выглядят довольно тен-
денциозно. Списки населения могут отсутствовать в продаже. Временные и денежные затраты,
необходимые для составления этих списков, непомерно высокие. Так, в Саудовской Аравии
отсутствует официально признанная перепись населения; нет выборов, а следовательно, нет
бланков регистрации участников голосования; отсутствуют точные карты с указанием центров
расселения. В данной ситуации интервьюеры могут получить указания начать с заданной от-
правной точки и отбирать каждый л-й жилой дом до тех пор, пока не будет отобрано опреде-
ленное количество единиц.


Глава 11. Выборка; планирование и проведение 433
Принимая во внимание отсутствие подходящей основы выборки, недоступность некоторых
групп респондентов, например женщин в ряде стран, преобладание индивидуального опроса
при проведении исследований, вероятностные выборочные методы редко используются при
проведении международных маркетинговых исследований. Квотная выборка нашла широкое
применение при проведении потребительских и бизнес-опросов, как в развитых, так и в раз-
вивающихся странах. Выборка по принципу "снежного кома" особенно уместна в случаях, ко-
гда исследуемая характеристика необычна для изучаемой совокупности или обращение к рес-
пондентам затруднено. Например, в Саудовской Аравии студентам предложили передать анке-
ты своим родственникам и друзьям. Затем первых участников опроса попросят передать анкету
другим потенциальным респондентам и т.д. Результатом применения этого метода станет уве-
личение объема выборки и коэффициента отклика.
Точность, достоверность и стоимость проведения выборочного наблюдения варьируют в за-
висимости от исследуемой страны. Даже если одна и та же процедура выборки применяется во
всех странах, результаты не подлежат сравнению [29]. Чтобы сравнивать структуру и представи-
тельность выборок, желательно использовать различные методы выборки в разных странах, как
это показано на следующем примере.

Пример. Сравнение выборок, полученных различными методами
Проведенное в Соединенных Штатах Америки исследование показало, что большин-
ство покупателей считают, что покупка товаров и услуг сопряжена с определенной степе-
нью риска, когда они вынуждены делать выбор в пользу одной из торговых марок. Ре-
зультаты исследования, проведенного в США, нужно было сравнить с результатами ис-
следований, проведенных в Мексике, Нидерландах, Турции, Таиланде и Саудовской
Аравии. Изучаемыми респондентами в этих странах выбраны женщины, живущие в
крупных городах и имеющие высокий и средний уровень дохода. Однако в разных стра-
нах применялись различные методы выборки. В Соединенных Штатах Америки для от-
бора респондентов воспользовались случайной выборкой из телефонного справочника.
В Мексике для определения районов проживания респондентов применили поверхност-
ную выборку, основанную на мнении специалистов; затем произвольно выбрали дома
для индивидуальных опросов. В Таиланде также применялась поверхностная выборка, но
исследование проводилось в крупных городах и респонденты отбирались из числа поку-
пателей магазинов. Наконец, в Саудовской Аравии применялся нерепрезентативный от-
бор, в соответствии с которым привлечение респондентов происходило по принципу
"снежного кома". Это было связано с тем, что отсутствовал перечень, из которого можно
было сформировать основу выборки, а общественные традиции запрещали проведение |
стихийных индивидуальных опросов. Таким образом, сравнимость структуры и предста-
вительности выборок была достигнута благодаря применению различных методов выбор- ;
ки в разных странах [30].



ЭТИКА МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЙ
В ходе проведения выборочного наблюдения исследователь несет определенную этическую
ответственность перед заказчиком и респондентами. В отношении заказчика исследователь
должен разработать такой план выборочного наблюдения, который позволил бы снизить уро-
вень систематических ошибок и ошибок выборки (см. главу 3). При необходимости следует
использовать вероятностную выборку. При использовании детерминированного метода усилия
должны быть направлены на получение репрезентативной выборки. Непрофессиональным и
ошибочным считается подход к детерминированной выборке как к вероятностной и распро-
странение ее результатов на всю изучаемую совокупность. Как показывает следующий пример,
правильное определение генеральной совокупности и основы выборочного наблюдения, а так-
же применение соответствующего выборочного метода— необходимые условия грамотного
проведения исследования и использования полученных результатов.


434 Часть II. Разработка плана исследования
Пример. Систематическая выборка выявляет типичные различия в нравствен-
ных суждениях мужчин и женщин
Для выявления различий во мнениях об этике исследований между маркетологами —
мужчинами и женщинами, были получены данные от 420 респондентов. Генеральной сово-
купностью выбраны специалисты по маркетингу, а основой для проведения выборочного
наблюдения послужил справочник Американской ассоциации маркетинга. Респонденты
отбирались из справочника на основе систематической выборки. Им прислали вместе с ан-
кетой сопроводительное письмо и конверт с маркой и обратным адресом, а также обещали
снабдить каждого из них копией заключения о результатах исследования. Результаты опроса
маркетологов показали, что женщины демонстрируют, как правило, профессиональную
этичность выше, чем их коллеги мужчины [31].

При исследованиях корпоративного сектора, опросах служащих, а также в других исследо-
вательских проектах, в которых объем совокупности незначителен, исследователи должны осо-
бенно внимательно охранять анонимность респондентов. При небольшом объеме совокупно-
сти узнать респондентов легче, чем при большой. Слишком откровенные детали исследования
или дословное цитирование респондентов в отчетах, предоставляемых заказчику, могут под-
вергнуть риску анонимность респондентов. В таких случаях профессиональная этика обязыва-
ет исследователя сохранить анонимность респондента, даже если это снизит уровень детализа-
ции в отчетах, предоставляемых клиенту и другим сторонам.


ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА
Отбор потенциальных респондентов в сети Internet имеет смысл, если сформированная та-
ким образом выборка является репрезентативной по отношению к изучаемой совокупности.
Все больше и больше сфер бизнеса отвечают этому требованию. При проведении количествен-
ных исследований, например опросов по поводу программного обеспечения, компьютеров,
компьютерных сетей, технических изданий, полупроводников и высшего образования, удоб-
нее становится отбор респондентов в сети Internet. При проведении опроса в компании заказ-
чика удобен "внутрисетевой" опрос, так как даже те служащие, которые не имеют доступа к
Internet, обычно пользуются обшей системой электронной почты. Однако отбор респондентов с
помощью Internet не в полной мере применим в исследованиях потребительских товаров, не
связанных с компьютерами.
Чтобы избежать ошибок при формировании выборки, исследователь должен иметь воз-
можность контролировать совокупность, из которой отбираются респонденты. Также следует
убедиться, что респонденты не отвечают больше одного раза, Этим требованиям удовлетворяют
опросы, проводимые по электронной почте, в которых исследователь выбирает определенных
респондентов. Более того, анкеты можно запрограммировать таким образом, чтобы возвращае-
мые ответы автоматически сопоставлялись с соответствующим исходящим электронным сооб-
щением. Это условие также выполняется в Web-опросах, где отобранным респондентам по
электронной почте посылаются приглашения с просьбой посетить Web-сайт, на котором про-
водится опрос. В таком случае опрос проводится на скрытой, защищенной паролем странице в
Internet. Таким образом, другие пользователи Internet не имеют к ней доступа.
При проведении исследований в Internet могут использоваться как детерминированные,
так и вероятностные методы выборки. Кроме того, респондентов можно отобрать предвари-
тельно или подключить к опросу в онлайновом режиме. Подключение к опросу посетителей
Web-сайта— один из примеров нерепрезентативной выборки. Для предварительного отбора
респондентов можно установить некоторые отборочные критерии, основанные на мнении ис-
следователя. Более того, можно установить квоты. Однако степень их соответствия структуре
совокупности будет ограничена числом, а также характеристиками посетителей узла.
Повсеместно используется также простая случайная выборка, Во избежание получения ин-
формации от одних и тех же профессиональных респондентов (в данном случае слово профес-


Глава 11. Выборка: планирование и проведение 435
сионольные означает, что респонденты участвуют во множестве онлайновых опросов для накоп-
ления очков) и создания таким образом непредставительной выборки, некоторые компании, в
частности MBinteractive, используют метод "прерывания потока нажатий". В соответствии с
этим методом произвольно отбираются пользователи, работающие в режиме on-line, и им пре-
доставляется возможность участвовать в опросе или отказаться от него. Результатом примене-
ния этого метода стал 75%-ный коэффициент отклика (по сравнению с 60%-ным коэффици-
ентом отклика при проведении опроса по телефону). Можно использовать и другие формы ве-
роятностной выборки, причем некоторые из них, например систематическая случайная
выборка, относительно просты в применении.

f Пример. Выборка в Internet
SurveySite ˜ это компания, предоставляющая все виды исследовательских услуг, которая
расположена в Онтарио (Канада) (www.surveysite.com). Цель создания компании —
"разработка наилучших и передовых систем анализа эффективности Web-сайтов, а также
предоставление услуг по исследованию рынка для Internet-компаний". Цель компании
сформулирована как "абсолютное лидерство в проведении качественных исследований Web-
пространства и аналитике посетителей страниц Internet".
Одна из исследовательских программ, предлагаемых компанией SurveySite,— "Pop-Up
Survey". Программа считает количество людей, посетивших Web-сайт и выбирает посетите-
лей с заданной периодичностью. Например, с помошью систематической случайной выбор-
ки выбирается каждый 100-й пользователь, посетивший Web-сайт клиента. Когда это про-
исходит, на экране появляется сообщение, в котором пользователю предлагается заполнить
небольшую онлайновую анкету. Если посетитель нажимает "Нет", сообщение исчезает, по-
сле чего возможно продолжение просмотра. При нажатии "Да" появляется составленная
клиентом анкета.
Преимущество такой "раскрывающейся" модели в том, что она существенно повышает
коэффициент отклика пользователей. В обычном исследовании на экране появляется заго-
ловок, который приглашает пользователя пройти опрос, Однако коэффициент отклика при
использовании заголовков очень низок: 0,2%, или 1 из каждых 500 посетителей.
"Раскрывающаяся" модель опроса компании SurvaySite значительно повышает коэффици-
ент отклика и сокращает время, затрачиваемое на сбор информации, которое исчисляется в
этом случае не неделями, а днями [32].

Использование компьютеров делает составление плана выборочного наблюдения более эф-
фективным и результативным. Компьютеры используются для определения основы выборки,
поскольку они способны обрабатывать большие перечни элементов совокупности и географи-
ческие карты. Компьютеры могут применяться при создании необходимой выборки с исполь-
зованием детерминированных или вероятностных методов. После определения основы выбо-
рочного наблюдения можно воспользоваться различными программами моделирования для
генерации случайных чисел и проведения отбора непосредственно из базы данных. Для реше-
ния этих задач применяют программы SPSS, SAS или BMDP (для работы с микрокомпьютера-
ми и обычными ЭВМ), Minitab, Excel. Специализированные программы, например Genesis,
отбирающие респондентов для телефонного опроса, дают исследователю возможность создавать
выборку из случайных телефонных номеров (RDD), в то же время избегая набора нерезульта-
тивных номеров в процессе исследования.



Специалисты компании Burke используют различные методы выборки в зависимости от
характера и задач маркетинговых исследований. Один из наиболее распространенных методов |
детерминированной выборки — квотная выборка, применяемая главным образом при прове- [
дении интервью-"перехватов" в торговых центрах, таких как "Изучение общественного мне- !
ния" (см. врезку "В центре внимания Burke" в главе 6). Цель этих исследований заключается i
скорее в относительной оценке эффективности различных переменных (например, рекламных |

436 Часть II. Разработка плана исследования
объявлений), чем в распространении полученных результатов на всю генеральную совокуп-
ность. Вероятностные методы выборки применяются в случаях, когда целью исследования яв-
ляется перспективная оценка, как при определении объема продаж и рыночной доли отдель-
ной торговой марки. Простая случайная выборка применяется при выборе респондентов из
списка адресатов и при генерации телефонных номеров для таких опросов, как CATI, в кото-
рых подбор номеров проводится различными методами случайных чисел. Компания Burke раз-
работала эффективные процедуры исключения нерезультативных телефонных номеров, ото-
бранных этими методами (например, исключение повторного выбора номера, выбора нерабо-
тающих номеров, а также номера телефона организации при проведении опроса семей). При
выборе респондентов для опросов в Internet использовался систематический метод выборки.
При проведении опросов Webnostics, оценивающих эффективность Web-сайтов в краткосроч-
ном периоде, специалисты Burke воспользовалась методом случайного л-го (или /-го, если
пользоваться терминологией этого учебника) посетителя для отбора респондентов в Internet.
В броузере каждого л-го (/-го) посетителя Web-сайта заказчика неожиданно возникала надпись,
предлагающая принять участие в опросе и обещающая за это определенное вознаграждение.
Посетители узла могут отказаться от участия в опросе, точно так же, как в исследованиях, про-
водимых в реальном мире. Применяя систематическую выборку, Burke избегает ошибки само-
отбора, связанной с возможностью участия в опросе любого респондента, нажимающего кноп-
ку "нажми", размещенную на странице для сбора оперативной информации.
Еще один метод вероятностной выборки, который широко использует Burke, — страти-
фицированный отбор. В некоторых исследовательских проектах совокупность стратифици-
руется с учетом демографических или других переменных, чтобы обеспечить включение от-
дельных сегментов в выборку и повысить точность результатов. Главное решение, которое
Burke принимает в таких исследованиях, — это решение о выборе между пропорциональной
или непропорциональной стратифицированной выборкой. Недавно Burke провела исследо-
вание для компании, которая разработала для женщин инвестиционный инструмент, пре-
дусматривающий получение ежегодного дохода. Для стратификации совокупности женщин
заказчик выбрал две переменные — возраст (до 35 лет и 35 и старше) и семейное положение
(не была замужем и была замужем), Первое условие клиента заключалось в отборе 100 рес-
пондентов для каждого из четырех итоговых слоев. Приняв во внимание данные переписи,
Burke установила такое распределение этих групп в совокупности.
Женщины от 15 до 34 лет, не выходившие замуж 10,4%
Женщины 35 лет и старше, не выходившие замуж 3,4%
Женщины от 15 до 34 лет, выходившие замуж 22,3%
Женщины 35 лет и старше, выходившие замуж 64,0%
Безусловно, затраты на создание выборки из женщин 35 лет и старше, которые не были
замужем, слишком велики, учитывая небольшой процент таких женщин в генеральной со-
вокупности (3,4%). К тому же, сложно подобрать соответствующие весовые коэффициенты
для анализа полученных данных (детальнее — в главе 14). Не вдаваясь в статистические под-
робности, достаточно сказать, что применение весовых коэффициентов в этом случае суще-
ственно увеличит отличие заключительной оценки от оценки результатов пропорциональ-
ной представительной выборки. Поэтому Burke порекомендовала заказчику применить про-
порциональную стратифицированную выборку, так как клиент был заинтересован в
перспективной оценке всего потребительского рынка женщин, а не отдельных его сегмен-
тов. Руководство Burke очень внимательно относится к просьбам заказчика. Предположим, в
данной ситуации клиент решил, что 3,4% женщин, в возрасте 35 лет и старше, которые не
были замужем, занимают важную рыночную нишу, и эту группу нужно проанализировать
отдельно. В таком случае, несмотря на низкую эффективность затрат и негативные послед-
ствия использования большого количества весовых коэффициентов, пожелание заказчика
будет учтено в первую очередь и специалисты Burke продолжат исследование, согласно на-
чальным указаниям клиента. В целом, Burke выбирает план выборочного наблюдения, в ко-
тором наиболее учтены пожелания заказчика.


Глава 11. Выборка: планирование и проведение 437
РЕЗЮМЕ
Информацию о характеристиках генеральной совокупности (популяции) можно полу-
чить в результате выборочного или сплошного наблюдения (переписи). Бюджетные и вре-
менные ограничения, большой размер генеральной совокупности и небольшое разнообразие
исследуемых характеристик свидетельствуют в пользу применения выборки. Выборка также
предпочтительнее, если цена ошибки выборки невелика, в отличие от цены систематиче-
ской ошибки, характер измерения деструктивен и внимание сосредоточено на индивиду-
альных случаях. В противном случае предпочтительнее перепись.
Составление плана выборочного наблюдения начинается с определения изучаемой сово-
купности с точки зрения элементов, единиц выборки, территории и времени. Затем необходи-
мо определить основу выборочного наблюдения, которая содержит элементы, представляющие
изучаемую совокупность, а также ряд инструкций по определению изучаемой совокупности.
На этом этапе важно принять во внимание все возможные ошибки основы выборки. Следую-
ший шаг — выбор метода отбора и определение объема выборки. При определении объема вы-
борки количественный анализ необходимо дополнить рассмотрением некоторых качественных
характеристик. Наконец, для успешного выборочного наблюдения необходимо детально опи-
сать все этапы процесса выборки.
Методы выборки можно разделить на детерминированные и вероятностные. Детерминиро-
ванные методы основаны на мнении исследователя. Значит, они не позволяют объективно
оценить точность результатов выборки, и полученные значения не подлежат статистическому
распространению на всю совокупность. Распространенные детерминированные методы: нере-
презентативная выборка, поверхностная выборка, квотная выборка и выборка по принципу
"снежного кома".
При использовании вероятностных методов единицы выборки определяются случайным об-
разом. Каждый элемент имеет отличную от нуля вероятность включения в выборку. Исследова-
тель заранее устанавливает все возможные выборки данного объема, которые можно получить из
совокупности, а также вероятность получения каждой выборки. Также можно определить точ-
ность полученных результатов и выводов и распространить их на изучаемую совокупность. При-
ведем примеры вероятностных методов: простая случайная выборка, систематическая выборка,
стратифицированная выборка, кластерная выборка, последовательная выборка и метод двой-
ного контроля. Решение о выборе вероятностного или детерминированного метода отбора
должно быть принято с учетом характера исследования, степени допустимой ошибки, относи-
тельной величины ошибок выборки и систематических ошибок, изменчивости совокупности,
а также статистических и операционализационных соображений.
При проведении международных маркетинговых исследований важно иметь возможность
сравнивать структуру и представительность разных выборок, несмотря на то, что для этого по-
требуются различные методы исследования в разных странах. Непрофессионально и ошибочно
рассматривать детерминированную выборку как вероятностную и распространять ее результаты
на изучаемую совокупность. Использование Internet и компьютеров делает процесс планирова-
ния выборочного наблюдения рациональнее и эффективнее.


ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ
• байесов подход (Bayesian approach) • вероятностная выборка, пропорциональ-
ная объем
• бесповторная выборка (sampling without У (Probability Proportionate to size
replacement) Sampling -
* вь'борка (sample)
• вероятностная выборка (probability
sampling) • выборка по принципу "снежного кома"
(snowball sampling)



438 Часть II. Разработка плана исследования
генеральная совокупность, популяция повторная выборка (sampling with
(population) replacement)
детерминированная выборка последовательная выборка (sequential
(nonprobability sampling) sampling)
единица выборки (sampling unit) простая случайная выборка (Simple
Random Sampling — SRS)
изучаемая совокупность (target population)
систематическая выборка (systematic
квотная выборка (quota sampling)
sampling)
кластерная выборка (cluster sampling)
сплошное наблюдение, перепись (census)
метод двойного контроля (double sampling)
стратифицированная выборка (stratified
нерепрезентативная выборка (convenience sampling)
sampling)
территориальная выборка (area sampling)
объем выборки (sample size)
элемент совокупности (element)
основа выборочного наблюдения
(sampling frame)
поверхностная выборка (judgemental
sampling)


УПРАЖНЕНИЯ
Вопросы
1. В чем главное отличие между выборкой и переписью?
2. В каких случаях лучше использовать выборку, а не перепись? В каких случаях, наоборот,
предпочтительнее использовать перепись?
3. Опишите процедуру составления плана выборочного наблюдения.
4. Каким образом следует определять изучаемую совокупность?
5. Что такое единица выборки? Чем она отличается от элемента совокупности?
6. Какие качественные факторы нужно учитывать при определении объема выборки?
7. Что такое коэффициент охвата? Как он влияет на объем выборки?
8. В чем отличие вероятностных методов выборки от детерминированных?
9. Какой из методов выборки самый экономный с точки зрения финансовых и временных за-
трат? Каковы основные ограничения этого метода?
10. В чем главное отличие между поверхностной и нерепрезентативной выборкой?
11. Что общего между квотной и поверхностной выборкой?
12. Каковы отличительные черты простой случайной выборки?
13. Опишите процедуру систематической случайной выборки.
14. Опишите стратифицированную выборку. Каковы критерии отбора переменных для стра-
тификации?
15. Чем отличается пропорциональная стратифицированная выборка от непропорциональной?
16. Опишите процедуру кластерной выборки, Чем отличается кластерная выборка от страти-
фицированной?
17. Какие факторы необходимо учитывать при выборе между вероятностным и детерминиро-
ванным методами выборки?



439
Глава 11. Выборка: планирование и проведение
Задания
1. Для каждой из следующих ситуаций определите соответствующую изучаемую совокупность
и основу выборочного наблюдения.
a) Производитель нового вида сухих завтраков хочет провести домашнее тестирование
продукта в Чикаго.
b) Национальная сеть магазинов хочет определить потребительские предпочтения покупа-
телей, имеющих платежную карточку этой сети.
c) Местная телевизионная станция хочет определить, какие передачи пользуются попу-
лярностью в семьях и каким именно программам зрители отдают предпочтение.
d) Местное отделение Американской ассоциации маркетинга хочет оценить эффектив-
ность работы своего нового представительства в Атланте.
2. Производитель хочет провести опрос потребителей, чтобы определить потенциальный
спрос на новый пресс с механическим приводом. Новый пресс имеет мощность, равную 500
тонн и стоит 225 тысяч долларов. Он применяется для формовки изделий из легкой и тяже-
лой стали и полезен производителям автомобилей, строительного оборудования и крупных
механических конструкций.
a) Определите генеральную совокупность и основу выборки, которые могут использовать-
ся в данном случае.
b) Опишите, как получить простую случайную выборку, используя установленную вами
основу выборки.
c) Можно ли провести стратифицированную выборку? Если да, то каким образом?
d) Можно ли применить кластерную выборку? Если да, то каким образом?
e) Какой из методов выборочного наблюдения вы порекомендуете? Почему?


УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET
И КОМПЬЮТЕРА
1. Компания Procter & Gamble хочет провести опрос потребителей и узнать, какие виды зубной
пасты предпочитают жители Лос-Анджелеса. Для проведения опроса она пользуется мето-
дом стратифицированной случайной выборки. Посетите страницу www. city. net и най-
дите информацию, необходимую для деления совокупности на слои с различным уровнем
дохода и возрастом.
2. С помошью компьютерной программы Genesys создайте случайную выборку телефонных
номеров тысячи людей, проживающих в вашем муниципальном районе.
3. С помошью компьютерной программы сгенерируйте тысячи случайных номеров для про-
стой случайной выборки.
4. Посетите в Internet Web-сайт компании SurveySite (www. surveysite. com). Проанализи-
руйте исследования, которые проводились этой компанией в Internet. Напишите отчет об
использованных их в планах выборочного исследования.


КОММЕНТАРИИ
1. Marc Gunther, "This Gang Controls Your Kids' Brains", Fortune, October 27,1997, p. 172-182.
2. Carol Krol, "Survey: Friends Lead Pack in Kids' Spending Decisions", Advertising Age, March 30,
1997, p. 16; The Warner-Lambert Company, The American Chicle Youth Poll.


440 Часть II. Разработка плана исследования
3. V. Verma, T. Le, "An Analysis of Sampling Errors for the Demographic and Health Surveys",
International Statistical Review, December 1966, p. 265—294; H. Assael, J. Keon, "NonsampHng versus
Sampling Errors in Sampling Research", Journal of Marketing, Spring 1982, p. 114—123.
4. Barbara A. Bailar, "Does Sampling Work?", Business Economics, January 1997, p. 47—53; "Frequently
Asked Questions about Census 2000", Indiana Business Review, Summer 1997, p. 10.
5. A r l e n e Fink, How to Sample in Surveys (Thousand Oaks, CA: Sage Publications, 1995); Martin R.
Frankel, "Sampling Theory", in Peter H. Rossi, James D. Wright, A n d y B. Anderson (eds.),
Handbook of Survey Research (Orlando, FL: Academic Press, 1983, p. 21—67; R.M. Jaeger, Sampling
in Education and the Social Sciences (New York Longman, 1984), p. 28—29.
6. Gary T. Henry, Practical Sampling (Thousand Oaks, CA; Sage Publications, 1995); Seymour Sud-
man, "Applied S a m p l i n g " , in Peter H. Rossi, James D. Wright, Andy B. Anderson (eds.),
Handbook of Survey Research (Orlando, FL: Academic Press, 19S3,p. 145—194.
7. Robert Cage, "New Methodology for Selecting CPI Outlet Samples", Monthly Labor Renew, De-
cember 1996, p. 49-83.
8. Wayne Smith, Paul Mitchell, Karin Attebo, Stephen Leeder, "Selection Bias f r o m Sampling
Frames: Telephone Directory and Electoral Roll Compared w i t h Door-to-Door Population Cen-
sus: Results from the Blue Mountain Eye Study", Australian & New Zealand Journal of Public
Health, A p r i l 1997,p. 127-133.
9. О влиянии ошибок инструментария на результаты исследования, см. статью Kelly E. Fish,
James H. Barnes, Benjamin F. Banahan, I I I , "Convenience or Calamity: Pharmaceutical
Study Explores the Effects of Sample Frame Error on Research Results", Journal of Health Care
Marketing, S p r i n g 1994, p. 45-49.
10. "The Many Faces of F l o r i d a " , Association Management (A Guide to F l o r i d a Supplement),
A p r i l 1997, p. 3; "Florida Travel Habits Subject of Phone Survey", Quirk's Marketing Research
Review, May 1987,p. 10,11, 31, 56, 60.
11. О последних случаях применения нерепрезентативной выборки см. статью Nin Foo Но, Beng Soo
Ong, Seonsu, "A Multicultural Comparison of Shopping Patterns among Asian Consumers",
Journal of Marketing Theory & Practice, W i n t e r 1997,p. 42—51.
12. R i c h a r d Zelade, "Money Isn't Quite Everything", International Business, M a y — J u n e 1997,
p.9; "Students Seek Good Careers, Successful Marriages", Quirk's Marketing Research Review,
June-July 1988, p. 26.
13. Brian OTcole, "Have You Had Your Quota of Nearest Birthdays", Australian & New Zealand Journal of
Public Health, April 1997, p. 117-119; Catherine Marsh, E. Scarbrough, "Testing Nine Hypotheses
about Quota Sampling", Journal of Market Research Society (UK), October 1990, p. 485-506; Leslie
Kish, Survey Sampling (New York: John Wiley, 1965), p. 552.
14. John Curtice, Nick Sparrow, "How Accurate Are Traditional Quota Opinion Polls", Journal of the
Market Research Society, July 1997, p. 433-448.
15. "Public Opinion: Polls Apart", Economist, August 12, 1995, p. 48; Seymour Sudman, "Improving the
Quality of Shopping Center Sampling", Journal of Marketing Research, November 1980, p. 423—431.
16. О последних случаях применения выборки по принципу снежного кома см. статью Gary L.
Frankwick, James С. Ward, Michael D. Hutt, Peter H. Reingen, "Evolving Patterns of Organiza-
tional Beliefs in the Formation of Strategy", Journal of Marketing, April 1994, p. 96—110.
17. Если строго следовать определенным правилам при перечислении элементов редких совокуп-
ностей, выборку по принципу "снежного кома" можно рассматривать как вероятностную. См.
работы Gary T. Henry, Practical Sampling (Thousand Oaks, CA: Sage Publications, 1995); Graham
Kalton, Dallas W. Anderson "Sampling Rare Populations", Journal of the Royal Statistical Association
(1986), p 65-82.
18. Gale D. Muller, Jane Miller, "Interviewers Make the Difference", Marketing Research: A Magazine
of Management & Applications, Spring 1996, p. 8—9; Raymond F. Barker, "A Demographic Profile of
Marketing Research Interviewers", Journal of the Market Research Society, July 1987, p. 279—292.

Глава 11. Выборка: планирование и проведение 441
19. Если выборочный интервал / является дробным числом, самый простой выход — использо-
вать в качестве интервала ближайшее целое число, меньшее или большее /. Если округление
приводит к слишком сильному изменению объема выборки, увеличьте или уменьшите ко-
личество знаков.
20. О последних случаях применения систематической случайной выборки см. статьи Hailn Qu,
Isabella Li, "The Characteristics and Satisfaction of Mainland Chinese Visitors to Hong Kong", Journal
of Travel Research, Spring 1997, p. 37—41; Goutam Chakraborty, Richard Ettenson, Gary Gaeth,
"How Consumers Choose Health Insurance", Journal of Health Care Marketing, Spring 1994, p. 21—33.
21. Mark Adams, "Court Marshall", Mediaweek, March 18, 1996, p. 22; "Readership Survey Serves Ten-
nis Magazine's Marketing Needs", Quirk's Marketing Research Review, May 1988, p. 75—76.
22. О последних случаях применения расслоенной выборки см. статью Samaradasa Weerahandi,
Soumyo Moitra, "Using Survey Data to Predict Adoption and Switching for Services", Journal of
Marketing Research, February 1995, p. 85—96.
23. "Purchasing Smarts Pay Off in Travel Buying", Purchasing, December 12, 1996, p. 30-31; "Vacations
High Priority Among Americans, Survey Shows", Quirk's Marketing Research Review, May 1988,
p. 16-19.
24. "Niche Marketing to the Wealthy", Health Care Strategic Management, September 1997, p. 12; Tho-
mas J. Stanley, Murphy A. Sewatl, "The Response of Affluent Consumers to Mail Surveys", Journal of
Advertising Research, June—July 1986, p. 55—58.
25. Деление редких совокупностей на кластеры по географическому признаку может оказаться
весьма полезным. См. работы James С. Raymondo, "Confessions of a Nielsen Household1',
American Demographics, March 1997, p. 24—27; Seymour Sudman, "Efficient Screening Methods for
the Sampling of Geographically Clustered Special Populations", Journal of Marketing Research, Feb-
ruary 1985, p. 20-29.
26. June S. Park, Michael Peters, Kwei Tang, "Optimal Inspection Policy in Sequential Screening",
Management Science, August 1991, p. 1058—1061; E.J. Anderson, K. Gorton, R. Tudor, "The Appli-
cation of Sequential Analysis in Market Research", Journal of Marketing Research, February 1980,
p. 97-105.
27. Более подробно метод двойного контроля рассматривается в работах David H. Baillie, "Double
Sampling Plans for Inspection by Variables When the Process Standard Deviation Is Unknown",
International Journal of Quality & Reliability Management, May 1992, p. 59—70; Martin R. Frankel,
Lester R, Frankel, "Probability Sampling", in Robert Ferber (ed.), Handbook of Marketing Research
(New York: McGraw-Hill, 1974), p. 2-230-2-246.
28. Steven Murphy, "Moving Targets," Business Latin America, April 1, 1996, p. 4-5. Об использовании
различных детерминированных и вероятностных выборочных методов в исследованиях,
связанных с сопоставлением различных культур, см. статью Samiee Saeed, Insik Jeong, "Cross
Cultural Research in Advertising: An Assessment of Methodologies", Journal of the Academy of
Marketing Science, Summer 1994, p. 205—215.
29. Margaret E. Grosh, Paul Glewwe, "Household Survey Data from Developing Countries: Progress and
Prospects", American Economic Review, May 1996, p. 15—19.
30. Taylor Humphrey, "Horses for Courses: How Survey Firms in Different Countries Measure Public
Opinion with Different Methods", Journal of the Market Research Society, July 1995, p. 211—219; B.J.
Verhage, U. Yavas, R.T. Green, E. Borak, "The Perceived Risk Brand Loyalty Relationship: An Inter-
national Perspective", Journal of Global Marketing, March 1990, p. 7—22.
31. Satish P. Deshpande, "Managers' Perception of Proper Ethical Conduct: The Effect of Sex, Age, and
Level of Education", Journal of Business Ethics, January 1997, p. 79—85; I.P. Akaah, "Differences in
Research Ethics Judgments between Male and Female Marketing Professionals", Journal of Business
Ethics, August 1989, p. 375-381.
32. Marshall Rice, "What Makes Users Revisit a Web Site?", Marketing News, March 17,1997, p. 12.



442 Часть II. Разработка плана исследования
Г л а в а 12
Выборка: определение конечного
и начального объемов
После изучения материала этой главы вы должны уметь...
1. Разбираться в основных понятиях и условных обозначениях, относящихся к выборке.
2. Понимать, что такое выборочное распределение, статистическое заключение и стандартная
ошибка.
3. Разбираться в статистическом методе определения объема выборки на основе простой слу-
чайной выборки и доверительных интервалах.
4. Объяснять формулы для статистического определения объема выборки исходя из ожидае-
мых значений среднего и доли.
5. Анализировать причины отсутствия ответов в выборочном наблюдении, механизмы повыше-
ния коэффициентов отклика и процедуры корректировки в связи с неполучением данных.
6. Объяснять сложность статистического определения объема выборки при международных
маркетинговых исследованиях.
7. Рассматривать этические проблемы, связанные с определением объема выборки, в частно-
сти с расчетом дисперсии генеральной совокупности.
Объяснить применение Internet и компьютеров при статистическом определении объема
выборки.


КРАТКИЙ ОБЗОР
В главе 11 мы рассмотрели роль выборки при разработке плана маркетингового исследова-
ния, описали процесс выборки и рассмотрели различные вероятностные и детерминированные
методы выборки. В этой главе мы сосредоточим внимание на определении объема простой слу-
чайной выборки. Мы даем определение различным понятиям и условным обозначениям и
рассматриваем особенности выборочного распределения. Кроме того, в главе описываются ста-
тистические методы определения объема выборки на основе доверительных интервалов, а так-
же рассматриваются формулы для вычисления объема выборки в соответствии с этими метода-
ми и продемонстрировано их применение. Кратко проанализируем дополнительные методы
определения объема выборки в других видах вероятностного отбора. Объем выборки, опреде-
ленный статистически, является конечным, или чистым объемом выборки; т.е. представляет
собой количество завершенных интервью или наблюдений. Однако, чтобы получить его, вна-
чале необходимо связаться с гораздо большим количеством потенциальных респондентов. Мы
описываем корректировки, которые необходимо применить к статистически определенному
объему выборки с учетом коэффициентов охвата и завершенности и вычисляем объем началь-
ной выборки. Обсудим также проблему отсутствия ответов в выборочном обследовании, акцен-
тируя внимание на улучшении коэффициента отклика и на корректировке при неполучении
данных. Рассмотрим сложности статистического определения объема выборки в международ-
ных маркетинговых исследованиях, выделим сопутствующие этические проблемы и объясним
роль Internet и компьютеров при выборочном наблюдении.
Статистическое определение объема выборки требует знания закона нормального распределе-
ния случайной величины и использования таблиц нормального распределения вероятности.

Глава 12. Выборка: определение конечного и начального объемов 443
Кривая нормального распределения симметрична и имеет колоколообразную форму. Значения
среднего, медианы и моды для нормального распределения одинаковы (см. главу 15). Информа-
цию о нормальном распределении и использовании соответствующих таблиц можно найти в
Приложении к этой главе. Следующие примеры иллюстрируют статистические аспекты выборки.

Пример. Журнал Bicycling: статистический подход к определению объема выборки
При исследовании журналом Bicycling американских розничных магазинов, торгующих
велосипедами, маркетологи установили объем выборки, исходя из статистических сообра-
жений. Допустимая ошибка выборки ограничена пятью процентными пунктами.
Приведенная ниже таблица использовалась для определения поправок на ошибку вы-
борки. При определении доверительных интервалов принималось во внимание влияние
вида выборочного наблюдения на величину ошибки выборки. Эти интервалы определяют
диапазон (плюс или минус указанное число), в пределах которого с 95%-ной вероятностью
можно ожидать варьирования результатов при повторных выборках в заданном промежутке
времени, допуская, что процедура выборки, проведение опроса и оформление анкеты оста-
ются неизменными [1].
Рекомендуемая поправка на ошибку выборки для долей
В процентах (с доверительной вероятностью, равной 0,95, для объема выборки, равного 456)
Проценты около 10 3
Проценты около 20 4
Проценты около 30 4
Проценты около 40 5
Проценты около 50 5
Проценты около 60 5
Проценты около 70 4
Проценты около 80 4
Проценты около 90 3
Таблица используется следующим образом: если исследователь получил значение инте-
ресующей его доли, равное 43%, следует смотреть на строку "проценты около 40". Число в
этой строке равно 5, это означает, что доля в 43%, полученная в выборке, подвержена ошиб-
ке выборки в плюс или минус пять процентных пунктов. Другими словами, очень вероятно
(95% из 100%), что средняя доля в результате повторной выборки будет колебаться в интер-
вале 38—48%, с наиболее вероятным результатом в 43%.



Пример. Спортивная фотокамера Fun Saver фирмы Kodak, камера, которая мо-
жет выдержать удар
Руководство компании Eastman Kodak рассматривало вопрос о том, как усовершенство-
вать свои одноразовые водостойкие фотокамеры, чтобы использовать их при занятии таки-
ми видами спорта, как пешеходный туризм, велосипедный спорт, пляжный волейбол и др.
Для того чтобы выявить вкусы и предпочтения потребителей, проводились индивидуаль-
ные опросы в США и Германии. Использовался метод систематической случайной выбор-
ки, и конечный объем выборки, в каждой стране составил 400 человек. Объем выборки ста-
тистически определялся таким образом, чтобы обеспечить допустимую ошибку в пределах
5%, при высокой степени достоверности (95%-ная степень достоверности).
Результаты показали, что потребителям нужны фотокамеры, которые могли бы выдер-
| жать удар, поэтому компания Kodak, заменила пластмассу в своей подводной фотокамере на
i прочный резиновый "гидрокостюм", который достаточно легок, чтобы удерживать его од-
! ной рукой. Она также увеличила рычаг перевода кадров и спусковую кнопку, которыми те-
I перь можно пользоваться, не снимая перчаток. Результаты? Усовершенствованная спортив-
| ная фотокамера Fun Saver фирмы Kodak выиграла золотую медаль в 1997 году [2].


444 Часть II. Разработка плана исследования
Эти примеры иллюстрируют важность расчета доверительных интервалов для оценки по-
следствий ошибок выборки.


ОПРЕДЕЛЕНИЯ И УСЛОВНЫЕ ОБОЗНАЧЕНИЯ
Ниже даются определения доверительного интервала и других статистических понятий, ко-
торые играют главную роль в определении объема выборки.
Параметр (parameter) — это описание определенной характеристики изучаемой совокупно-
сти. Параметр указывает на истинное значение, которое было бы получено, если бы проводи-
лась перепись, а не выборка.
Статистика (statistic) — описание характеристики выборки. Статистика выборки исполь-
зуется для оценки параметров генеральной совокупности.
Окончательная коррекция совокупности (finite population correction, fpc) — это коррекция,
применяемая для перерасчета дисперсии параметра генеральной совокупности, например
среднего или доли, если объем выборки составляет 10% или больше от объема популяции.
Степень точности (precision level) — это желательная величина оценочного интервала при
оценке параметра совокупности с использованием выборочной статистики. Это максимально
допустимое различие между статистикой выборки и параметром генеральной совокупности.
Доверительный интервал (confidence interval) — это диапазон, в который попадет истинное
значение параметра совокупности при данном уровне достоверности.
Уровень достоверности (confidence level) — это вероятность того, что параметр совокупности
попадет в доверительный интервал.
Символы, применяемые в системе статистических обозначений для описания характери-
стик генеральной совокупности и выборки, представлены в табл. 12.1.

Таблица 12.1. Условные обозначения для переменных генеральной совокупности и вы-
борки

Совокупность
Переменная Выборка

Среднее X
я
Доля Р
2
ст
Дисперсия
s
о
Среднеквадратичное (стандартное) отклонение
п
N
Объем
а*
Стандартная ошибка среднего
а,
Стандартная ошибка доли
Х-» Х-˜Х
Нормированная величина (г)
а S
s_
а
Коэффициент вариации (С)
X


ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ
Выборочное распределение (sampling distribution) — это распределение значений выборочных
статистик, рассчитанных для каждой возможной выборки, которая формируется из изучаемой со-
вокупности при определенном плане выборочного наблюдения [3]. Предположим, что простую
случайную выборку, включающую 5 больниц, нужно сформировать из генеральной совокупности
20 больниц. Можно получить (20 х 19 х 18 х 17 х 1б)/(1 х 2 х 3 x 4 x 5 ) , или 15504 различных выбо-


Глава 12. Выборка: определение конечного и начального объемов 445
рок каждая размером в 5 элементов. Распределение относительных частот средних значений этих
15504 различных выборок определяет выборочное распределение среднего.

Выборочное распределение (sampling distribution)
Распределение значений выборочных статистик, рассчитанных для каждой возможной вы-
борки, которую можно получить из изучаемой совокупности при определенном плане вы-
борочного наблюдения.

Важная задача маркетингового исследования — вычисление таких статистик, как выборочное
среднее и выборочная доля, и применение их для оценки соответствующих истинных значений
генеральной совокупности. Процесс распространения результатов оценки выборки на оценку ге-
неральной совокупности называется статистическим заключением (statistical inference). На практи-
ке создается одна выборка заданного объема и по ней вычисляются выборочные статистики (а
именно, среднее и доля). Теоретически, для того чтобы оценить параметр изучаемой совокупно-
сти исходя из статистики выборки, нужно изучить каждую возможную выборку. Если бы все воз-
можные выборки создавались в действительности, распределение статистики являлось бы выбо-
рочным распределением. Несмотря на то, что на практике создается только одна выборка, понятие
выборочного распределения очень важно. Это дает нам возможность использовать теорию вероят-
ности для того, чтобы делать выводы относительно значений совокупности.

Статистическое заключение (statistical inference).
Распространение результатов оценки выборки на оценку совокупности.

Важные характеристики выборочного распределения среднего и соответствующие характе-
ристики доли для больших выборок (30 и больше) следующие.
1. Выборочное распределение среднего— это нормальное распределение (Приложение 12А).
Строго говоря, выборочное распределение доли биномиально. Однако для больших выбо-
рок (п = 30 и больше) его можно свести к нормальному распределению,
{" \\
^ X; \/ ИЛИ ДОЛИ
X=


равняется соответствующему значению параметра совокупности \JL или я.
3. Стандартная ошибка (standard error) среднего или доли относится к выборочному распреде-
лению среднего или доли, а не к выборке или всей совокупности. Формулы для определе-
ния стандартной ошибки:
Среднего Доли

°*˜ -Гп

Стандартная ошибка (standard error)
Среднеквадратичное (стандартное) отклонение выборочного распределения среднего или
доли.

4. Часто среднеквадратичное отклонение изучаемой совокупности о неизвестно. В таких слу-
чаях его расчетное значение получают из выборки с помощью следующей формулы:




"-1
л-1 „ли

446 Часть II. Разработка плана исследования
Если о оценивается через 5, то стандартная ошибка среднего равна
5
расчета- = — г=,
Vn
где "расчет." обозначает, что s употребляется для расчета значения о.
Если не учитывать погрешность измерения, можно определить достоверность оценки па-
раметра совокупности с помощью стандартной ошибки.
5. Аналогично, значение стандартной ошибки доли можно рассчитать, применив выбороч-
ную долю р для расчета генеральной доли п таким образом:

рас чет. sp =

6. Площадь области под кривой выборочного распределения между любыми двумя точками
можно рассчитать с помощью значений z (z value). Значение z точки — это число стандарт-
ных ошибок, на которое точка удалена от среднего. Значения z можно рассчитать следую-
щим образом:

_
z—

Например, площади областей, находящихся под одной стороной кривой, между средним и
точками, которые имеют значения z, равные 1,0, 2,0 и 3,0, составляют соответственно
0,3413, 0,4772 и 0,4986 (табл. 2 в Приложении "Статистические таблицы"). В случае с долей
значения z вычисляются аналогично.

Значение z (z value)
Количество стандартных ошибок, на которое точка удалена от среднего значения.

7. Если объем выборки составляет 10% или больше от объема исследуемой совокупности,
применение формул стандартной ошибки приведет к переоценке среднеквадратичного от-
клонения среднего или доли совокупности, Значит, его следует откорректировать, приме-
нив коэффициент окончательной коррекции совокупности, определяемый как



В этом случае
a lN-n



СТАТИСТИЧЕСКИЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ
ОБЪЕМА ВЫБОРКИ
При определении объема выборки следует также принимать во внимание некоторые каче-
ственные факторы (см. главу 11): важность принимаемого решения, характер исследования,
количество переменных, характер анализа, объемы выборки, которые использовались в подоб-
ных исследованиях, коэффициент охвата, коэффициент завершенности, а также ограничен-
ность ресурсов. Статистически определенный объем выборки — это чистый или конечный объ-
ем выборки, т.е. элементы выборки, остающиеся после исключения потенциальных респон-
дентов, которые не отвечают заданным критериям или не закончили интервью. В зависимости
от коэффициентов охвата и завершенности может потребоваться намного больший объем ис-


Глава 12. Выборка: определение конечного и начального объемов 447
ходной выборки. В коммерческих маркетинговых исследованиях недостаток времени, денег и
хороших специалистов может иметь решающее значение при определении объема выборки. В
проекте исследования постоянных покупателей универсального магазина объем выборки опре-
делялся на основе именно этих соображений,
Статистический метод определения объема выборки, рассмотренный в этой книге, основан
на традиционном статистическом заключении [4]. В соответствии с этим методом заранее оп-
ределяется уровень (степень) точности. Этот метод основан на создании доверительных интер-
валов вокруг средних или долей выборки.


МЕТОД ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
Определение объема выборки методом доверительных интервалов основано на их создании
вокруг выборочного среднего или выборочной доли с использованием формулы стандартной
ошибки. В качестве примера предположим, что исследователь провел простую случайную вы-
борку из 300 семей, чтобы оценить ежемесячные расходы семьи на покупки в универмаге, и
определил, что средний ежемесячный расход семьи в выборке равен 182 доллара. Предыдущие
исследования показали, что среднеквадратичное отклонение расходов в исследуемой совокуп-
ности равно 55 долларов.
Мы хотим найти интервал, в который попадал бы определенный процент выборочных
средних. Предположим, мы хотим определить интервал вокруг среднего значения совокуп-
ности, который включал бы 95% выборочных средних, опираясь на выборку из 300 семей.
95% выборочных средних можно разделить на две равные части, половина меньше и поло-
вина больше среднего, как показано на рис. 12.1. Вычисление доверительного интервала
включает определение области меньше ( XL) и больше ( Хи ) среднего значения ( X ) вели-
чины расходов.
Значения z, соответствующие XL и Хи , можно рассчитать следующим образом:

SL=
˜^T
X и — \JL
ст-

где ZL —-Z и Zu =+Z- Следовательно, минимальное значение X определяется как
XL = fi-z<7- , а максимальное значение X равно Xи = ^ + гст-.
Доверительный интервал устанавливается как X ± z<7- .




Рис 12.1. 95%-ный доверительный интервал



Часть II. Разработка плана исследования
448
Теперь установим 95%-ный доверительный интервал вокруг выборочного среднего, равно-
го 182 доллара. Для начала мы вычислим стандартную ошибку среднего:

v« V300
Из табл. 2 Приложения "Статистические таблицы" видно, что центральные 95% нормаль-
ного распределения находятся в пределах ±1,96 значений г; 95%-ный доверительный интервал
определяется как
7±1,96ст-=182,00±1,96(3,18) = 182,00±б,23
Таким образом, 95%-ный доверительный интервал находится в пределах от 175,77 до 188,23
доллара. Вероятность нахождения истинного среднего значения наблюдаемой совокупности в
пределах от 175,77 до 188,23 доллара составляет 95%.

Определение объема выборки: среднее
Метод, использованный для создания доверительного интервала, можно модифицировать
так, чтобы определить объем выборки с учетом желательного доверительного интервала [5].
Предположим, что вы хотите рассчитать ежемесячный расход семьи на покупки в универмаге
более точно, так, чтобы полученный результат находился в пределах ±5,00 долларов от истин-
ного среднего значения исследуемой совокупности. Каким должен быть объем выборки?
В табл. 12.2 приведен необходимый перечень действий, который вы должны выполнить.
1. Определите степень точности. Это максимально допустимое различие (/)) между выбороч-
ным средним и генеральным средним. В нашем примере D = ±5,00 долларов.
2. Укажите уровень достоверности. Предположим, что желательный уровень достоверности 95%.
3. Определите значение z, связанное с данным уровнем достоверности, воспользовавшись
табл. 2 в Приложении "Статистические таблицы". При 95%-ном уровне достоверности ве-
роятность того, что среднее значение генеральной совокупности выйдет за пределы одно-
стороннего интервала, равна 0,025 (0,05/2). Соответствующее значение z составляет 1,96.
4. Определите стандартное отклонение среднего генеральной совокупности. Его можно получить из
вторичных источников или рассчитать, проведя пилотное исследование. Кроме того, стандартное
отклонение можно установить на основе мнения исследователя. Например, диапазон нормально
распределенной переменной примерно укладывается в шесть стандартных отклонений (по три
слева и справа от среднего значения). Таким образом, можно рассчитать среднеквадратичное от-
клонение, разделив величину всего диапазона на 6. Исследователь часто может определить раз-
меры диапазон, исходя из собственного понимания анализируемых явлений.
5. Определите объем выборки, воспользовавшись формулой стандартной ошибки среднего:
˜Х- D
а-
D
ИЛИ <7- = —
Z

о- D
ИЛИ -т= = —
VI Z


или п =
D1-
В нашем примере
55Э (1,96)"
= 464,83 = 465 (округленное в большую сторону до ближайшего целого числа).



Глава 12. Выборка: определение конечного и начального объемов 449
Таблица 12.2. Определение объема выборки с помощью среднего и доли
Этапы Доли
Средние

t. 0=р-л: =±0,05
D= ±5,00 долл.
Установите степень точности

УД = 95%
2. Укажите уровень достоверности (УД) УД = 95%
Значение z = 1,96
i. Значение г= 1,96
Определите значение z, связанное с УД
Определите п
4 Определите стандартное отклонение сред- Определите а
него генеральной совокупности п = 0,64
а = 55
5 Определите обьем выборки с помощью
я(1-я)г2
aV
формулы стандартной ошибки 2
D
«41,%)= 0, 64(1-0, 64)(1,96)2
=
:
(0,05}
Если объем выборки составляет 10% or nN
,
объема популяции, примените окончатель-
N+n-l
ную коррекцию совокупности (fpc}
При необходимости пересчитайте величину
= ˜X±zs-
доверительного интервала, применив s для
расчета а

= Rn
Если степень точности указана в относи- D=
тельных, а не абсолютных показателях,
cV
воспользуйтесь данными уравнениями для
R2n
определения объема выборки R2

Из формулы объема выборки видно, что она растет с ростом изменчивости генеральной со-
вокупности, а также с увеличением уровня достоверности и степени точности, с которой
должны проводиться расчеты. Объем выборки прямо пропорционален СУ2, поэтому, чем
больше показатель изменчивости генеральной совокупности, тем больше объем выборки.
Аналогично, более высокий уровень достоверности предполагает большее значение г и,
следовательно, больший объем выборки. Переменные О2 и z находятся в числителе. Увели-
чение степени точности достигается уменьшением значения D и, следовательно, увеличи-
вает объем выборки, поскольку D находится в знаменателе.
6. Если объем выборки составляет 10% и больше от объема генеральной совокупности, то
применяется окончательная коррекция совокупности (fpc). Затем необходимый объем вы-
борки рассчитывается по формуле
nN
,
пс =
N + n-l
где п — объем выборки до применения окончательной коррекции;
ис — объем выборки после применения окончательной коррекции.
7, Если среднеквадратичное отклонение совокупности ст неизвестно и используется его пред-
положительное значение, то его следует повторно рассчитать после получения выборки.
Среднеквадратичное отклонение выборки 5 используется в качестве предположительного
значения ст. Затем следует вычислить исправленный доверительный интервал, чтобы опре-
делить фактически полученную степень точности.
Предположим, что значение 55,00 использовалось в качестве предположительного значе-
ния а, потому что истинное значение было неизвестно. Получена выборка, в которой
п = 465. На основе данных исследования рассчитывается среднее X , равное 180,00, и сред-


Часть П. Разработка плана исследования
450
неквадратичное отклонение выборки s, равное 50,00. Тогда исправленный доверительный
интервал составит

= ˜Х ± и- = 180,00± 1,96-^2г = 180,00 + 4,55
V465
или
175,45 </г < 184,55
Обратите внимание, что полученный доверительный интервал уже. предполагаемого. Это
вызвано тем, что среднеквадратичное отклонение совокупности завышено на основании
выборочных характеристик.
8. Иногда точность определена в относительных, а не абсолютных показателях. Другими сло-
вами, может быть известно, что результат вычисления должен составить плюс-минус А% от
среднего. Это означает, что D = Кц .
В этом случае объем выборки можно определить как
_аУ _СУ
2
" D2 ˜ Я
где нужно рассчитать коэффициент вариации С = (er/ju) -
Объем генеральной совокупности N не влияет на объем выборки напрямую, за исключением
случаев, когда применяется коэффициент окончательной коррекции совокупности. Возможно,
это кажется невероятным, но если подумать, в этом утверждении есть смысл. Например, если ис-
следуемые характеристики всех элементов совокупности идентичны, то выборки, состоящей из
одного элемента, вполне достаточно, чтобы рассчитать среднее. Это также правильно, если сово-
купность состоит из 50, 500, 5000 или 50000 элементов. В то же время изменчивость характеристик
совокупности напрямую влияет на объем выборки. Эта изменчивость учитывается при вычисле-
нии объема выборки с помощью дисперсии совокупности о2 или дисперсии выборки s2.

Определение объема выборки: доля
Если изучаемая статистика является не средним, а долей, то маркетолог определяет объем вы-
борки аналогичным образом. Предположим, что исследователя интересует установление доли се-
мей, владеющих кредитной карточкой универмага. Порядок действий будет следующим [6].
1. Укажите степень точности. Предположим, желательная степень точности такова, что допус-
тимый интервал установлен на уровне D = р-я =±0,05.
2. Укажите уровень достоверности. Предположим, что желателен 95%-ный уровень достоверности.
3. Определите значение z, связанное с данным уровнем достоверности. Как объяснялось при
расчете среднего, оно составит z = 1,96.
4. Определите генеральную долю я. Как мы указывали раньше, ее можно получить из вторич-
ных источников, в ходе экспериментального исследования или на основе мнения исследо-
вателя. Предположим, что на основе вторичных данных исследователь делает предположе-
ние, что 64% семей из изучаемой генеральной совокупности обладают кредитной карточкой
универмага. Следовательно, л = 0,64.
5. Определите объем выборки с помощью формулы стандартной ошибки доли:




Глава 12. Выборка: определение конечного и начального объемов 451
или
7Г(1-Я)Г
п=---
D-
В нашем примере
3
0, 64(1-0, 64)(1. 9б)
п = - i - *г - — = 354,04 = 355 (округленное в большую сторону до целого числа).
(0,05)-
6. Если конечный объем выборки составляет 10% и больше от объема совокупности, приме-
няется окончательная коррекция совокупности (fpc). Затем необходимый объем выборки
рассчитывается по формуле
nN
г
" ˜ N+п-Г
где
п — объем выборки до применения окончательной коррекции;
пг — объем выборки после применения окончательной коррекции.
7. Если расчет л был неверным, то доверительный интервал будет более или менее точным,
чем необходимо. Предположим, что по окончании выборки рассчитывается значение доли
р, равное 0,55. Затем повторно вычисляется доверительный интервал, при этом sp использу-
ется для расчета неизвестного сгр, а именно


где



В нашем примере

^^=0,0264
355
Доверительный интервал тогда равен 0,55 ± 1,96 (0,0264) = 0,55 ± 0,052, что означает, что
он шире, чем было задано. Это объясняется тем, что среднеквадратичное отклонение вы-
борки при р = 0,55 оказалось большим, чем предположительное значение среднеквадратич-
ного отклонения совокупности, при л = 0,64.
Если интервал, превышающий указанный, недопустим, объем выборки можно скорректи-
ровать так, чтобы отразить максимально возможное отклонение в совокупности. Такое от-
клонение происходит, когда произведение тс(1 — я) достигает максимального значения, для
чего л должно равняться 0,5. К этому выводу можно прийти и без расчетов. Поскольку у
одной половины совокупности одно значение характеристики, а у другой — другое, потре-
буется больше данных, чтобы сделать правильный вывод, нежели когда ситуация более
четко определена, и у большинства элементов одно значение характеристики. В нашем
примере это приведет к получению объема выборки, равного
0.5(0,5)0.96)*
= —i—LL-—>— - 384,16 = 385 (округлено в большую сторону до целого числа).
п
(0,05)-
8. Иногда точность определена в относительных, а не абсолютных показателях. Другими сло-
вами, может быть известно, что результат вычисления должен составить плюс-минус R% от
доли совокупности. Это означает, что D = R п .


452 Часть П. Разработка плана исследования
В этом случае объем выборки можно определить как


R'n


УЧЕТ ДОПОЛНИТЕЛЬНЫХ ХАРАКТЕРИСТИК
И ПАРАМЕТРОВ
В предыдущих примерах мы рассмотрели оценку одного параметра. На практике, как пра-
вило, маркетолог определяет не один, а сразу несколько параметров целевой совокупности.
В таких случаях расчет объема выборки должен проводиться с учетом всех оцениваемых пара-
метров, как показано на примере с универсальным магазином.
До сих пор процедура определения объема выборки основывалась на методах традиционно-
го статистического заключения и предполагала применение простой случайной выборки.
В дальнейшем мы рассмотрим определение объема выборки при использовании других мето-
дов выборочного наблюдения.

: СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

! Расчет объема выборки
\ Предположим, что, кроме средней величины ежемесячных расходов семьи на покупки, совер-
I шаемые в универсальном магазине, решено рассчитать среднюю величину ежемесячных расходов
на одежду и подарки. Объемы выборок, необходимые для расчета каждой из трех величин сред-
них ежемесячных расходов, представлены в табл. 12.3 и составляют 465 для покупок в универмаге,
246 — для одежды, 217 — для подарков. Если бы все три переменные были одинаково важны, в
соответствии с наиболее консервативным подходом следовало бы определить объем выборки как
наибольшее значение п = 465. В результате каждая переменная рассчитывалась бы по меньшей
мере с заданной точностью. Однако, если исследователя больше интересовал средний ежемесяч-
ный расход семьи на одежду, в качестве объема выборки можно выбрать п = 246.


Таблица 12.3. Объем выборки при оценке множественных параметров
Переменная
Средний ежемесячный расход семьи на:
Покупки в универмагах Одежду Подарки
Уровень достоверности 95% 95% 95%
Значение z 1,96 1,96 1,96
Степень точности (0) 5 долл. 5 долл. 4 долл.
55 долл. 40 долл. 30 долл.
Среднеквадратичное отклонение совокупности (о)
Необходимый обьем выборки (п) 217
465 246



ДРУГИЕ ВЕРОЯТНОСТНЫЕ МЕТОДЫ ВЫБОРКИ
Определение объема выборки для других вероятностных выборочных методов базируется
на тех же основополагающих принципах. Исследователь должен определить степень точности
и уровень достоверности и рассчитать выборочное распределение статистик.
Для простой случайной выборки затраты напрямую не влияют на расчет объема выборки.
Однако, в случае проведения стратифицированного или кластерного выборочного наблюде-


Глава 12. Выборка: определение конечного и начального объемов 453
ния, маркетологу следует принимать во внимание затраты. Затраты, связанные с получением
данных, различны в зависимости от слоя или кластера, и исследователю нужна предваритель-
ная оценка этих затрат. Кроме того, исследователь должен учитывать изменчивость характери-
стик внутри слоев, а также изменчивость внутри и между кластерами. После определения об-
щего объема выборка распределяется среди слоев или кластеров. Это усложняет формулы, по
которым рассчитывается объем выборки. Заинтересованный читатель может найти дополни-
тельную информацию в основополагающих трудах по теории выборки [7]. В большинстве слу-
чаев, для того чтобы обеспечить такую же достоверность результатов, как и при простой слу-
чайной выборке, нужен аналогичный объем для систематической выборки, меньший— для
стратифицированной, и больший — для кластерной выборки.


КОРРЕКТИРОВКА СТАТИСТИЧЕСКИ
ОПРЕДЕЛЕННОГО ОБЪЕМА ВЫБОРКИ
Статистически определенный объем выборки представляет собой конечный, или чистый
объем выборки, который необходимо получить, чтобы обеспечить расчет параметров с жела-
тельной степенью точности и заданным уровнем достоверности. При проведении опросов он
выражается в количестве завершенных интервью. Для получения конечного объема выборки
необходимо связаться с гораздо большим количеством потенциальных респондентов. Другими
словами, начальный объем выборки должен намного превышать конечный, поскольку коэф-
фициенты охвата и завершенности обычно составляют меньше 100% [8].
Коэффициентом охвата (incidence rate) называется степень наличия или процент людей,
подходящих для участия в исследовании. Коэффициент охвата определяет, какое количество
контактов с людьми необходимо осуществить, чтобы в итоге получить объем выборки, соответ-

<<

стр. 16
(всего 35)

СОДЕРЖАНИЕ

>>