<<

стр. 22
(всего 35)

СОДЕРЖАНИЕ

>>

технологиям. Кроме того, вероятность соответствующей ^-статистики меньше, чем 0,05, свиде-
тельствует о том что различие в отношениях действительно значимое.

Критерий знаков (sign test)
Непараметрический критерий для изучения разностей в показателях центральной тенденции
двух генеральных совокупностей на основе парных наблюдений, который только сравнивает
знаки разностей между парами переменных, но не учитывает величину разностей.



Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 593
Другой непараметрический метод парной проверки — критерий знаков (sign test) [26]. Он не
такой мощный, как критерий Уилкоксона, поскольку только сравнивает знаки разностей меж-
ду парами переменных, не учитывая величину разностей.
В особом случае двоичной переменной, когда исследователь желает проверить разности в
долях, можно использовать критерий Мак-Немара. В противном случае можно использовать
критерий хи-квадрат. Различные параметрические и непараметрические критерии для разли-
чий обобщены в табл. 15.19.

Таблица 15.19. Проверка гипотез о различиях: итог
Выборка Применение Шкала измерения Критерий/Комментарии
Одна выборка
Критерии согласия Колмогорова-Смирнова и хи-
Одна выборка Распределения Неметрическая
квадрат
Критерий серий
Биномиальный тест согласия для дихотомиче-
ских переменных
Метрическая (-критерий, если дисперсия неизвестна
Одна выборка Средние
z-критерий, если дисперсия известна
Одна выборка Доли Метрическая z -критерий
Две независимые выборки
Неметрическая Двухвыборочный критерий Колмогорова-
Две независимые выборки Распределения
Смирнова для проверки эквивалентности двух
распределений
Две независимые выборки Средние Метрическая Двугрупповой (-критерий
F-критерий для равенства дисперсий
z-критерий
Две независимые выборки Доли Метрическая
критерий хи-квадрат
Неметрическая
Две независимые выборки Ранги/Медианы Неметрическая f-критерий Манна-Уитни более мощный, чем
медианный критерий
Парные выборки
Парные выборки Средние Метрическая Парный (-критерий
Парные выборки Доли Неметрическая Критерий Мак-Немара для двоичных перемен-
ных. Критерий хи-квадрат
Неметрическая Критерий попарных сравнений Уилкоксона более
Парные выборки Ранги/Медианы
мощный, чем критерий знаков

Критерии в табл. 15.19 легко соотнести с представленными на рис. 15.9. Табл. 15.19 делит
критерии для распределений и для рангов/медиан. Врезка 15.1 "Практика маркетинговых ис-
следований" показывает использование проверки гипотез в стратегии международного брэн-
динга, в то время как врезка 15.2 "Практика маркетинговых исследований" излагает использо-
вание описательных статистик в исследованиях по этике.

Врезка 15.1. Практика маркетинговых исследований

Стратегия международного брэндинга
С 1990-х годов наблюдается тенденция к глобальному маркетингу. Как можно продавать
фирменный товар за границей, учитывая многообразие исторических и культурных тради-
ций? По словам Боба Кролла (Bob Kroll), бывшего президента компании Del Monte


594 Часть III. Сбор, подготовка и анализ данных
International', преимуществом может стать унифицированная упаковка, также важно удовле-
творение кулинарных вкусовых предпочтений в каждой стране. Эту мысль проясняет одно
из последних международных маркетинговых исследований. В настоящее время руководи-
тели маркетинговых компаний считают, что лучше мыслить глобально, а действовать — ло-
кально. В число респондентов вошли 100 менеджеров по управлению продуктом и сотруд-
ники маркетинговых служб из некоторых наиболее крупных пищевых, фармацевтических и
других компаний США. 39% ответили, что использование унифицированной упаковки на
зарубежных рынках — неудачная идея, а 38% поддержали ее. Однако те, кто были за то, что-
бы упаковка разрабатывалась для каждой страны, пожелали, чтобы упаковка все-таки была
как можно ближе к своему оригиналу, независимо от страны, где продается данный товар.
Но они также считали необходимым, чтобы упаковка товара соответствовала языковым осо-
бенностям и требованиям различных рынков. Исходя из этих положений, подходящим по-
исковым вопросом такого исследования мог стать следующий: "Предпочитают ли потреби-
тели в разных странах покупать товары фирм с известной всему миру товарной маркой в раз-
личной упаковке, соответствующей местным требованиям?" На основании такого
поискового вопроса выдвинем гипотезу о том (при всех других равных условиях), что пред-
ложение фирменного товара в специально разработанной упаковке может увеличить его до-
лю рынка. Гипотезу можно сформулировать так:
Я0: Для хорошо известного фирменного товара доработанная для местных рынков упа-
ковка не увеличит долю на международном рынке.
//,: При равных прочих условиях для хорошо известного фирменного товара доработан-
ная для местных рынков упаковка увеличит долю на международном рынке.
Для проверки нулевой гипотезы в качестве хорошо известного фирменного товара можно
выбрать зубную пасту фирмы Colgate, которая придерживалась смешанной стратегии. Долю
рынка в странах со стандартной упаковкой можно сравнить с долей рынка в странах с дора-
ботанной для местных рынков упаковкой при контроле влияния других факторов. Можно
использовать /-критерий для двух независимых выборок [28].


Врезка 15.2. Практика маркетинговых исследований

Недоверие, подтвержденное статистически
Описательные статистики указывают на то, что общественное восприятие этики в бизне-
се и, таким образом, этики в маркетинге, слабое. В опросе, проведенном Business Week, 46%
респондентов ответили, что только этические принципы руководителей компаний справед-
ливы. Опрос журнала Time показал, что 76% американцев считают, что менеджерам компа-
ний (и, таким образом, исследователям) не хватает этики поведения, и это отсутствие мора-
ли снижает нравственные стандарты в Соединенных Штатах Америки. Результаты исследо-
вания бизнесменов, проведенные Туше Росс (louche Ross), показали, что мораль является
серьезным вопросом и предположение масс-медиа об отсутствии морали в бизнес-кругах не
преувеличено [29].


ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА
Все три стандартных статистических пакета (SPSS, SAS, BMDP) имеют схожие функ-
ции для вычисления распределения частот, построения таблиц сопряженности признаков
и проверки гипотезы. Основные программы для вычисления распределения частот сле-
дующие: FREQUENCIES (SPSS), UNIVARIATE (SAS) и 2D (BMDP). Другие программы
определяют только распределение частот (FREQ в SAS, 4D в BMDP) или только некото-
рые статистики [27].



Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 595
Компьютерные программы для анализа распределения частот
SPSS
Основная программа в SPSS — FREQUENCIES. С ее помощью строится таблица значе-
ний частот, частостей и накопленных частостей для значений каждой переменной. Она про-
водит расчет всех необходимых статистик, за исключением коэффициента вариации. Если
данные интервальные и требуется определить только итоговые статистики, то можно ис-
пользовать процедуру DESCRIPTIVES. Все статистики, которые вычисляют с помощью
DESCRIPTIVES, доступны и в FREQUENCIES. Однако DESCRIPTIVES эффективнее, по-
скольку она не сортирует значения в таблице частот. Дополнительная программа MEANS
вычисляет среднее значение и стандартное отклонение для зависимой переменной в под-
группах случаев, определяемых независимыми переменными.
SAS
Основная программа в SAS — UNIVARIATE. В дополнение к определению таблицы час-
тот, эта программа позволяет вычислить все необходимые статистики. Другая доступная
процедура — FREQ, Для одномерного распределения частот FREQ не дает ни одной необ-
ходимой статистики. Для определения итоговых статистик используются такие процедуры,
как MEANS, SUMMARY и TABULATE. Следует отметить, что FREQ недоступна в качестве
независимой программы в микрокомпьютерной версии,
BMDP
Главная процедура в BMDP — 2D, она позволяет определять распределение частот и все
ассоциированные статистики, за исключением коэффициента вариации. С помощью ID
можно вычислить итоговые статистики для интервальных данных, но нельзя вычислить
распределение частот. 4D вычисляет распределение частот для метрических и неметрических
данных, но не позволяет вычислить итоговые статистики.
Minitab
1
Главная функция — Stats ^Descriptive Statistics. Выходные величины включают среднее,
медиану, стандартное отклонение, минимум, максимум и квартили. Гистограмму можно
получить при выборе опции Graph^Histogram.
Excel
С помощью функции ToolsOData Analysis (Инструменты"=> Анализ данных) вычисля-
ют дескриптивные статистики. Можно определить среднее, стандартную ошибку, медиа-
ну, моду, стандартное отклонение, дисперсию, эксцесс, асимметрию, размах, минимум,
максимум, сумму и доверительный интервал. Частоты можно отобразитьть с помошью
гистограммы.

Основные программы для построения таблиц сопряженности признаков— CROSSTABS
(SPSS), FREQ (SAS) и 4F (BMDP). Все они могут строить таблицы сопряженности и вычис-
лять данные для ячеек, проценты для категорий в рядах и колонках, высчитывать критерий хи-
квадрат для определения уровня значимости и все рассмотренные показатели силы связи. Про-
грамму TABULATE (SAS) также можно использовать для получения данных для ячеек, про-
центов рядов и колонок, хотя она не вычисляет ни одной ассоциированной статистики. В про-
грамме Minitab таблицы сопряженности и критерий хи-квадрат вычисляют с помощью функ-
ции Stats'*Tables. Каждую из этих характеристик можно выбрать с помощью функции Tables.
Функция Data1^Pivot Table выполняет построение таблиц сопряженности в программе Excel.
Для дополнительного анализа необходимы такие функции: максимум, минимум, среднее или
стандартное отклонение. Расчеты можно провести также на основе других ячеек. Для ChiTest
можно воспользоваться функцией Insert^Function^Statistical^ChiTest.



596 Часть III. Сбор, подготовка и анализ данных
Основная программа для выполнения проверки с помошью (-критерия в SPSS — T-TEST.
Она_с помощью /-критерия проверяет как независимые, так и парные выборки. Все рассмот-
ренные выше непараметрические методы проверки выполняются с помощью программы
NPAR. В SAS используется T-TEST. Непараметрические методы проверки выполняются
программой NPAR1WAY, которая проверяет гипотезу для двух независимых выборок (с по-
мощью критерия Манна—Уитни, медианого критерия и критерия Колмогорова—Смирнова),
а также вычисляет критерий Уилкоксона для парных выборок. Параметрический метод про-
верки с помощью /-критерия можно выполнить в BMDP, используя программы 3D, а непа-
раметрическую проверку с помощью того же критерия — с использованием программы 3S.
Параметрические критерии, доступные в Minitab с помощью функции descriptive stat, сле-
дующие: ^-критерий для средних, /-критерий для средних и двухвыборочный /-критерий.
Непараметрические критерии доступны с помощью функции Stat^Time Series. Они вклю-
чают следующие категории: од но выборочный знаков, Уилкоксона, Манна—Уитни, Круска-
ла-Уэллиса, медианный, Фридмана, серий и попарных разностей. Доступные параметриче-
ские критерии в Excel и других электронных таблицах включают /-критерий: парных выбо-
рок для средних; г-критерий: две независимые выборки, предполагающие равные
дисперсии; /-критерий: две независимые выборки при допущении неравенства дисперсий;
^-критерий: две выборки для средних и F-критерий для дисперсий двух выборок. Непара-
метрических критериев здесь нет.
!
В центре внимания Burke
Основной инструмент, используемый большинством исследователей для анализа дан-
| ных, — построение таблиц сопряженности признаков (кросс-табуляция). Она позволяет
окинуть быстрым взглядом распределение ответов и выявить проблемы с данными. Однако
она может ввести в заблуждение, если не предпринять определенных мер.
Рассмотрим такой пример. Корпорация Burke завершила исследование, представляющее
большой интерес для клиента. Результаты таблиц Burke отличались от недавних результатов
другой маркетинговой компании. Для разбора этого примера используем иллюстративные
данные (фактические данные — частная собственность компании).
Это исследование проводилось среди небольших компаний (с количеством работающих
меньше 20 человек) относительно использования ими кадровых агентств как источника
приема временных рабочих. Взята выборка в 100 фирм с одним работником, а также в 100
фирм с количеством работающих от 2 до 19 человек, Создана следующая таблица,
Это тип таблицы привычен для обычного клиента. Получается, что 52% фирм исполь-
зуют помощь кадровых агентств для привлечения временных рабочих Информационный
центр корпорации Burke имел данные переписи населения, показывающие, что в генераль-
ной совокупности имелось 9,2 миллиона фирм с одним работником и только 2,5 миллиона
фирм с количеством работающих от 2 до 20 человек. Взвешенная общая колонка должна вы-
глядеть следующим образом.
Количество постоянных работников, t
=1 Итого
От 2 до 19
100 100 200
Использовали агентство? База
65 105
Да 40
65%
40% 52%
Нет 95
35
60
35% 48%
60%
Репрезентативная выборка должна включать 157 фирм с одним работником и 43 фирмы
от 2 до 20 человек.
Тогда веса для формирования общей колонки равны 1,57 и 0,43 соответственно.
Правильная таблица должна имеет следующий вид:



Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 597
Количество постоянных работников, t
=1 От 2 до 19 Взвешенный итог
Использовали агентство? База 100 100 200
Да 40 65 91
40% 65% 45%
Нет 60 35 109
60% 35%
% выборочной совокупности (выборки) —1 работник = 0,79
% выборочной совокупности (выборки) — от 2 до 20 работников = 0,21
Теперь клиенту сказали, что 45% (а не 52%) компаний с количеством работников мень-
ше 20 человек используют кадровые агентства для приема временных работников. Может
показаться, что это незначительное изменение, но когда клиент увидел последнюю таблицу,
он принял решение о перестройке своего бизнеса. Никогда не формируйте итоговую колон-
ку в таблицах, не рассмотрев истинное распределение в генеральной совокупности.



РЕЗЮМЕ
Базовый анализ данных позволяет глубже проникнуть в суть явления и является основой как для
выполнения последующего анализа, так и для интерпретации данных. Для каждой переменной не-
обходимо получить распределение частот признаков (вариационный ряд). Результаты анализа отра-
жены в таблицах частот, частостей и накопленных частот для всех значений переменной. Они по-
казывают наличие выбросов, пропущенных или экстремальных значений. Показатели центра рас-
пределения— среднее арифметическое, медиана и мода. Вариация распределения признаков
описывается размахом, дисперсией, стандартным отклонением, коэффициентом вариации и меж-
квартильным размахом. Форму кривой распределения определяют асимметрия и эксцесс.
Кросс-табуляция представляет собой процедуру создания таблиц сопряженности призна-
ков, которые отражают совместное распределение значений двух или больше переменных.
В кросс-табуляции проценты вычисляем по колонкам (к итоговой колонке) или по рядам
(к итоговому ряду). Общее правило — вычисление процентов в направлении независимой пе-
ременной через зависимую переменную.
Часто, чтобы лучше уяснить суть связи переменных, вводят третью переменную. Статистика
хи-квадрат позволяет проверить статистическую значимость наблюдаемой связи в таблице со-
пряженности. С помощью фи-коэффициента, коэффициента сопряженности, V -коэффициент
Крамера и коэффициента "лямбда" определяют силу связи между переменными.
Для проверки гипотез о различиях используют параметрические и непараметрические ме-
тоды. Из параметрических методов для проверки гипотезы относительно среднего совокупно-
сти используют /-критерий. Его различные типы подходят для проверки гипотезы, в основе ко-
торой лежит одна выборка, две независимые выборки или парные выборки. Из непараметри-
ческих методов популярны одновыборочные критерии, включающие критерий согласия
Колмогорова—Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий.
Для двух независимых непараметрических выборок можно использовать ^/-критерий Манна-
Уитни, медианный критерий и критерий Колмогорова—Смирнова. В случае парных выборок
для проверки гипотезы о показателе центра распределения полезны критерий попарных срав-
нений Уилкоксона и критерий знаков.


ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ
• /-критерий, критерий Фишера (/-test) • /-критерий (/-test)
• /"-распределение (/'-distribution) • /-распределение (/ -distribution)
• /"-статистика (/"-statistic)


598 Часть III. Сбор, подготовка и анализ данных
• {/-критерий Манна-Уитни (Mann- нулевая гипотеза (null hypothesis)
Whitney U-test) одновыборочный критерий согласия
• К-коэффициент Крамера (Cramer's V) Колмогорова—Смирнова (Kolmogorov—
Smirnov one-sample test)
• г-статистики ( г -test)
односторонний критерий (one-tailed test)
• альтернативная гипотеза (alternative
hypothesis) ошибка I рода (type I error)
• асимметричная "лямбда" (asymmetric ошибка II рода (type II error)
lambda) параметрические методы проверки гипо-
• асимметрия (skewness) тез (parametric tests)
• биномиальный критерий (binomial test) парные выборки (paired samples)
• вариационный ряд, распределение частот парный г -критерий (paired samples t test)
(frequency distribution) показатели вариации (measures of
• выборочная (наблюдаемая) статистика, variability)
статистика критерия (test statistic) показатели центра распределения
• гамма (gamma) (measures of location)
• двусторонний критерий (two-tailed test) построение таблицы сопряженности
признаков, кросс-табуляция (cross-
• двухвыборочный критерий согласия
tabulation)
Колмогорова—Смирнова (Kolmogorov—
Smirnov two-sample test) размах вариации (range)
• двухвыборочный медианный критерий распределение хи-квадрат (chi-square
(two-sample median test) distribution)
• дисперсия (variance) симметричная "лямбда" (symmetric
lambda)
• коэффициент вариации (coefficient of
variation) средняя арифметическая, среднее (mean)
• коэффициент сопряженности признаков стандартное (среднеквадратическое) от-
(contingency coefficient) клонение (standard deviation)
• критерий знаков (sign test) t -статистика ( t -statistic)
• критерий попарных сравнений Уилкоксо- статистика хи-квадрат (chi-square statistic)
на (Wilcoxon matched-pairs signed-ranks test)
таблица сопряженности призна-
• критерий серий (run test) ков (contingency table)
• медиана (median) тау b (tau b )
• межквартильный размах (interquartile тау с (tau с )
range)
уровень значимости (level of significance)
• мода (mode)
фи-коэффициент (phi coefficient)
• мощность критерия (power of a test)
эксцесс (kurtosis)
• независимые выборки (independent
samples)
• непараметрические методы проверки ги-
потез (nonparametric tests)


УПРАЖНЕНИЯ
Вопросы
1. Опишите процедуру определения частот распределения значений переменной.
2. Какие показатели центра распределения обычно вычисляют?


Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 599
3. Определите межквартильный размах. Что он измеряет?
4. Что означает коэффициент вариации?
5. Каким образом измеряют относительную плоско верши нность или островершинность кри-
вой распределения?
6. Что такое асимметричное распределение?
7. Чем отличается таблица распределения частот от таблицы сопряженности?
8. Какое общее правило вычисления процентов при кросс-табуляции?
9. Дайте определение ложной корреляции.
10. Что означает подавленная связь? Как ее выясняют?
П. Проанализируйте причины частого использования таблиц сопряженности. Каковы огра-
ничения их применения?
12. Представьте классификацию методов проверки гипотез.
13. Опишите обычную процедуру для выполнения проверки гипотезы с помощью /-критерия.
14. Чем отличаются параметрические и непараметрические методы проверки гипотез?
15. Какие непараметрические критерии соответствуют t -критерию двух независимых выборок
для параметрических данных?
16. Какие непараметрические критерии соответствуют t -критерию парных выборок для пара-
метрических данных?

Задачи
1. Для каждой из следующих ситуаций укажите статистический анализ, который надо провес-
ти, и подходящий для этого критерий или тест-статистику.
a) Потребители оценили свое предпочтение мыла Camay по 11-балльной шкале Лайкерта.
Затем они просмотрели коммерческую рекламу о мыле Camay. После этого предпочте-
ния потребителей опять измерили. Изменила ли реклама предпочтения потребителей?
b) Подчиняются ли предпочтения относительно мыла Camay закону нормального распре-
деления?
c) Маркетологи разбили одну тысячу семей на следующие группы, исходя из уровня по-
требления мороженного: много, средне, мало и не употребляющие. Одновременно их
разделили на семьи с высоким, средним и низким доходом, Зависит ли потребление
мороженого от уровня дохода?
d) В исследовании, использующем репрезентативную выборку из 2000 домохозяйств из
потребительской почтовой панели Market Facts, респондентов попросили проранжи-
ровать 10 универмагов, включая универмаг Sears, в порядке предпочтения. Выборка
была разделена на малые и большие семьи (по медиане). Варьируются ли предпочте-
ния покупателей относительно покупки товаров в универмаге Sears в зависимости от
размера семьи?
2. Текущую рекламную кампанию для известного прохладительного напитка следует изме-
нить, если реклама понравится менее чем 30% потребителей.
a) Сформулируйте нулевую и альтернативную гипотезы.
b) Обсудите ошибки I и II рода, которые могут иметь место при проверке гипотез,
c) Какой статистический критерий вам следует использовать? Почему?
d) Была взята случайная выборка из 300 потребителей, и 84 респондента указали, что им
понравилась рекламная кампания. Стоит ли вносить в рекламную кампанию корректи-
ровку? Почему?



600 Часть III. Сбор, подготовка и анализ данных
3. Сеть универмагов (10 магазинов) организовала распродажу холодильников. Количество
проданных холодильников в выборке из десяти магазинов было такими: 80 110 0 40 70 80
100 50 80 30
a) Очевидно ли, что в среднем продано свыше 50 холодильников одним магазином в тече-
ние этой распродажи? Используйте а = 0,05 .
b) Какое допущение необходимо сделать для этой проверки?



УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET
И КОМПЬЮТЕРА
1. Используйте статистические пакеты (SPSS, SAS BMDP) для вычисления статистического
критерия для задачи 3.



КОММЕНТАРИИ
1. Chow-Hou Wee, Mei-Lan Choong, Siok-Kuan Tambyah, "Sex Role Portrayal in Television Adver-
tising", International Marketing Review, January 1995, p. 49-64; Магу С. Gilly, "Sex Roles in Ad-
vertising: A Comparison of Television Advertisements in Australia, Mexico and the United States",
Journal of Marketing, April 1988, p. 75-85.
2. Melissa Dowling, "To Go Direct — or Not", Catalog Age, September 1, 1997, p. 5; Troy A. Fester-
vand, Don R. Snyder, John D. Tsalikis, "Influence of Catalog vs. Store Shopping and Prior Satisfac-
tion on Perceived Risk", Journalof the Academy of Marketing Science, Winter 1986, p. 28—36.
3. Saviour L.S. Nwacukwu, Scott. J. Vitell, Jr., Faye W. Gilbert, James H. Barnes, "Ethics and Social
Responsibility in Marketing: An Examination of the Ethical Evaluation of Advertising Strategies",
Journal of Business Research, June 1997, p. 107—18; Shelby D. Hunt, Lawrence B. Chonko, "Ethical
Problems of Advertising Agency Executives", Journal of Advertising, Fall 1994,p. 16—24.
4. О применении частот и дискрептивных статистик см, статью Mary Jo Bitner, Bernard H.
Booms, Lois A. Mohr, "Critical Service Encounters: The Employee's Viewpoint", Journal of
Marketing, October 1994, p. 95-106.
5. Для более подробного описания таких статистик см. любую книгу по статистике, например,
Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed.
(Englewood Cliffs, NJ: Prentice Hall, 1996).
6. Для нашей цели не следует делать различие между проверкой гипотезы и статистическим
выводом через доверительный интервал.
7. Thomas T. Semon, "Let's Hear It for Disaggregate Analysis", Marketing News, March 25, 1996,
p. 10; O. Hellevik, Introduction to Causa! Analysis: Exploring Survey Data by CrossTabulation (Beverly
Hills, CA: Sage Publications, 1984).
8. Lawrence F. Feick, "Analyzing Marketing Research Data with Association Models", Journal of
Marketing Research, November 1984, p. 376-386. Последние применения см. в статье Wagner
A. Kamakura, Michel Wedel, "Statistical Data Fusion for Cross-Tabulation", Journal of Marketing
Research, November 1997, p. 485-498.
9. Wayne Lenell, Robert Boissoneau, "Using Causal-Comparative and Correlational Designs in Con-
ducting Market Research", Journal of Professional Services Marketing, February 1996, p, 59-69.
10. R. Mark Sirkin, Statistics for the Social Sciences (Thousand Oaks, CA: Sage Publications, 1997).
11. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publi-
cations, 1997). Для более глубокого изучения см. работу Н.О. Lancaster, The Chi-Squared
Distribution (New York: John Wiley, 1969).

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 601
12. Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed.
(Upper Saddle River, NJ: Prentice Hall, 1996):
13. Однако некоторые ученые-статистики с этим не согласны. Они считают, что не стоит ис-
пользовать поправочный коэффициент. См., например, статью John E, Overall, "Power of
Chi-Square Tests for 2 x 2 Contingency Tables with Small Expected Frequencies", Psychological
Bulletin, January 1980, p, 132-135.
14. Проверка значимости и доверительных интервалов также возможна как для асимметрично-
го коэффициента "лямбда", так и для симметричного. См. статью L.A. Goodman,
W.H. Kruskal, "Measures of Association for Cross Classification: Appropriate Sampling Theory",
Journal of the American Statistical Association, June 1963, p. 310—364.
15. Rohit Verma, John C. Goodale, "Statistical Power in Operations Management Research", Journal of
Operations Management, August 1995, p. 139—152.
16. С технической точки зрения нулевую гипотезу нельзя принять. Ее можно либо отвергнуть,
либо не отвергнуть.
17. Условие, когда нельзя предполагать равенства дисперсий, известно под названием пробле-
мы Беренса-Фишера (Behrens-Fisher). Существует несколько мнений по поводу лучшего
метода расчета данного случая,
18. Anne L. Balazs, "Positioning the Retail Shopping Center for Aging Customers", Stores, April 1995,
p. RR10—RR11; James R. Lumpkin, James B. Hunt, "Mobility as an Influence on Retail Patronage
Behavior of the Elderly: Testing Conventional Wisdom'', Journal of the Academy of Marketing Science,
Winter 1989, p. 1-12.
19. Eleflheria Parpis, "Playing for the Ring", Adweek (Eastern Edition), January 19, 1998, p. 29—31;
Larry Dunst, "Is It Possible to Get Creative in 15 Seconds?", Advertising Age, November 29, 1993,
p. 18; Jerry A. Rosenblatt, Janett Mainprize, "The History and Future of 15-Second Commercials:
An Empirical Investigation of the Perception of Ad Agency Media Directors", in William Lazer, Eric
Shaw, Chow-Hou Wee (eds.), World Marketing Congress (International Conference Scries), vol. IV
(Boca Raton, FL: Academy of Marketing Science, 1989), p. 169-177.
20. Gopal K. Kanji, 100 Statistical Tests (Thousand Oaks, CA: Sage Publications, 1993); Donald L.
Harnett, Statistical Methods, 3rd ed. (Reading, MA: Addison-Wesley, 1982).
21. Marjorie A. Pelt, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publi-
cations, 1997),
22. Существуют разные точки зрения о том, следует ли использовать непараметрические стати-
стические методы, чтобы сделать статистический вывод о параметрах совокупности. См.
также статью Y.K. Cheung, J.H. Klotz, "The Mann-Whitney-Wilcoxon Distribution Using linked
Lists", Statistica Sinica, July 1997, p. 805-813.
23. t -критерий в этом случае эквивалентен критерию "хи-квадрат" для проверки независимо-
сти в таблице сопряженности 2x2 . Этих два критерия связаны между собой следующим
образом: #:о.и<п = п>.<и<«,+« ; -2). Для больших выборок г-распределение приближается к
нормальному, следовательно, / -критерий и г-критерий эквивалентны.
24. James R, Crum, Pradeep A. Rau, Stephen K. Reiser, 'The Marketing Research Process: Role Per-
ceptions of Researches and Users", Journal of Advertising Research, December—January 1988, p. 9—
21. См, также статью Cyndee Miller, "Gallup Brothers Analyze the Research Industry", Marketing
News, January 6, 1997, p. 2.
25. Пример последнего применения критерия парных сравнений Вилкоксона приведен в рабо-
те U. Kalwani, Narakesari Narayandas, "Long-Term Manufacturer-Supplier Relationships: Do
They Pay Off for Supplier Firms?", Journal of Marketing, January 1995, p. 1—16.
26. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publi-
cations, 1997); J.G. Field, "The World's Simplest Test of Significance", Journal of the Market
Research Society, July 1971, p. 170-172.

Часть III. Сбор, подготовка и анализ данных
602
27. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publica-
tions, 1993); Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks,
CA: Sage Publications, 1993); Mahamed Afzal Norat, "Software Reviews", Economic Journal: The
Journal of the Royal Economic Society, May 1997, p. 857—882; John Wass, "How Statistical Software
Can be Assessed", Scientific Computing and Automation (October 1966).
28. Leslie de Chernatony, Chris Halliburton, Ratna Bernath, "International Branding: Demand or Sup-
ply Driven", International Marketing Review, February 1995, p. 9—21.
29. Lawrence B. Chonko, Ethical Decision Making in Marketing (Thousand Oaks, CA: Sage Publications,
1995); G.R. Laczniak, E. Murphy, "Foresting Ethical Marketing Decisions", Journal of Business
Ethics, October 1991, p. 259-271.




Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 603
Г л а в а 16
Дисперсионный
и ковариационный анализ
После изучения материала этой главы вы должны уметь...
1. Трактовать диапазон применения дисперсионного анализа (ANOVA) и его связь с
(-критерием и регрессионным анализом.
2. Описывать однофакторный дисперсионный анализ, включая разложение полной вариа-
ции, измерение эффектов, проверку значимости и интерпретацию результатов.
3. Рассматривать многофакторный дисперсионный анализ и проверять значимость полного
эффекта, эффекта взаимодействия и главный эффект каждого фактора.
4. Проводить анализ ковариации и показывать, каким образом он учитывает влияние не-
управляемых независимых переменных.
5. Объяснять ключевые факторы, относящиеся к интерпретации результатов, делая акцент на
взаимодействии факторов, их относительной важности и множественных сравнениях.
6. Обсуждать специальные методы дисперсионного анализа, используемые в маркетинге, та-
кие как повторные измерения в дисперсионном анализе, неметрический дисперсионный
анализ и многомерный дисперсионный анализ (MANOVA).


КРАТКИЙ ОБЗОР
В главе 15 мы изучали методы проверки различий между двумя средними или двумя ме-
дианами разных выборок. В этой главе мы рассмотрим что делать в том случае, если маркетолог
имеет дело с большим числом средних или медиан. Такого рода методы называют дисперсион-
ным анализом и ковариационным анализом. Несмотря на то, что обычно их используют для ана-
лиза экспериментальных данных, они также полезны для анализа результатов опроса или дан-
ных наблюдений.
Опишем методы выполнения дисперсионного и ковариационного анализа и обсудим их
соотношение с другими методами проверки связей. Затем опишем однофакторный диспер-
сионный анализ, самый простой из этих методов, следом за ним — многофакторный дис-
персионный и ковариационный анализ. Особое внимание мы уделим вопросам интерпрета-
ции результатов, а именно, взаимодействию факторов, их относительной важности и мно-
жественным сравнениям. Мы широко осветим некоторые специальные темы, такие как
повторные измерения в дисперсионном анализе, неметрический дисперсионный анализ и
многомерный дисперсионный анализ. Рассмотрим примеры, иллюстрирующих применение
дисперсионного анализа.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА
"""
""I


Дисперсионный анализ
В проекте "Выбор универмага" несколько независимых переменных относились к числу ка-
тегориальных, имеющих больше двух категорий (уровней) значения. Например, степень ос- !
ведомленности об универсальных магазинах маркетологи разделили на высокую, среднюю :
и низкую. С помощью дисперсионного анализа они выявили влияние этих независимых 1

604 Часть III. Сбор, подготовка и анализ данных
переменных на метрические зависимые переменные. Таким образом маркетологи получили
общее представление об этой проблеме, что послужило основанием для последующего ана-
лиза данных. Так, использование трех категорий применительно к степени осведомленно-
сти о магазине не позволило получить статистически значимые результаты, тогда как разде-
ление степени осведомленности на два уровня (высокая и низкая степень) привело к зна-
чимым результатам. Таким образом маркетологи увидели, что в данном случае лучше всего
подходит рассмотрение степени осведомленности о магазине как переменной, имеющей
только две категории.



ПРИМЕР. Риски электронной коммерции
Для проверки различий в предпочтениях приобретения через Internet товаров с различ-
ными уровнями экономического и социального риска маркетологи использовали дисперси-
онный анализ. Экономический и социальный риск имел два значения (высокий и низкий
риск). Предпочтение к приобретению товаров через Internet выступало зависимой перемен-
ной. Результаты выявили существенное взаимодействие социального и экономического
риска. Приобретение товаров через Internet не является предпочтительным для продуктов с
высоким социальным риском (например, модной одежды), независимо от уровня экономи-
ческого риска товара, но зато предпочтительно для продуктов с низким экономическим
риском по сравнению с продуктами с высоким экономическим риском при низком уровне
социального риска [1].



ПРИМЕР. Лекарства с точки зрения ANOVA
Анализируя эффективность различных форматов рекламных обращений для продавае-
мого без рецепта средства от изжоги, маркетологи изучили роль содержания рекламного об-
ращения и относительной новизны торговой марки. Зависимой переменной выступало от-
ношение к рекламируемой торговой марке. Независимыми переменными служили три фак-
тора, каждый из которых имел две категории: формат рекламы, содержание и относительная
новизна.
Категории формата рекламы были следующие; реклама со сравнением и реклама без
сравнения. В первом случае для сравнения использовались широко известные торговые
марки Rolaids и Turns. Категрии относительной новизны получали, изменяя производителя
лекарства. Название Alka-Seltzer использовалось в качестве твердо устоявшейся торговой
марки, вто время как Acid-off выступало новой маркой. Название Acid-off выбрано на осно-
ве предварительного тестирования. Категориями содержания рекламного обращения высту-
пали фактическое и ценностное содержания.
Респондентов набрали в торговом центре и случайным образом распределили по разным
1 группам. Из 207 полученных ответов 200 признали годными для анализа. 25 респондентов
| вошли в каждую из восьми ( 2 x 2 x 2 ) групп для проведения эксперимента.
Затем был выполнен трехфакторный дисперсионный анализ, где зависимой переменной
служило отношение респондента к торговой марке. Общие результаты оказались статистиче-
ски значимыми. Взаимодействие трех факторов также оказалось существенным. Из имею-
щихся двухфакторных взаимодействий статистически значимым было только взаимодейст-
вие между форматом рекламного ролика и относительной новизной. На основании этих ре-
зультатов маркетологи сделали вывод, что сравнительный формат рекламы, который
подчеркивал фактическую информацию, оказался наиболее подходящим для выхода на ры-
нок нового товара [2].

В примере с универсальным магазином, где осведомленность была представлена тремя ка-
тегориями (уровнями), /-критерий не подходил для изучения различий выборочных средних,
поэтому применили дисперсионный анализ. Изучение приобретения товаров через Internet

Глава 16. Дисперсионный и ковариационный анализ 605
включало сравнение средних при наличии двух факторов (независимых переменных), у каждо-
го из которых было два уровня. Более сложное исследование сравнительной эффективности
рекламы лекарства включало три фактора, у каждого из которых было два уровня. В последних
двух примерах /-критерии также оказались неподходящими, поскольку влияние каждого фак-
тора зависело от действия других факторов (взаимодействия факторов были существенными),
В следующем разделе этой главы рассматривается связь дисперсионного анализа с /-критерием
и другими методами проверки.


ВЗАИМОСВЯЗЬ МЕТОДОВ
Дисперсионный и ковариационный анализ используется маркетологами для изучения
различий средних значений зависимых переменных, вызванных влиянием контролируе-
мых независимых переменных, при условии, что учтено влияние неконтролируемых не-
зависимых переменных. По сути, дисперсионный анализ (analysis of variance — ANOVA)
применяют как проверку статистической значимости различий выборочных средних для
двух или больше совокупностей. Обычно нулевая гипотеза утверждает, что все выбороч-
ные средние равны. Например, предположим, что исследователю интересно узнать, дей-
ствительно ли люди с различным уровнем потребления сухих завтраков (едят много,
средне, слабо и вообще не едят) различаются предпочтением к Total cereal, измеренным по
девятибалльной шкале Лайкерта. Проверку нулевой гипотезы, утверждающей, что четыре
группы потребителей не различаются предпочтением к Total, можно выполнить, исполь-
зуя дисперсионный анализ.

Дисперсионный анализ (analysis of variance — ANOVA)
Статистический метод изучения различий между выборочными средними для двух или
больше совокупностей.

В своей простейшей форме дисперсионный анализ должен иметь зависимую переменную
(предпочтение к сухому завтраку Total cereal), которая является метрической (измеренной с по-
мощью интервальной или относительной шкалы). Кроме того, должна быть одна или больше
независимых переменных (потребление продукта: сильное, среднее, слабое и отсутствие по-
требления). Все независимые переменные должны быть категориальными (неметрическими),
их еще называют факторами (factors).

Фактор (factors)
Категориальная независимая переменная. Чтобы использовать дисперсионный анализ, не-
зависимые переменные должны все быть категориальными (неметрическими).

факторным
Конкретная комбинация уровней факторов называется экспериментом
(условиями испытаний) (treatment).

Факторный эксперимент (условия испытаний) (treatment)
В дисперсионном анализе конкретная комбинация категорий (уровней) факторов.

Однофакторный дисперсионный анализ (one-way analysis of variance) включает только одну
категориальную переменную или единственный фактор.

Однофакторный дисперсионный анализ (one-way analysis of variance)
Метод дисперсионного анализа, при котором используется только один фактор.




606 Часть III. Сбор, подготовка и анализ данных
Различия в предпочтениях потребителей с сильным, средним, слабым и нулевым уровнями
потребления можно изучить с помощью однофакторного дисперсионного анализа, в котором
факторный эксперимент представлен определенным уровнем фактора (пользователи со сред-
ним уровнем потребления как раз и составляют факторный эксперимент). Если существует два
или больше факторов, то анализ называют многофакторным дисперсионным анализом (n-way
analysis of variance). (Если в дополнение к фактору использования продукта исследователь так-
же хочет узнать отношение к Tola! cereal потребителей с разным уровнем лояльности (новый
фактор), то для этого подходит многофакторный дисперсионный анализ).

Многофакторный дисперсионный анализ (n-way analysis of variance)
Модель дисперсионного анализа, которая включает два или больше факторов.

Если набор независимых переменных состоит из категориальных и метрических перемен-
ных, то их изучают методом ковариационного анализа (analysis of covariance — ANCOVA).

Ковариационный анализ, ANCOVA (analysis of covariance — ANCOVA)
Специальный метод анализа дисперсий, в котором эффекты одной или больше сторонних
переменных, выраженных в метрической шкале, удаляют из зависимой переменной перед
выполнением дисперсионного анализа.

Например, ковариационный анализ необходим, если исследователь хочет изучить предпоч-
тения пользователей в группах с различным уровнем потребления и уровнем лояльности, при-
няв во внимание отношение респондентов к составу продуктов питания и к значению завтрака,
как способу приема пищи. Две последние переменные измеряются по девятибалльной шкале
Лайкерта. В этом случае категориальные независимые переменные (потребление продукта и
лояльность к торговой марке) по-прежнему называются факторами, в то время как метрические
независимые переменные (отношение к составу продуктов питания и значение, придаваемое
завтраку) — ковариатами (covariates).

Ковариата (covariates)
Метрическая независимая переменная, используемая в ковариационном анализе
{ANCOVA).

Взаимосвязь дисперсионного анализа с f-критерием и другими методами анализа, такими
как регрессионный анализ (глава 17), показана на рис. 16.1.
Во всех этих методах анализа используется метрическая зависимая переменная. Дис-
персионный и ковариационный анализ может включать несколько независимых пере-
менных (степень использования продукта, лояльность к торговой марке, отношение, важ-
ность). Более того, одна из независимых переменных должна быть категориальной и кате-
гориальные переменные могут иметь больше двух уровней (в нашем примере степень
использования продукта имеет четыре уровня). С другой стороны, /-критерий предназна-
чен для использования в случае с единственной бинарной независимой переменной. На-
пример, различие в предпочтениях товара у лояльных и нелояльных респондентов можно
узнать, выполнив проверку с помощью /-критерия. Регрессионный анализ, подобный
дисперсионному и ковариационному, также может включать несколько независимых пе-
ременных. Однако все независимые переменные, в основном, измеряются интервальной
шкалой, хотя бинарные или категориальные переменные могут приспосабливаться к ана-
лизу за счет введения фиктивных (dummy) переменных. Например, связь между предпоч-
тением продукта Total cereal, отношением к составу продукта и важностью завтрака можно
изучить с помощью регрессионного анализа.




Глава 16. Дисперсионный и ковариационный анализ 607
Одна или несколько
независимых переменных




Категориальная
.. Категориальная
ьинарнавпеременная <лЯ1Гтпг.няо1 интмюяпииа
и




Дисперсионный Ковариационный




Однофакторный Многофакторный
..анализ .дисперсионный анализ

Рис. 16.1. Взаимосвязь между t-критерием, дисперсионным и ковариационным
анализом и регрессией



ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Довольно часто у маркетологов возникает необходимость установить различия в средних
значениях зависимой переменной для нескольких категорий одной независимой перемен-
ной (фактора).
• Различаются ли разные сегменты рынка с точки зрения объема потребления товара?
• Действительно ли различаются оценки торговой марки группами респондентов, кото-
рые посмотрели разные рекламные ролики?
• Различается ли отношение розничных, оптовых торговцев и торговых агентов к полити-
ке распределения, проводимой фирмой?
• Зависит ли намерение потребителей приобрести товар данной торговой марки от разни-
цы в уровнях цен?
• Влияет ли осведомленность потребителей о магазине (высокая, средняя и низкая) на
предпочтение данного магазина?
Ответ на эти и другие вопросы можно получить, выполнив однофакторный дисперсион-
ный анализ. Перед описанием процедуры мы определим основные статистики, используемые
в однофакторном дисперсионном анализе [3].




Часть III. Сбор, подготовка и анализ данных
608
СТАТИСТИКИ, ИСПОЛЬЗУЕМЫЕ
В ОДНОФАКТОРНОМ ДИСПЕРСИОННОМ АНАЛИЗЕ
Эта-квадрат (п.2) — корреляционное отношение. С ее помощью выражают степень влияния
или силу эффекта А1 (независимой переменной, фактора) на У (зависимую переменную). Зна-
чение п2 лежит в интервале от 0 до 1.
F-статистика (F-statistic). Нулевую гипотезу о том, что категориальные средние в двух вы-
борочных совокупностях равны, проверяют с помощью f-статистики, представляющей собой
отношение межгрупповой дисперсии к дисперсии ошибки (отношение среднего квадрата X к
среднему квадрату ошибки).
Средний квадрат (mean square). Сумма квадратов отклонений наблюдений, деленная на со-
ответствующее ей число степеней свободы.
SSmx^, вариация переменной Y, обусловленная различием средних между группами
(межгрупповая дисперсия) (SS^^^ SSf). Вариация переменной К, связанная с вариацией сред-
них значений категорий переменной X. Она представляет собой вариацию между уровнями пе-
ременной Xили долю в сумме квадратов переменной Y, связанную с переменной X.
SSeHympu> вариация переменной Y, обусловленная вариацией внутри каждой группы категорий
(внутригрунповая дисперсия) (SSvilhin Ssfmr). Это вариация переменной Y, обусловленная изме-
нением внутри каждой из групп переменной X. Она осуществляется за счет всех факторов, кро-
ме АЧпри исключенном X).
Общая сумма квадратов SSy. Полная дисперсия переменной Y.


ВЫПОЛНЕНИЕ ОДНОФАКТОРНОГО
ДИСПЕРСИОННОГО АНАЛИЗА
Процедура выполнения однофакторного дисперсионного анализа представлена на
рис. 16.2.

...Определение зависимой и независимой переменных




Рис. 16.2. Однофакторный дисперсионный анализ

Она включает: определение зависимых и независимых переменных, разложение общей ва-
риации, измерение эффектов, проверку значимости и интерпретацию результатов. Мы под-
робно рассмотрим эти стадии и их применение.




Глава 16. Дисперсионный и ковариационный анализ 609
Определение зависимой и независимой переменных
Пусть Y— зависимая переменная, а X— независимая переменная. К— это категориаль-
ная переменная, имеющая с категорий (уровней, групп). Для каждой группы Л"существует п
наблюдений Y, как это показано в табл. 16.1. Из данных таблицы видно, что размер выборки
в каждой группе ЛТ равен п, а размер общей выборки N = п х с. Для упрощения допускают,
что размеры выборок в группах переменной ЛТ(групповые размеры) равны, но это допущение
необязательно.

Таблица 16.1. Разложение полной вариации: однофакторный дисперсионный анализ
Независимая переменная X
Полная
Группы выборка



Уг
Полная вариация
Внутригрупповая вариация
= SSy
=
55анутр(



Yfl
Y-




Групповые средние Y2 Y,

Межгрупповая вариация = SSMaw

Разложение полной вариации
Для изучения различий между средними однофакторный дисперсионный анализ исполь-
зует разложение полной вариации (decomposition of the total variation), наблюдаемой в зависи-
мой переменной.

Разложение полной вариации (decomposition of the total variation)
8 однофакторном дисперсионном анализе разделение вариации, зависимой переменной,
на вариацию, обусловленную различием средних внутри групп плюс вариацию, обуслов-
ленную внутригрупповой изменчивостью.

Эту вариацию вычисляют как сумму квадратов с поправкой на среднее (на число степеней
свободы) (SS). Дисперсионный анализ называют так потому, что он изучает изменчивость или
дисперсию выборки (применительно к зависимым переменным) и, исходя из этой изменчиво-
сти, определяет, действительно ли выборочные средние равны между собой.
Полную вариацию У, обозначаемую SS, можно разложить на два компонента:
ЬЬцнокду """ ^внутри
Ь&у
где нижние индексы между (between) и внутри (within) относятся к группам переменной X.
SSMf*cay˜ это вариация переменной Y, связанная с различием средних между группами пере-
менной X. Она представляет вариацию между категориями переменной X (межгрупповая из-
менчивость). Другими словами, 53„ежду -˜ это доля в сумме квадратов переменной Y, обуслов-
ленная действием независимой переменной или фактором X. Поэтому 55жжАу также обозначают
как SB*. SSMHympu — это вариация переменной У, связанная с вариацией внутри каждой группы


Часть III. Сбор, подготовка и анализ данных
610
переменной X, ее вычисляют, не учитывая фактор X. Поэтому SSmympu также называют диспер-
сией ОШИбкИ 55ОШиб№
SS = SS + SS




yj — отдельное наблюдение
Y} —среднее для группы/
Y — среднее для всей выборки или общая средняя
Yij — i-наблюдение в/-группе
Смысл разложения полной вариации в переменной Y, SSy на компоненты SS^^ и SSeHympli в
том, чтобы наглядно представить и затем изучить различия в групповых средних. Вспомним из
главы 15, если вариация переменной в совокупности известна, то можно определить, насколь-
ко сильно изменение выборочного среднего обусловлено только случайной вариацией. В дис-
персионном анализе рассматривают несколько различных групп (например, сильное, среднее,
слабое использование, отсутствие использования товара). Если нулевая гипотеза верна, и все
группы имеют одно и то же среднее значение совокупности, то можно оценить, насколько
сильно отличаются выборочные средние вследствие только выборочной (случайной) вариации.
Если наблюдаемое различие в выборочных средних больше ожидаемого, то логично заключить,
что эта дополнительная вариация связана с различиями в групповых средних в совокупности.
В дисперсионном анализе мы определяем два показателя вариации: внутри групп (SS,,Hymi,a)
(внутригрупповая изменчивость) и между группами (SSHejfdy) (межгрупповая изменчивость).
Внутри групповая вариация показывает, насколько сильно кодеблятся значения переменной Y
внутри группы. Поэтому ее используют для оценки дисперсии внутри группы. Предполагает-
ся, что все группы в рассматриваемой совокупности имеют одну и ту же вариацию. Однако из-
за того, что неизвестно, имеют ли все группы одно и то же значение средней, мы не может вы-
числить дисперсию всех объединенных вместе наблюдений. Дисперсия для каждой группы
рассчитывается отдельно, и затем эти дисперсии следует объединить в "среднюю" или
"общую". Аналогично, можно получить другую оценку дисперсии значений Y, изучив вариа-
ции между средними- (Этот процесс обратный процессу определения вариации в средних.) Ес-
ли среднее совокупности одно и то же во всех группах, то для оценки дисперсии К используем
вариацию в выборочных средних и размеры выборочных групп. Приемлемость этой оценки
дисперсии Узависит от истинности нулевой гипотезы. Если нулевая гипотеза верна и средние
совокупности равны, то оценка дисперсии на основе межгрупповой изменчивости корректна.
С другой стороны, если группы имеют различные средние в совокупности, то оценка диспер-
сии на основе межгрупповой изменчивости слишком большая. Таким образом, сравнивая
оценки дисперсии на основе межгрупповой и внутригрупповой изменчивости (вариации), мы
можем проверить нулевую гипотезу [4]. Разложение полной вариации также позволяет изме-
рить влияние переменной ЛГ на Y.

Измерение эффекта
Сила влияния переменной А1 на У измеряется с помощью SSf. Поскольку SSt связана с ва-
риацией средних значений групп X, то относительное значение SS^ растет с увеличением раз-
личий между средними значениями У в группах X. Относительное значение SSX также увели-
чивается при уменьшении вариаций Y внутри групп X. Эффект влияния переменной X на Y
вычисляют по формуле:


Глава 16. Дисперсионный и ковариационный анализ 611
JiJ tJj


2
Значение корреляционного отношения п лежит в пределах от 0 до 1. Оно равно нулю, когда
2
все групповые средние равны, т.е. переменная X не влияет на Y. Значение г\ равно 1, когда
внутри каждой из групп переменной Xизменчивость отсутствует, но имеется некоторая измен-
чивость между группами. Таким образом, г\2 представляет собой меру вариации Y, которая объ-
ясняется влиянием независимой переменной X. Мы не только можем измерить влияние Хна
Y, но и проверить его значимость.

Проверка значимости
В однофакторном дисперсионном анализе проверяют нулевую гипотезу, утверждающую,
что групповые средние в рассматриваемой совокупности равны [5]. Другими словами,


В соответствии с нулевой гипотезой значения 55V и SSoiauSllu зависят от одного источника ва-
риации. В таком случае оценка дисперсии совокупности К может определяться межгрупповой
или внутри групповой вариацией. Иначе говоря, оценка дисперсии совокупности Y
SS,
„;_
у
˜ (с-\]
= средний квадрат, обусловленный действием X
= MSX
или
S,1 = '
(УУ-с)
= средний квадрат, обусловленный действием всех факторов, кроме X
=
М5ошибки.
Нулевую гипотезу можно проверить с помощью /"-статистики, рассчитываемой как отно-
шение между этими двумя оценками дисперсий:
SSJ(c˜\) MS,
Шои,„й„
SSuua^J(N-c)
Эта статистика подчиняется /"-распределению с числом степеней свободы (d0, равным (с — 1)
и (N — с). Таблица распределения /'-статистики приведена в табл. 5 Статистического приложе-
ния. Как упоминалось в главе 15, /"-распределение представляет собой распределение вероят-
ностей отношений выборочных дисперсий. Значение F зависит от числа степеней свободы в
числителе и знаменателе [6].

Интерпретация результатов
Если нулевую гипотезу о равенстве групповых средних не отклоняют, то независимая пере-
менная не оказывает статистически значимого влияния на зависимую переменную. С другой
стороны, если нулевую гипотезу отклонить, то эффект независимой переменной на зависимую
трактуется как статистически значимый. Другими словами, среднее значение зависимой пере-
менной различно для различных групп независимой переменной. Сравнение значений груп-
повых средних показывает характер влияния независимой переменной. Другие важные вопро-
сы интерпретации результатов, такие как изучение различий между конкретными средними,
обсуждаются ниже. Проиллюстрируем применение од кофактор ного дисперсионного анализа и
других связанных с ним методов.
Иллюстрация. Рассмотрим изложенный материал на основе данных табл. 16.2, полученных
в ходе эксперимента в сети крупных универмагов. Цель эксперемента — изучить влияние


612 Часть III. Сбор, подготовка и анализ данных
уровня рекламы товаров непосредственно в самом магазине и купонной распродажи на объем
продаж. Маркетологи использовали три уровня рекламы товаров в магазине: высокий, средний
и низкий. У купонной распродажи было два уровня. Купон на 20-долларовую скидку либо да-
вали потенциальным покупателям (уровень в этом случае обозначали номером 1), либо не да-
вали (этот уровень обозначали номером 2 в табл. 16.2). Результаты экспериментов с рекламой и
купоном объединили в таблицу размером 3 х2 с шестью ячейками. Тридцать магазинов были
выбраны случайным образом, и для каждой комбинации условий эксперимента случайным
образом взяли по пять магазинов, как показано в табл. 16,2. Эксперимент продолжался два ме-
сяца. Определили объем продаж в каждом магазине, нормализовали его, приняв во внимание
посторонние факторы (размер магазина, товарооборот и т.д.) и пересчитали по десятибалльной
шкале. В дополнение была получена качественная оценка относительного числа постоянных
покупателей для каждого магазина, также с использованием десятибалльной шкалы. Получен-
ные данные приведены в табл. 16.2

Таблица 16.2, Уровень купонной распродажи, реклама товаров на месте купли-продажи;
продажи и постоянные покупатели
Постоянные покупатели
Номер Внутримэгазинная реклама Продажи
Уровень купонной распродажи
магазина
1 1,00 1,00 9,00
10,00
2 9,00
1.00 1,00 10,00
3 1,00 1,00 10,00 8,00
4 1,00 8,00
1,00 4,00
5 1,00 9,00
1,00 6,00
6 2,00 8,00
1,00 8,00
7 8,00
1,00 2,00 4,00
8 2,00 7,00 10,00
1,00
9 1,00 2,00 9,00 6,00
10 1,00 2,00 6,00 9,00
11 1,00 3,00 5,00 8,00
г,оо
1? 100 3,00 9,00
6,00
13 1,00 3,00 6,00
4 (10
14 3,00 10,00
1,00
5,00
15 3,00
1,00 4,00
16 8,00
2,00 1,00 10,00
17 1,00 9,00 6,00
2,00
18 1,00 7,00 8,00
2,00
19 2,00 1,00 4,00
7,00
20 !,(!(]
2,00 6,00 9,00
21 2.00 4,00
2,00 6,00
5,00
22 2,00 2,00 8,00
23 Ei.OQ
2,00 2,00 10,00
24 6,00
2,00 2,00 4,00
25 4,00
2,00 2,00 9,00
26 2,00
2,00 3,00 4,00
27 3,00
2,00 3,00 6,00



Глава 16, Дисперсионный и ковариационный анализ 613
Окончание табл. 16.2

Номер Уровень купонной распродажи Внугримагазинная реклама Продажи Постоянные покупатели
магазина
23 2,00 3,00 2,00 10,00
29 2,00 3,00 1,00 9,00
2,00
30 3,00 2,00 8,00



ПРИМЕНЕНИЕ ОДНОФАКТОРНОГО
ДИСПЕРСИОННОГО АНАЛИЗА
Проиллюстрируем применение од кофактор но го анализа вначале с вычислениями, сделан-
ными вручную, а затем с использованием компьютера. Предположим, что мы оперировали
только одним фактором, а именно, рекламой на месте торговли, т.е. чтобы показать процесс
вычисления, проигнорируем второй фактор — купонную распродажу. Маркетологи пытались
определить влияние внутримагазинной рекламы товаров (X) на продажи (Y). Чтобы показать
процесс вычисления с помощью ручного калькулятора, данные табл. 16.2 преобразованы в
табл, 16.3, где приведены продажи (У?) для каждого уровня рекламы. Нулевая гипотеза утвер-
ждает, что групповые средние равны: Н0\ ji, = ц2 = ц3
(JO - 6,067) 2 + (9-6,067) 2 + (10-6,067) 2 + (8 - 6,067)2 + (9 - 6,067)2 4- (8 - 6,067)2 +
y
+(9 - 6,067) 2 + (7 - 6,067)2 + (7 - 6,067)2 + (6 - 6,067)2 + (8 - 6,067)2 + (8 - 6,067)2 +
+(7 - 6,067)2 + (9 - 6,067)2 + (6 - 6,067)2 -b (4 - 6,067)2 + (5 - 6,067)2 + (5 - 6,067)2 +
+(6 - 6,067)2 + (4 - 6,067)2 + (5 - 6,067)2 •f (7 - 6,067)2 + (6 - 6,067)2 + (4 - 6,067)2 +
+(5 - 6,067) 2 + (2 - 6,067)2 + (3 - 6,067)2 + (2 - 6,067)2 + (1 - 6,067)2 + (2 - 6,067): =
= (3,933)2 + (2,933)2 + (3,933)2 + (1,933)2 + (2,933)2 + (1,933)2 + (2,933): ..- (0,933)2 +
+(0,933) 2 +( -0,067)2 + (l,933) 2 +(l,933) 2 -f -(0,933) 2 +(2,933) 2 + (- 0,067)2 (- 2,067)2 +
+(- 1,067)2-f- (- 1,067)2 + (- 0,067)2 + (- 2 ,067)2 + (- 1,067)2 + | - 0,067)2 (- 0,067)2 +
+(- 2,067)2 •M-l,067) 2 +(-4,067) 2 + (-3 ,067)2 + (- 4,067)2 + ( - 5,067)2 (- 4,067)2 =
=185,867
SSX = 10(8,3 - 6,067)2 + 10(6,2 - 6,067)2 + 10(3,7 - 6,067)2 = 10(2,223)2 + Ю(ОДЗЗ)2 + 10(- 2,367)2 =
=106,067
^ащ^ы= (Ю - 8,3)2 + (9 - 8,3)2 + (10 - 8,3)2 + (8 - 8,3)2 + (9 - 8,3): + (8 - 8,3)2 + (9 - 8,3)2 +
+(7 - 8,3)2 + (7 - 8.3)2 + (6 - 8,3)2 + (8 - 6,2)2 + (8 - 6,2)2 + (7 - 6,2)2 + (9 - 6,2)2 +
+(6 - 6,2)2 + (4 - 6,2)2 + (5 - 6,2)2 + (5 - 6,2): + (6 - 6,2)2 + (4 - 6,2)2 + (5 - 3,7)2 +
+(7 - 3,7)2 + (6 - 3,7)2 + (4 - 3,7)2 + (5 - 3,7)2 + (2 - 3,7)2 + (3 - 3,7)2 + (2 - 3,7)2 +
+(1 - 3,7)2 + (2 - 3,7)2 = (1,7)2 + (0,7)2 + (1,7)г +( -0,3)2 + (0,7)2 + (˜0,3)2 + (0,7)2 +
+(-1,3)2 + (-1.3)2 + (-2,3)2 + (1,8)2 + (1,8)2 + (0,8)2 + (2,8)2 + (-0,2)2 + <-2,2)2 + (-1.2)1 +
+(-1,2)2 + (-0,2)2+ (-2,2)г+ (1,3)2+ (3,3)2+ (2,3)2+ (0,3)2+ (1,3)2+ (- 1,7)2+ (- 0,7)2 +
+(- 1,7)2+ (- 2,7)2+ (- 1,7)2= 79,80
Можно утверждать, что
SSy = SSt + ДУвииДи
и
185,867=106,067 + 79,80
Степень влияния (эффекта) А" на Увычисляют по формуле:
Л2 = SS,/SSy= 106,067/185,867 = 0,571
Другими словами, 57,1% вариации в продажах (У) обусловлено влиянием внутримагазин-
ной рекламы, что указывает на умеренный эффект. Теперь проверим нулевую гипотезу.



614 Часть III. Сбор, подготовка и анализ данных
106,Q67/(3-l)
= 17,944
79,800/(30-3)
SS1IW,lflKUf(N-c)


Таблица 16.3. Влияние уровня вкутримагазинной рекламы на продажи
Уровень внутримагазинной рекламы

Номер магазина Низкий
Высокий Средний

Нормированные продажи
1 10 5
8
9
2 8 7
10
3 7 6
4 8 9 4
5 9 6 5
6 8 2
4
7 9 3
5
2
8 5
7
9 S 1
7
4 2
6
1!)

Суммы по колонкам 37
83 62
37
Групповые средние: К,
^ = 8,3 — = 3,7
^=6,2
10 10
10

- (83 + 62 + 37)
= 6,067
Общее среднее, У = -


По табл. 5 Статистического приложения находим, что для 2 и 27 степеней свободы
критическое значение ^-статистики равно 3,35 при уровне значимости а = 0,05. Посколь-
ку вычисленное значение /'-статистики больше критического, мы отклоняем нулевую ги-
потезу. Заключаем, что средние значения совокупностей для трех уровней внутримага-
зинной рекламы товаров действительно различаются между собой. Сравнение средних для
трех категорий показывает, что высокий уровень рекламы ведет к существенно более вы-
соким продажам.
Теперь проиллюстрируем процедуру выполнения дисперсионного анализа с помощью
компьютерной программы. Результаты выполнения анализа на компьютере приведены в
табл. 16,4.

Таблица 16.4. Однофакторный дисперсионный анализ (ANOVA)
F-статистика Вероятность F
Сумма Средний
Степени
Источник дисперсии
квадратов квадрат
свободы
2
Между группами 17,944 0,000
106,067 53,033
(внутримагазинная реклама)
27
Внутри групп (дисперсия 79,800 2,956
ошибки)
29
185,867
Итого 6,409




Глава 16. Дисперсионный и ковариационный анализ 615
Окончание табл. 16.4

Средние ячеек
Уровень рекламы Количество (наблюдений) Среднее
Высокий (1) 10 8,300
Средний (2) 10 6,200
Низкий (3) 10 3,700
Итого 30 6,067

Значение SSX,, указывающее на главные эффекты (систематические), равно 106,067 для двух
степеней свободы; значение SS^^ указывающее на остаточные эффекты, равно 79,80 для 27
степеней свободы. Следовательно, значения средних квадратов соответственно равны
MS = 106,067/2 = 53,033 и MSautu6KU = 79,80/27 = 2,956. Значение F= 53,033/2,956 = 17,944 при 2
и 27 степенях свободы приводит к вероятности, равной 0,000. Так как соответствующая вероят-
ность меньше, чем уровень значимости, равный 0,05, то нулевую гипотезу о равенстве средних
в совокупности отклоняют. Альтернативно, из табл. 5 Статистического приложения видно, что
критическое значение ^для 2 и 27 степеней свободы равно 3,35. Поскольку вычисленное зна-
чение /(17,944) больше критического, то нулевую гипотезу отклоняют. Данные табл. 16.4 по-
казывают, что выборочные средние, равные 8,3; 6,2 и 3,7, совершенно различны,
Процедура однофакторного дисперсионного анализа и его применения помогут понять до-
пущения данного анализа.


ДОПУЩЕНИЯ В ДИСПЕРСИОННОМ АНАЛИЗЕ
Обобщим допущения дисперсионного анализа:
1. Обычно считается, что уровни независимой переменной фиксированные. Статистический
вывод касается только рассматриваемых конкретных уровней. Это называется моделью с
фиксированным влиянием уровней фактора (fixed-effects model). Существуют и другие модели.
Для модели со случайным влиянием уровней фактора (random-effects model) считают, что фак-
торы представляют собой случайные выборки из генеральной совокупности факторного
эксперимента. Статистические выводы делают в отношении других уровней, не изучаемых
в анализе. Модель со смешанными уровнями (mixed-effects model) получают, если некоторые
факторы (условия эксперимента) фиксированные, а некоторые — случайные [7].
2. Остаточный член в дисперсионной модели, определяющей значение зависимой перемен-
ной Y, имеет нормальное распределение; его математическое ожидание равно нулю, а дис-
1
персия является постоянной . Остаточный член не связан ни с одним уровнем переменной
X. Умеренное отклонение от этих допущений серьезно не влияет на достоверность анализа.
Более того, данные можно преобразовать таким образом, чтобы они удовлетворяли допуще-
нию о нормальности распределения или постоянству дисперсий.
3. Остаточные члены не коррелируют. Если остаточные члены взаимосвязаны (т.е. наблюде-
ния зависимые), то отношение дисперсий /может быть сильно искажено.

1
Однофа к торная дисперсионная модель имеет вид
Xii = u+F< + s,jf
где
Ху — значение исследуемой переменной, полученной на i-м уровне фактора (I = 1,2,...т) cj-м порядковым но-
мером (I = 1,2,...п);
fj — общая средняя;
FI — эффект, обусловленный влиянием i-гоуровня фактора;
?%• — остаточный член, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией
переменной внутри отдельного уровня. (Прим, научн. ред. Подробнее см. Н. Ш. Кремер. Теория вероятностей и
математическая статистика. — М.: ЮНИТИ-ДАНА. — 2000. — С. 375)

616 Часть III. Сбор, подготовка и анализ данных
Часто при анализе ситуаций данные соответствуют описанным выше допущениям,
Поэтому дисперсионный анализ достаточно распространен, что и подтверждают следую-
щие примеры.

ПРИМЕР. Торговля по видеокаталогу
Хотя применение видео каталогов для покупки товаров на дому недостаточно рас-
пространено, многие компании, практикующие прямой маркетиинг, проявили заинте-
ресованность их использования. Spiegel и Neiman Marcus предлагают видеокаталоги по-
требителям.
Маркетологи исследовали с помощью видеокаталогов эффективность розничной торгов-
ли как формы прямого маркетинга. Участники эксперимента были случайным образом
включены в один из трех вариантов эксперимента, когда они использовали: только видеока-
талог; видеокаталог и обычный каталог или только обычный каталог. Анализировались за-
висимые переменные, представляющие собой отношения и мнения: оценки характеристик
товара (одежды); оценки компании-рекламодателя видеокаталога/каталога; оценки инфор-
мации о ценах; намерение сделать покупку.
Для каждой зависимой переменной выполнен самостоятельный однофакторный дис-
персионный анализ. Результаты показали, что респонденты отнеслись к покупкам по ви-
деокаталогам или видеокаталогам и каталогам более позитивно, чем к покупкам только по
обычному каталогу. Хотя факторный эксперимент "только видеокаталог' повысил вос-
приятие компании-рекламодателя, результаты не были такими впечатляющими, как в
случае восприятий товара (одежды). Не обнаружено существенных различий в воспри-
ятии цены и намерений сделать покупки. Кроме того, среднее число наименований това-
ров, которые, по словам респондентов, они бы купили, больше среди познакомившихся с
видеокаталогом и с обычным каталогом, чем среди тех, кто посмотрел только видеоката-
лог, или только обычный каталог.
Хотя это исследование и было пробной попыткой изучить влияние некоторых факторов
на продажи, позитивные результаты оценки товаров (одежды), по видеокаталогу, предпола-
гают, что такой метод маркетинга представляет собой потенциальный интерес для продав-
цов, использующих прямой маркетинг [8].



МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
При проведении маркетинговых исследований часто приходится иметь дело с одновремен-
ным влиянием нескольких факторов [9].
• Как меняется намерение потребителей купить товар данной торговой марки при раз-
личных уровнях цены и распределения?
• Как уровень рекламы и уровень цен (высокий, средний, низкий) одновременно влияют
на продажи товара данной торговой марки?
• Влияет ли на выбор потребителем данной торговой марки уровень образования (ниже
среднего, среднее, колледж, высшее) и возраст?
• Как осведомленность об универмаге (высокая, средняя, низкая) и представление о
нем (позитивное, нейтральное, негативное) влияют на предпочтение потребителем
этого магазина?
При определении влияния на зависимую переменную нескольких факторов можно ис-
пользовать многофакторный дисперсионный анализ. Главное преимущество этого метода в
том, что он позволяет исследователю изучать взаимодействие факторов. Взаимодействия
(interaction) имеют место, когда эффекты одного фактора на зависимую переменную зависят от
уровня других факторов.


Глава 16. Дисперсионный и ковариационный анализ 617
Взаимодействие (interaction)
При оценке зависимости между двумя переменными взаимодействие имеет место, если
влияние Х\ зависит от уровня Хг, и наоборот.

Процедура многофакторного дисперсионного анализа аналогична процедуре однофактор-
ного дисперсионного анализа. Статистики, соответствующие многофакторному дисперсион-
ному анализу, также определяются аналогично определению статистик в однофакторном дис-
персионном анализе. Рассмотрим простой пример, в который входят факторы Х}нХ2с уровня-
ми с, и ^соответственно. В этом случае полная вариация раскладывается следующим образом:
55„шиаи = SS за счет X, + SS за счет Х2 + SS за счет взаимодействия X, и Х2
или
55 = SS + 55 + 55
Большее влияние X, будет отражаться в большем отличии среднего в уровнях Х}к более вы-
соком значении 55, . Это же касается и фактора Х2. Чем сильнее взаимодействие между факто-
рами X, и Х21 тем больше значение 55,^, . С другой стороны, если Л^иЛ^не зависят один от дру-
гого, то значение 55,,,, приближается к нулю [10].
Степень объединенного влияния (эффекта) двух факторов называют полным эффектом,
или множественной корреляцией r\2 (multiple л2), вычисляемой по формуле:
(55, +55, +55„ )
V

Множественная корреляция r)2 (multiple т]2)
Степень объединенного влияния двух (или более) факторов, или полный эффект.

Значимость полного эффекта (significance of the overall effect) проверим с помощью
/-"-критерия, используя формулу:
_ (55Д| +55,: +SS,i3: }ldfn _ SSXi^v, /dfa _ MS,


где
df n — число степеней свободы для числителя
= (с, - 1) + <с2 - 1) + (с, - 1) (с2 - 1) = Cic2 - 1
dfd — число степеней свободы для знаменателя
= N - с,с2
MS — средний квадрат.

Значимость полного эффекта (significance of the overall effect)
Проверка наличия различий между некоторыми из групп факторного эксперимента.

Если полный эффект статистически значимый, то на следующем этапе изучают значимость
эффекта взаимодействия (significance of the interaction effect) [11]. Если нулевая гипотеза утвер-
ждает, что взаимодействие между факторами отсутствует, то соответствующий /•'-критерий вы-
числяют по формуле:

^ _ Д1
n

'
'sS^/dfj'MS^
где
df n = (c,-l) + (c 2 -l)
df d = N - с,с2

618 Часть III. Сбор, подготовка и анализ данных
Значимость эффекта взаимодействия (significance of the interaction effect)
Проверка значимости взаимодействия между двумя или больше независимыми переменными.

Если окажется, что эффект взаимодействия статистически значимый, значит, эффект А/ за-
висит отЛ"^ и наоборот. Поскольку эффект (влияние) одного фактора неоднородный, а зависит
от уровня другого фактора, то вообще бессмысленно проверять значимость главных эффектов,
Однако имеет смысл проверить значимость главного эффекта каждого фактора, если эффект
взаимодействия статистически незначимый [12].
Значимость главного эффекта каждого фактора (significance of the main effect of each factor)
можно проверить следующим образом (для X,):
Idf MSX
' J l\ K,
L



MS,,
где

df d =N-c,c 2

Значимость главного эффекта каждого фактора
(significance of the main effect of each factor)
Проверка значимости главного эффекта для каждого отдельного фактора.

При анализе предполагалось, что план эксперимента сбалансированный (число случаев в
каждой ячейке одинаково). Если это не так, то анализ становится сложнее. Приведенный ниже
пример иллюстрирует применение многофакторного дисперсионного анализа.
Иллюстрация применения многофакторного дисперсионного анализа. Возвратившись к дан-
ным табл. 16.4, изучим эффекты, обусловленные влиянием уровня внутримагазинной рекламы
и уровня купонной распродажи на продажи магазина. Результаты выполненного на компьюте-
ре обсчета дисперсионного анализа 3 x 2 приведены в табл. 16.5. Для главного эффекта, вы-
званного влиянием уровня внутримагазинной рекламы, сумма квадратов SSV, число степеней
свободы и средний квадрат MSV те же, что и в табл. 16.4. Сумма квадратов для эффекта, обу-
словленного уровнем купонной распродажи $5Ж= 53,333 с одной степенью свободы, что при-
водит к значению среднего квадрата MS^, равного сумме квадратов. Объединенный эффект оп-
ределяют, сложив суммы квадратов, обусловленные двумя главными эффектами (SS^ + SS^. =
= 106,067 + 53,333 = 159,400). Так же поступаем и со степенями свободы (2 + 1) = 3. Для эф-
фекта взаимодействия внутримагазинной рекламы и купонной распродажи сумма квадратов
равна SSxpxe = 3,267 с (3 - 1) х (2 — I) = 2 степенями свободы, и значит, средний квадрат равен
MS-quf — 3,267/2 = 1,633. Для полного эффекта сумма квадратов состоит из суммы квадратов для
главного эффекта рекламы, главного эффекта купонной распродажи и эффекта взаимодейст-
вия = 106,067 + 52,333 + 3,267 = 162,667 с 2 + 1 + 2 = 5 степенями свободы, и значит, средний
квадрат равен 162,667/5 = 32,533. Однако обратите внимание, что статистики ошибки отличаются
от приведенных в табл. 16.4. Это обусловлено тем, что сейчас у нас два фактора вместо одного:
SSoulu6KU = 23,2c (30 — 3 x 2 ) или 24 степенями свободы, отсюда средний квадрат М$аашбки= 0,967.

Таблица 16.5. Двухфакторный дисперсионный анализ

F of
Степени Средний
Источник вариации Значимость F
Сумма
квадрат
квадратов свободы

Главные эффекты

2
Вкутришгазинная реклама 106,067 53,033 54,862 0,000 0,557
1
Купонная распродажа 53,333 53,333 0,280
55,172 0,000




619
Глава 16. Дисперсионный и ковариационный анализ
Окончание табл. 16.5

Источник вариации Сумма Значимость F of
Степени Средний F
квадратов квадрат
свободы

Объединенный 3
159,400 53,133 54,966 0,000
Двухфакгорное взаимодействие !

3,267 1,633 1,690 0,206
Модель 5
162,667 32,533 33,655 0,000
Остаточный компонент (ошибка) 24
23,200 0,967
Итого 29
185,867 6,409
Средние ячеек
Среднее
Уровень внугримагазиннои Купонная Количество
рекламы {наблюдений)
распродажа

Да
Высокий 5 9,200
Нет 5
Высокий 7,400
5
fc
Средний 7,600
Средний Нет 5 4,800
Низкий Да 5 5,400
Нет 5
Низкий 2,000
Средние факторного уровня

Уровень внутримагазинной Купонная Количество Среднее
рекламы распродажа (наблюдений

Высокий 10 8,300
Средний 6,200
10
Низкий 10 3,700
7,400
15
Нет 4,733
15
Общее среднее 6,067
30

F- критерий для проверки значимости полного эффекта равен:


0,967
с 5 и 24 степенями свободы. Полный эффект статистически значимый при уровне значимости,
равном 0,05.
/-критерий для проверки значимости эффекта взаимодействия равен:
1,633
т- _
= 1,690
0,967
с 2 и 24 степенями свободы. Эффект взаимодействия статистически незначимый при уровне
значимости, равном 0,05.
Поскольку эффект взаимодействия статистически незначимый, оценим значимость глав-
ных эффектов, /-критерий для проверки значимости главного эффекта внутримагазинной
рекламы равен:


0,967

<<

стр. 22
(всего 35)

СОДЕРЖАНИЕ

>>