<<

стр. 23
(всего 35)

СОДЕРЖАНИЕ

>>

с 2 и 24 степенями свободы. Главный эффект рекламы статистически значимый при уровне
значимости, равном 0,05,

Часть III. Сбор, подготовка и анализ данных
620
/"-критерия для проверки значимости главного эффекта купонной распродажи равен;
53,333

0,967
с 1 и 24 степенями свободы. Главный эффект купонной распродажи статистически значимый
при уровне значимости, равном 0,05. Таким образом, чем выше уровень рекламы, тем выше
продажи. Распространение премиальных купонов также повышает продажи. Эффект влияния
каждого фактора не зависит от эффекта другого фактора.
Рассмотрим использование многофакторного дисперсионного анализа.

ПРИМЕР. Где делают качественные телевизоры?
Маркетологи исследовали эффекты, обусловленные влиянием страны-производителя
телевизора на доверие людей к его качественным характеристикам: хороший звук, безотказ-
ность (надежность), четкое изображение и современный дизайн. Независимые переменные
включали цену, страну-изготовителя и каналы распределения телевизоров. Использовался
следующий план пересечения факторов: 2 x 2 x 2 . Установили два уровня цен: 349,95 долла-
ров (нижний) и 449,95 долларов (высший), взяли две страны-изготовителя— Корею и Со-
единенные Штаты Америки, и два уровня каналов распределения — в магазинах компании
Hudson и в других магазинах.
Данные собирали в двух крупных пригородных торговых центрах в большом городе. 30
респондентов были отобраны случайным образом для каждой из восьми ячеек факторного
эксперимента, таким образом было привлечено 240 людей. В табл. 1 представлены результа-
ты обработки комбинаций переменных, которые оказали значимые эффекты на каждую из
зависимых переменных.
Таблица 1. Анализ значимости комбинаций независимых переменных (факторов)
Эффект, обусловленный Зависимая Одномерный Степени Вероятность, р
влиянием следующих факторов: переменная критерий, F свободы (df)
Страна х цена Хороший звук 7,57 1,232 0,006
Странах цена Безотказность 6,57 1,232 0,011
Страна х распределение Четкость изображения 6,17 0,014
1,232
Страна х распределение Безотказность 6,57 1,232 0,011
Страна х распределение Современный дизайн 10,31 1,232 0,002
Направления эффектов взаимодействия "страна-распределение" для трех зависимых пе-
ременных показаны в табл. 2.
Таблица 2, Средние значения зависимых переменных для эффекта взаимодействия
"страна-распределение"
Странахраспределение Четкое изображение Безотказность Модный дизайн
Корея
Hudson 3,67 3,42 3,82
Другие магазины 3,18 2,88 3,15
Соединенные Штаты Америки
Hudson 3,60 3,47 3,53
Другие магазины 3,77 3,65 3,75
В то время как рейтинг доверия к таким характеристикам, как четкость изображения, I
безотказность и современный дизайн повышался при распределении южнокорейских теле- \
визоров через магазины Hudson больше, чем при продаже через других дистрибьюторов, это I


Глава 16. Дисперсионный и ковариационный анализ 621
оказалось неверным для телевизоров производства США. Аналогично, направления эффек-
тов взаимодействия "страна-распределение" для двух зависимых переменных показаны в
табл. 3. При цене 449,95 долларов рейтинги доверия для "хорошего звука" и "безотказности"
были выше для американских телевизоров, по сравнению с южно корейскими, но совсем
незначительное различие наблюдалось в отношении страны изготовления при стоимости
телевизора 349,95 доллара.
Таблица 3. Средние значения зависимых переменных для эффекта взаимодействия
"страна-цена"
Страна ж цена Хороший звук Безотказность
$349,95
Корея 3,75 3,40
Соединенные Штаты Америки 3,53 3,45
$449,95
Корея 3,15 2,90
Соединенные Штаты Америки 3,73 3,67

Это исследование показывает, что доверие к характеристикам изделия для товаров,
традиционно экспортируемых в Соединенные Штаты Америки компанией из быстро раз-
вивающейся индустриальной страны, можно существенно повысить, если компания рас-
пределяет свой товар через магазины известной розничной сети в США. В частности, ха-
рактеристики изделия (четкость изображения, безотказность и модный дизайн) заслужи-
вают доверия, если телевизоры сделаны в Южной Корее и распространяются через
известную торговую сеть Соединенных Штатов Америки. Аналогично, такие характери-
стики телевизоров, как "хороший звук" и "безотказность" заслуживают доверия, если те-
левизоры сделаны в Соединенных Штатах Америки и продаются по более высокой цене,
возможно, компенсируя потенциальный недостаток высоких производственных затрат в
Соединенных Штатах Америки [13].



КОВАРИАЦИОННЫЙ АНАЛИЗ
При проверке различий в средних значениях зависимой переменной, связанных с влияни-
ем контролируемых независимых переменных, часто необходимо учитывать неконтролируе-
мые независимые переменные.
• При определении намерений потребителей относительно приобретения товара извест-
ной фирмы в зависимости от цены необходимо учесть отношение к торговой марке.
• Для того чтобы определить, как различные группы под влиянием разных видов рекла-
мы, оценивают торговую марку, необходимо проконтролировать, какой информацией
априорно обладают члены этих групп.
• При определении влияния различных иен на потребление в семьях сухих завтраков мо-
жет оказаться существенным такой фактор, как размер семьи.
В приведенных выше ситуациях следует использовать дисперсионный анализ, который
включает, по крайней мере, одну категориальную независимую переменную и одну интерваль-
ную или метрическую независимую переменную. Категориальную независимую переменную
называют фактором, а метрическую — ковариатой. Чаше всего ковариату используют для уда-
ления посторонней вариации из зависимой переменной, поскольку самыми важными являют-
ся эффекты факторов. Вариацию в зависимой переменной, обусловленную ковариатой, удаля-
ют корректировкой среднего значения зависимой переменной в пределах каждого условия экс-
перимента. Затем, исходя из скорректированных оценок, выполняют дисперсионный
анализ [14]. Значимость суммарного эффекта ковариат, как и эффект каждой ковариаты, про-

Часть III. Сбор, подготовка и анализ данных
622
веряют с помощью соответствующих /- критериев. Коэффициенты ковариат позволяют понять
влияние, оказываемое на зависимую переменную. Ковариационный анализ наиболее полезен,
когда ковариата линейно связана с зависимой переменной и не связана с факторами [15].
Для иллюстрации ковариационного анализа мы снова используем данные табл. 16.2. Пред-
положим, что мы хотели бы определить эффекты, обусловленные влиянием внутри магазинной
рекламы и купонной распродажи, на продажи, при наличии такой ковариаты> как принадлеж-
ность покупателя к числу постоянных клиентов магазина. Предполагается, что принадлеж-
ность к числу постоянных покупателей может также влиять на продажи универмага. Зависимая
переменная представляла собой продажи. Как и ранее, реклама имела три уровня, а купонная
распродажа — два. Степень приверженности магазину, измеренная по интервальной шкале,
служила ковариатой. Результаты приведены в табл. 16.6.

Таблица 16.6. Ковариационный анализ
Источник вариации Степени Средний Значимость F
Сумма квадратов
свободы квадрат
Ковариаты
Степень приверженности магазину 0,838 1 0,838 0,868 0,363
Главные эффекты
Реклама 106,067 2 53,033 54,546 0,000
Купонная распродажа 53,333 1 53,333 54,855 0,000
Объединенный 159,400 3 53,133 54,649 0,000
Двухфакторное взаимодействие
рекламационная распродажа 3,267 2 1,633 1,680 0,208
Модель 163,505 6 27,251 28,028 0,000
Остаточный компонент (ошибка) 22,362 23 0,972
Итого 185,867 6,409
29
Ковариата -постоянный покупатель Коэффициент корреляции
- 0,078

Как видно, сумма квадратов, связанная с ковариатой, незначительна (0,838) и имеет одну
степень свободы, поэтому значение среднего квадрата идентично сумме квадратов. Соответст-
вующий /"-критерий равен 0,838/0,972 = 0,862 с 1 и 23 степенями свободы, незначимый при
уровне— 0,05. Таким образом, можно сделать следующее заключение: наличие постоянных
покупателей не влияет на объем продаж универмага. Если же эффект ковариаты статистически
значимый, то можно использовать знак групповового коэффициента, чтобы определить на-
правление эффекта на зависимую переменную (прямая или обратная связь).


ВОПРОСЫ ПРИ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ
Важные вопросы, возникающие при интерпретации результатов дисперсионного анализа,
включают взаимодействия, относительную важность факторов и множественные сравнения.

Взаимодействие
Различные взаимодействия, которые могут возникнуть при проведении ANOVA по двум
или больше факторам, показаны на рис. 16.3.
Одним из результатов является то, что AN OVA может указать на отсутствие взаимодействий
(эффекты взаимодействий считаются незначимыми). Другая возможность заключается в том,
что взаимодействие — значимое. Эффект в результате взаимодействия имеет место тогда, когда

Глава 16. Дисперсионный и ковариационный анализ 623
эффект, обусловленный действием независимой переменной на зависимую, различен для раз-
личных уровней другой независимой переменной. При упорядоченном взаимодействии (ordinal
interaction) ранжированный порядок эффектов, связанных с одним фактором, не меняется
вдоль уровней второго фактора.

1озможные эффекты взаимодеж




Взаимодействие отсутствует Наличие взаимодействия
(случай 1)


Г 1
Упорядоченное взаимодействие Неупорядоченное
(случай 2) взаимодействие

1


Взаимодействие Взаимодействие
непересекающегося типа пересекающегося типа
(случай 3} (случай 4)

Рис. 16.3. Классификация эффектов в результате взаимодействий


Упорядоченное взаимодействие (ordinal interaction)
Ранжированный порядок эффектов, связанных с одним фактором, не меняется вдоль уров-
ней второго фактора.

Неупорядоченное взаимодействие (disordinal interaction), напротив, характеризуется измене-
нием ранжированного порядка эффектов одного фактора вдоль уровней другого.

Неупорядоченное взаимодействие (disordinal interaction)
Изменение ранжированного порядка эффектов одного фактора вдоль уровней другого.

Если взаимодействие неупорядоченное, то оно может быть непересекающимся или пересе-
кающимся [16].
Случаи взаимодействий приведены на рис. 16.4, где принимается, что имеется два фактора:
А", с тремя уровнями (Х,,,Х]21лХ,3) и Х2 с двумя уровнями (Х2„Х22).
Случай 1 указывает на отсутствие взаимодействия, Отрезки прямой, отражающие эффекты,
обусловленные влиянием X, на Y, параллельны отрезкам прямой, отражающим эффекты, обу-
словленные влиянием Х2, при двух уровнях. Наблюдается некоторое отклонение от параллель-
ности, но оно не выше предполагаемого в данной ситуации. Параллельность подразумевает,
что итоговое влияние Х22 по сравнению с Х2, одинаково на всех трех уровнях Х}. При отсутствии
взаимодействия совместный эффект Х{ и Х2 равен просто сумме их индивидуальных главных
эффектов.
Случай 2 относится к упорядоченному взаимодействию. Отрезки прямой, отражающие
влияние X, и Х2, непараллельны. Разность ординат между Х22 и Х21 увеличивается по мере дви-
жения от Хп к Х12 и от Х]2 к X,-,, но порядок рангов эффектов X, одинаков на двух уровнях Х2.
Этот ранжированный порядок, причем возрастающий, такой: Х„, Х!2, Хп; он остается таким же
и для Х21 и АГщ.




624 Часть III. Сбор, подготовка и анализ данных
Случай! Случай 2
Взаимодействие отсутствует Упорядоченное взаимодействие




I I


Случай 4
Случай 3
Неупорядоченное взаимодействие:
Неупорядоченное взаимодействие:
непересекающийся тип пересекающийся тип




Рис. 16.4. Примеры взаимодействия

Неупорядоченное взаимодействие непересекающегося типа имеет место в случае 3. Наи-
меньший эффект, обусловленный влиянием Х„ наблюдается при уровне фактора Х2} и имеет
место в точке Х„, а порядок рангов эффектов будет таким; Хи, Х!2, Х,3. Однако при уровне Х22
(переменной Х2) наименьший эффект, обусловленный влиянием X,, имеет место в точке Х}2, и
порядок рангов меняется на следующий: Хп, Х}1, Х13. Поскольку наблюдается изменение в по-
рядке рангов, неупорядоченное взаимодействие сильнее, чем упорядоченное.
При неупорядоченном взаимодействии пересекающегося типа отрезки прямой пересекают-
ся, что соответствует случаю 4 на рис. 16,4. При этом относительный эффект уровней одного
фактора изменяется в направлении уровней другого. Обратите внимание, что Х22 оказывает
больший эффект, чем Х21 при уровнях Х„ равных Х„ и Х!2. При уровне фактора Х„ равном Х13,
наблюдается обратная ситуация, и Х2} имеет больший эффект по сравнению с Х12. (В случаях 1,
2 и 3 фактор Х2 при уровне Х22 воздействует больше, чем при уровне Х2} вдоль всех трех уровней
фактораX,.) Следовательно, неупорядоченное взаимодействие пересекающегося типа представ-
ляют собой наиболее сильное взаимодействие [17].


ОТНОСИТЕЛЬНАЯ ВАЖНОСТЬ ФАКТОРОВ
Экспериментальные планы обычно сбалансированы, т.е. каждая ячейка содержит одина-
ковое количество респондентов. Это приводит к ортогональному плану, в котором факторы
невзаимосвязаны. Следовательно, можно однозначно определить относительную важность
каждого фактора при объяснении дисперсии зависимой переменной [18]. Самый исполь-
зуемый критерий в ANOVA — это омега в квадрате (omega squared), ш2. Он указывает, какая
доля вариации зависимой переменной обусловлена влиянием конкретной независимой пе-
ременной (фактором).


625
Глава 16. Дисперсионный и ковариационный анализ
Омега в квадрате, со2 (omega squared, ш2)
Критерий, указывающий долю вариации зависимой переменной, обусловленную влиянием
конкретной независимой переменной (фактором).

Относительный вклад фактора А"вычисляют следующим образом [19];
, SSx-(dflxMSoaiu6ai)
Ш
* sso6,llia+Msouai6KU
Обычном2 интерпретируют только для статистически значимых эффектов [20]. В табл, 16.5
2
ш , имеющую отношение к уровню внутри магазин ной рекламы товаров, вычисляют следую-
щим образом:
106,067-(2хО,967) 104,133
ОТ? = = = 0,557
185,867 + 0,967 186,834
Обратите внимание, что в табл. 16.5
SS*#* = Ю6,067 + 53,333 + 3,267 + 23,2 = 185,867
Точно так же оз2, связанная с купонной распродажей, равна:
53.333-0x0,967) =52,Ш
185,867+0,967 186,834
В качестве руководства по интерпретации ш2 используем такое эмпирическое правило:
большему эффекту отвечает значение ы2, равное 0,15 или выше, средний эффект имеет место
при значении коэффициента, равном 0,06, и незначительный эффект— при 0,01 [21]. В
табл. 16.5 и эффект рекламы, и эффект системы премиальных купонов достаточно большие,
однако эффект рекламы значительно больше.

Множественные сравнения
С помощью /"-критерия в ANOVA проверяется только общее различие средних. Если нуле-
вую гипотезу о равных средних отклоняют, то можно заключить, что не все групповые средние
равны. Однако статистически различными могут быть не все, а только некоторые средние и по-
этому необходимо проверить различия среди конкретных средних. Это можно сделать методом
контрастов (contrast) или множественными сравнениями,

Метод контрастов (contrast)
В дисперсионном анализе метод проверки различий среди двух или больше средних групп
факторного эксперимента.

Контрасты могут быть априорными и апостериорными. Априорные контрасты (a priori contrasts)
определяют до проведения анализа, опираясь на теоретические исследовательские выкладки.

Априорные контрасты (a priori contrasts)
Контрасты, которые определяют до проведения анализа, опираясь на теоретические иссле-
довательские выкладки.

Обычно априорные контрасты используют вместо /"-критерия ANOVA. Отобранные кон-
трасты ортогональны (они независимы в статистическом смысле).
Апостериорные контрасты (a posteriori contrasts) определяют после анализа.

Апостериорные контрасты (a posteriori contrasts)
Контрасты, сделанные после анализа. Обычно они представляют собой критерии множест-
венных сравнений.


626 Часть III. Сбор, подготовка и анализ данных
Чаше всего они являются критериями множественных сравнений (multiple comparison tests),

Критерии множественных сравнений (multiple comparison tests)
С помощью апостериорных контрастов строятся итоговые доверительные интервалы, кото-
рые можно использовать для попарных сравнений всех средних, присущих всем комбина-
циям условий, используемых в рамках эксперимента.

Они позволяют исследователю построить итоговые доверительные интервалы, которые
можно использовать для попарных сравнений всех средних для всех комбинаций условий. Эти
критерии, перечисленные в порядке снижения их мощности, включают: проверку наименьше-
го значения значимой разности, критерий множественного размаха Дункана (Dunkan), метод
Стьюдента— Ньюмана-Келса (Student-Newman—Keuls), альтернативный метод Тьюки (Tukey),
проверку действительной значимой разности, модифицированную проверку наименьшего
значения значимой разности и критерий Шеффе (ScliefTe). Из всех этих критериев наиболее
мощный — проверка наименьшего значения значимой разности. Для углубленного ознаком-
ления с априорными и апостериорными контрастами необходимо обратиться к соответствую-
щей литературе [22].
Наша дискуссия предполагала, что каждый респондент подвергается воздействию фактор-
ного эксперимента только однажды. Иногда группы респондентов подвергаются воздействию
факторного эксперимента несколько раз, и в этом случае следует использовать ANOVA с по-
вторными измерениями.


ANOVA С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ
Часто при проведении исследований маркетологи сталкиваются с большими различиями
между индивидуальными характеристиками респондентов. Если этот источник изменчивости
отделим от эффектов, обусловленных влиянием независимой переменной и ошибки экспе-
римента, то можно повысить чувствительность эксперимента. Один из способов управления
различиями между участниками эксперимента — наблюдение каждой группы при каждой
комбинации условий эксперимента (табл. 16.7).

Таблица 16.7. Разложение полной вариации; ANOVA с повторными измерениями
Независимая переменная X
Номер Категории Общая
выборка
Х2 Хз . Хс ^
Г X,
1 Уп V \f
Пс П
У]2 УП
Вариация между 2 У2, УЙ Угз У& Уг
Полная вариация= SSy
группами людей =
55..



Yr, YN

Групповые Г
У Y
средние 'I
'




Вариация внутри группы лю-
дей — ООднугри ГрртПЫ ЛИДИЙ




Глава 16. Дисперсионный и ковариационный анализ 627
В этом смысле каждый участник эксперимента как бы контролирует сам себя. Например, в
исследовании, призванном определить различия в оценках разных авиалиний, каждый рес-
пондент оценивал все главные конкурирующие авиалинии, Поскольку от каждого респондента
получают повторные данные, этот план называют внутригрупповым, или дисперсионным ана-
лизом с повторными измерениями (repeated measures analysis of variance).

Дисперсионный анализ с повторными измерениями
(repeated measures analysis of variance)
Метод дисперсионного анализа, используемый, когда одни и те же респонденты под-
вергаются разным условиям эксперимента с повторными измерениями одних и тех же
переменных.

Дисперсионный анализ с повторными измерениями отличается от изученных ранее мето-
дов, где принималось, что каждого респондента подвергают испытаниям при одной комбина-
ции условий эксперимента, сказанное относится и к межгрупповому плану (сравнение разных
групп объектов) [23]. Дисперсионный анализ с повторными измерениями можно рассматри-
вать как распространение r-критерия для парной выборки для случая с более, чем двумя взаи-
мосвязанными выборками.
В случае единственного фактора с повторными измерениями полную вариацию с пс ˜ 1
степенями свободы можно разделить на межгрупповую и внутри групповую:
=
Удалим ^^между группами людей """ ^тутро tpynnu аоАей

Межгрупповая вариация, связанная с различиями в средних значениях групп, имеет л — 1
степеней свободы, а внутри групповая — п (п — \) степеней свободы. Внутри групповую ва-
риацию, в свою очередь, можно разделить на два различных источника вариации. Один ис-
точник связан с различиями между средними факторного эксперимента, а второй состоит из
остаточной вариации или вариации ошибок. Степень свободы, соответствующая вариации
модели эксперимента, равна с — 1 , а соответствующая остаточной вариации — (с — \) (п — \).
Таким образом,
VV ри fpynnij яюйей х ошибки
^^
Проверку нулевой гипотезы о равенстве средних выполним обычным методом:
SSJ(c-\] MSt
=

˜ SSota^l(n'l}(c˜\)˜ MS^^
До сих пор мы считали, что зависимую переменную измеряют интервальной или относи-
тельной шкалой. Однако если зависимая переменная неметрическая, то используется другой
метод проверки.


НЕМЕТРИЧЕСКИЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
С помощью неметрического дисперсионного анализа (nonmetric analysis of variance) проверя-
ют различие средних значений более, чем двух групп, когда зависимая переменная измерена
порядковой шкалой.

Неметрический дисперсионный анализ (nonmetric analysis of variance)
Методом дисперсионного анализа проверяется различие центральных значений тенеденций
более, чем двух групп, когда зависимая переменная измерена порядковой шкалой.

Одной из таких процедур проверки является k-выборочный медианный тест (k-sample me-
dian test). Как указывает его название, этот критерий является распространением медианного
теста для двух выборок, который рассматривался в главе 15.



628 Часть III. Сбор, подготовка и анализ данных
k-выборочный медианный тест (k-sample median test)
Непараметрический критерий, используемый для проверки различий, когда число выборок
больше двух и когда зависимая переменная измерена с помощью порядковой шкалы.

Нулевая гипотеза утверждает, что медианы k генеральных совокупностей равны, Проверка
нулевой гипотезы включает вычисление общей медианы k выборок. Затем создают 2 х Л-
таблицу, состоящую из ячеек со значениями счётов, исходя из количества наблюдений, кото-
рые лежат ниже или выше медианы. Вычисляют статистику хи-квадрат. Значимость статисти-
ки хи-квадрат означает, что нулевую гипотезу следует отклонить.
Более мощным критерием является однофакторный дисперсионный анализ Краскела—
Уоллиса (Kruskal—Wallis one-way analysis of variance).

Однофакторный дисперсионный анализ Краскела-Уоллиса (Kruskal-Wallis one-way
analysis of variance)
Неметрический ANOVA критерий, который использует значение ранга (порядковую стати-
стику) каждого случая, а не просто его положение относительно медианы.

Он является расширением критерия Манна—Уитни (глава 15), а также проверяет раз-
личие в значениях медиан. Нулевая гипотеза в этом случае та же, что и для медианного
теста /с-выборок, но процедура проверки отличается. Все наблюдения из k групп распола-
гают в одном ранжированном ряду. Если k совокупности одинаковые, то и группы долж-
ны быть аналогичными в смысле ранжирования в пределах каждой группы. Для каждой
группы вычисляют сумму рангов. Затем вычисляют //-статистику Краскела—Уоллиса с
распределением хи-квадрат.
Критерий Краскела—Уоллиса более веский, чем ^-выборочный медианный, поскольку ис-
пользует значение ранга каждого случая, а не просто его положение относительно медианы.
Однако если в данных имеется большое число совпадающих рангов, то лучше использовать
^-выборочный медианный тест.
Неметрический дисперсионный анализ непопулярен в коммерческих маркетинговых ис-
следованиях. Другая редко используемая процедура — многомерный дисперсионный анализ.


МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Многомерный дисперсионный анализ (multivariate analysis of variance — MANOVA) аналоги-
чен дисперсионному анализу (ANOVA), за исключением того, что вместо одной метрической
зависимой переменной имеется две или больше переменных.

Многомерный дисперсионный анализ (MANOVA)
(multivariate analysis of variance — MANOVA)
Метод ANOVA, использующий две или больше метрических зависимых переменных.

В этом случае цель остается той же, поскольку MANOVA проверяет различия между груп-
пами. В отличие от ANOVA, который проверяет групповые различия в отношении единствен-
ной зависимой переменной, MANOVA одновременно проверяет групповые различия в отно-
шении нескольких зависимых переменных. При ANOVA нулевую гипотезу формулируют сле-
дующим образом: средние зависимой переменной равны во всех группах. Многомерный
дисперсионный анализ лучше использовать, если имеется две или больше зависимых пере-
менных, которые коррелируют. Если же имеется много зависимых переменных, которые не
коррелируют или являются ортогональными, то лучше для каждой зависимой переменной вы-
полнить ANOVA, а не MANOVA [24].
Предположим, например, что четырем группам людей, каждая из которых состоит из 100
индивидуумов, отобранных случайным образом, показано четыре вида рекламы стирального

Глава 16. Дисперсионный и ковариационный анализ 629
порошка Tide. После просмотра рекламы каждый высказал свое отношение (рейтинг предпоч-
тения) к Tide, компании Procter & Gamble (компании, производящей Tide) и к самой рекламе.
Поскольку эти три переменных взаимосвязаны, многомерным дисперсионным анализом, сле-
дует определить наиболее эффективный вид рекламы (самый высокий рейтинг предпочтения
среди трех переменных). Врезка 16.1 "Практика маркетинговых исследований" демонстрирует
применение ANOVA и MANOVA в международном маркетинговом исследовании, а врезка 16.2
"Практика маркетинговых исследований" показывает применение этих методов при проверке
этики в маркетинговом исследовании.

Врезка 16.1. Практика маркетинговых исследований

Общие черты нарушения этика в ходе проведения марктеинговых исследований
Рассмотрим методику исследования, в ходе которого выяснялось отношение маркетоло-
гов к нарушению этики в различных странах. Выборка маркетологов объединила специали-
стов из Австралии, Канады, Великобритании и Соединенных Штатов Америки.
Оценки респондентов проанализированы компьютерными программами для MANOVA
и ANOVA. При анализе страна, где живет респондент, являлась независимой переменной, а
15 оценок— зависимыми переменными. Значения F-статистики при выполнении диспер-
сионного анализа указывали на то, что только две из 15 оценок были значимыми (р < 0,05
или лучше). Значение f-статистики при выполнении многомерного дисперсионного ана-
лиза оказалось статистически незначимым, что указывало на отсутствие различий в оценках
среди респондентов четырех стран. Поэтому был сделан вывод, что маркетологи из четырех
стран одинаково относятся к неэтичной исследовательской практике [25].



Врезка 16.2. Практика маркетинговых исследований

MANO VA демонстрирует, что мнение мужчины отличается от мнения женщины
Для исследования различия в оценках этики мужчинами и женщинами использовали
статистические методы MANOVA и ANOVA. Респондентов просили указать их степень
одобрения серии сценариев, включающих решения этического характера. Эти оценки слу-
жили зависимыми переменными при анализе, а пол респондентов — независимой пере-
менной, MANOVA использовали для выполнения многомерного анализа, в результате кото-
рого оказалось, что значение /'является значимым с уровнем значимости р < 0,001. Это оз-
начает, что отношение мужчин и женщин к этике исследования полностью отличаются.
Выполнен одномерный дисперсионный анализ, и f-значения указали, что три пункта вне-
сли наибольший вклад в различие оценок, даваемых мужчинами и женщинами этике ис-
следования: использование ультрафиолетовых чернил для предварительного кодирования
почтового вопросника; использование рекламы, которая способствовала неправильному ис-
пользованию потребителями товара, и нежелание исследователя предоставить данные, кото-
рые помогли бы городской группе консультантов [27].



ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА
Все три компьютерных пакета (SPSS, SAS, BMDP) имеют возможности для проведения
дисперсионного и ковариационного анализа. Дополнительно к основному анализу, эти про-
граммы могут выполнять более сложный анализ. Minitab и Excel также предлагают некоторые
программы для этой цели. Приведем описание соответствующих программ. Для детального оз-
накомления обратитесь к соответствующим руководствам [26].




Часть III. Сбор, подготовка и анализ данных
630
Компьютерные программы для ANOVA и ANCOVA
SPSS
Можно эффективно выполнить однофакторный AN OVA, используя программу
ONEWAY. Эта программа также позволяет проверить априорные и апостериорные контра-
сты. Для выполнения многофакторного дисперсионного анализа используем ANOVA. Хотя
с помощью программы ANOVA можно определить ковариаты, она не позволяет выполнить
полный ковариационный анализ. Для полного дисперсионного или ковариационного ана-
лиза, включая повторные измерения или множественные зависимые измерения, рекомен-
дуется процедура MANOVA. Для неметрического дисперсионного анализа, включая меди-
анный тест ^-выборок и однофакторный дисперсионный анализ Краскела—Уоллеса
(Kruskal-Wallis), следует использовать программу NPAR TESTS.
SAS
Основная программа для выполнения дисперсионного анализа в случае сбалансированного
плана — ANOVA. Она обрабатывает данные из широкого диапазона экспериментальных пла-
нов, включая многомерный дисперсионный анализ и повторные измерения. Можно прове-
рить как априорные, так и апостериорные контрасты. Для несбалансированных планов ис-
пользуется более общая GLM-процедура. Эта программа выполняет следующий анализ: дис-
персионный, ковариационный, дисперсионный с повторными измерениями и множествен-
ный дисперсионный, а также проверяет априорные и апостериорные контрасты. Хотя про-
грамма GLM используется и для анализа сбалансированных планов, она не настолько эффек-
тивна для таких моделей, как программа ANOVA. Процедура VARCOMP вычисляет компо-
ненты дисперсии. Для неметрического дисперсионного анализа используем NPAR1WAY.
BMDP
Для однофакторного дисперсионного анатиза используем программу P1V. Она выполняет
ковариационный анализ, а также проверяют конкретные контрасты групповых средних. Одна-
ко более общей моделью является программа P2V, которая выполняет дисперсионный и кова-
риационный анализ для множества моделей эксперимента с фиксированными уровнями фак-
торов. Она также может обрабатывать повторные измерения, сбалансированные и несбаланси-
рованные планы. P4V, являясь более совершенной программой, может выполнять
многомерный дисперсионный и ковариационный анализы, в том числе и анализ комплекс-
ных экспериментальных планов. Другой специализированной программой является P3V, ко-
торая использует метод максимального правдоподобия для анализа моделей с фиксированны-
ми и случайными коэффициентами. Она подходит как для сбалансированных, так и несбалан-
сированных планов. P8V является общей моделью, которая выполняет дисперсионный анализ
для любого полного плана с ячейками одинакового размера. Непараметрическии дисперсион-
ный анализ можно выполнить с помощью программы P3S. И наконец, программа P7D, кроме
создания гистограмм, может выполнять однофакторный дисперсионный анализ.
Minitab
Дисперсионный и ковариационный анализ можно выполнить с помощью функции
Stats>ANOVA. Она выполняет однофакторный ANOVA, однофакторный невложенный
(unstacked) ANOVA, двухфакторный ANOVA, анализ средних, сбалансированный ANOVA,
ковариационный анализ, общую линейную модель, построение графика главных эффектов,
графика взаимодействия и графиков остатков. Для вычисления среднего и стандартного от-
клонений применима функция кросстабулирования. Для получения F и р значений ис-
пользуйте сбалансированный ANOVA.
Excel
С помощью функции Tools>Data Analysis можно выполнить как однофакторный, так и
двухфакторный ANOVA. Двухфакторный ANOVA имеет возможности двухфакторного ана-


Глава 16. Дисперсионный и ковариационный анализ 631
лиза с повторением и без повторения. Двухфакторный анализ с повторением содержит не-
сколько выборок для каждой группы данных.




Часто задачи, для которых можно использовать ANOVA, имеют независимые перемен-
ные (предикторы), которые являются взаимосвязанными. Такая ситуация требует особого
внимания. Проанализируем исследование, выполненное Burke, в котором коррелируют две
категориальные независимые переменные. Здесь приводится небольшой набор данных
(реальные данные являются собственностью компании).
Пол
Рейтинг эффективности
Намерение купить товар (PI)

2,00 1,00 0,00
4,00 1,00
2,00
6,00 1,1)0
3,00
4,00 4,00 0,00
5,00 5,00 0,00
6,00 6,00 1,00
2,00 0.00
1,00
3,00 2,00 0,00
4,00 3,00 0,00
5,00 1,00
4,00
6,00 5,00 1,00
8,00 6,00 1,00

Поскольку два предиктора в некоторой степени коррелируют (г1 = 0,24), важно опреде-
лить вклад каждого.
Первая таблица ANOVA показывает сумму квадратов рабочей модели при допущении,
что суммы квадратов для каждого предиктора скорректированы на наличие другого предик-
тора (т.е. как будто каждый предиктор был введен вторым).
Вторая таблица ANOVA показывает результирующее действие иерархического моделиро-
вания, когда предиктор '"Рейтинг" был "введен" первым.
Третья таблица ANOVA показывает результирующее действие иерархического моделиро-
вания, когда предиктор '"Пол" "введен" первым.

ANOVA а.Ь
Однозначный метод
Сумма Степени Средний квадрат F Значимость
квадратов свободы (df)

PI Главные эффекты 5,424
(Совместный} 32,542 11,418 0,009
Рейтинг
Пол 13,792 2,758 5,807 0,038
5
0,050
3,125 3,125 6,579
1
6
Модель 32,542 3,424 11,418 0,009
5
Остаток 2.375 0,475
11
34,917 3,174
Итого

a) PI по рейтингу, полу;
в) Все эффекты введены одновременно.



Часть III. Сбор, подготовка и анализ данных
632
ANOVAa
Иерархический метод
Сумма Степени F
Средний Значимость
свободы (df)
квадратов квадрат

6
PI Главные эффекты (Совместный) 32,542 5,424 11,418 0,009
5
Рейтинг 29,417 5,883 12,386 0,008
1
Пол 3,125 3,125 6,579 0,050
6
32,542 5,424 11,418 0,009
МОДЕЛЬ

Остаток 5
2,375 0,475
11
Итого 3,174
34,917

а) Р1 по рейтингу, полу


ANOVA8
Иерархический метод
И
Сумма Степени Средний F Значимость
свободы (df)
квадратов квадрат

Главные (Совместный) 6
32,542 5,424 11,418 0,009
1
эффекты Рейтинг 18,750 18,750 39,474 0,002
Пол 5
13,792 2,758 5,807 0,038
6
Модель 32,542 5,424 11,418 0,009
Остаток 5
2,375 0,475
Итог 11
34,917 3,174

a) PI по полу, рейтингу.


Обобщение результатов
Сумма квадратов Регрессия Первый фактор ˜ рейтинг Первый фактор — пол

Рейтинг 18,750
13,792 29,417
;Пол 13,792
3,125 3,125
Общая для предикторов 32,542
16,917 32,542
Общая объяснимая 32,542 32,542 32,542

Теперь, когда вопрос ясен, необходимо определить, за какую долю в сумме квадратов от-
вечает каждая независимая переменная? Так как предикторы взаимосвязаны, иерархиче-
ский метод показывает сумму квадратов для предикторов, введенных в заданном порядке.
Однозначное решение показывает объяснимую сумму квадратов для каждого предиктора,
как будто он был введен вторым (вот почему ее не прибавляют к собственной сумме ... оба
предиктора нельзя ввести вторыми). Три решения дают полную картину вклада каждого
предиктора, если бы он был единственной независимой переменной и его предельный
вклад был бы как у второго предиктора.



РЕЗЮМЕ
В дисперсионном (ANOVA) и ковариационном (ANCOVA) анализе зависимая переменная
метрическая, а все независимые переменные категориальные или представляют собой комби-


633
Глава 16. Дисперсионный и ковариационный анализ
нации категориальных и метрических переменных. Однофакторный дисперсионный анализ
включает единственную независимую категориальную переменную. Суть метода заключается в
проверке нулевой гипотезы о равенстве средних в совокупности. Полная вариация в зависимой
переменной раскладывается на два компонента: вариация, связанная с независимой перемен-
ной, и вариация, связанная с ошибкой. Вариацию выражают как сумму квадратов, скорректи-
рованную на среднее значение (SS). Средний квадрат получают делением суммы квадратов (SS)
на соответствующее число степеней свободы (df)- Нулевую гипотезу о равенстве средних прове-
ряют с помощью F-статистики, которая представляет собой отношение среднего квадрата неза-
висимой переменной к среднему квадрату ошибки.
Многофакторный дисперсионный анализ включает одновременное исследование двух или
больше категориальных независимых переменных. Главное преимущество этого анализа в том,
что он позволяет изучить взаимодействия между независимыми переменными. Значимость
общего эффекта, эффекты взаимодействия и главные эффекты отдельных факторов изучают с
помощью соответствующих У7-критериев. Имеет смысл проверять значимость главных эффек-
тов отдельных факторов, только если соответствующие эффекты взаимодействия незначимы.
Ковариационный анализ включает, по крайней мере, одну категориальную независимую
переменную и одну интервальную или метрическую независимую переменную. Метрическую
независимую переменную или ковариату обычно используют для удаления посторонних ва-
риаций из независимой переменной.
Если дисперсионный анализ выполняют для двух или больше факторов, то могут возник-
нуть проблемы их взаимодействия. Взаимодействие имеет место, если эффект независимой пе-
ременной на зависимую различен для разных уровней другой независимой переменной. Если
взаимодействие статистически значимо, оно может быть упорядоченным или неупорядочен-
ным. Неупорядоченное взаимодействие может быть пересекающегося или непересекающегося
типа. В сбалансированных планах относительную важность факторов при объяснении вариа-
ции в зависимой переменной измеряют с помощью со2. Для изучения рахтичий между кон-
кретными средними используются множественные сравнения либо в форме априорных, либо в
форме апостериорных контрастов.
В дисперсионном анализе с повторными измерениями наблюдения над каждым участни-
ком эксперимента выполняются для каждой комбинации условий эксперимента. Этот план
полезен для управления различиями среди участников, которые существуют априори и извест-
ны до проведения эксперимента. Неметрический дисперсионный анализ включает изучение
различий в средних значениях двух или больше групп, когда зависимая переменная измерена
порядковой шкалой. Многомерный дисперсионный анализ (MANOVA) включает две или
больше метрических зависимых переменных.


ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ
F-статистика (F-statstic) дисперсионный анализ с повторными из-
мерениями (repeated measures analysis of
^-выборочный медианный тест (^-sample
variance)
median test)
значимость главного эффекта каждого
апостериорные контрасты (a posteriori con-
фактора (significance of the main effect of
trasts)
each factor)
априорные контрасты (a priori contrasts)
значимость полного эффекта (significance
взаимодействие (interaction) of overall effect)
внутри групповая вариация SSeHympu (^ет,г) значимость эффекта взаимодействия
(significance of the interaction effect)
дисперсионный анализ (analysis of vari-
ance-AN OVA) ковариата (covariate)
ковариационный анализ (analysis of covari-
ance - ANCOVA)


634 Часть III. Сбор, подготовка и анализ данных
контрасты (contrasts) * однофакторный дисперсионный анализ
(one-way analysis of variance)
2 2
корреляционное отношение, eta <n )
' однофакторный дисперсионный анализ
критерии множественных сравнений
Краскела-Уоллиса (Kruskal-Wallis one-way
(multiple comparison tests)
analysis of variance)
межгрупповая вариация SS^^ (SSX)
* омега в квадрате (omega squared, or)
многомерный дисперсионный анализ
* разложение полной вариации
(multivariate analysis of variance -
(decomposition of the total variation)
MANOVA)
* средний квадрат (среднее квадратичное)
многофакторный дисперсионный анализ
(mean square)
(«-way analysis of variance)
* упорядоченное взаимодействие (ordinal
2 2
множественная корреляция n (multiple n
interaction)
Неметрический дисперсионный анализ
' фактор (factor)
(nonmetric analysis of variance)
* факторный эксперимент (treatment)
неупорядоченное взаимодействие
(disordinal interaction)
общая сумма квадратов (полная вариация
переменной У) SSy


УПРАЖНЕНИЯ
Вопросы
1. Обсудите сходства и различия между дисперсионным и ковариационным анализами,
2. Какая связь между дисперсионным анализом и (-критерием?
3. Что такое полная вариация? На какие компоненты ее раскладывают при однофакторном
дисперсионном анализе?
4. Что такое нулевая гипотеза при однофакторном ANOVA? Какая основная статистика ис-
пользуется для проверки нулевой гипотезы при однофакторном ANOVA? Как вычислить
эту статистику?
5. Чем многофакторный дисперсионный анализ отличается от однофакторного?
6. Как полную вариацию раскладывают при многофакторном дисперсионном анализе?
7. Какое наиболее частое использование ковариаты в ANCOVA?
8. Дайте определение взаимодействию.
9. Чем различаются упорядоченное и неупорядоченное взаимодействие?
10. Как измеряют относительную важность факторов в сбалансированном плане?
11. Что такое априорный контраст?
12. Какой самый мощный критерий для апостериорных контрастов? Какой критерий наиболее
слабый?
13. Что подразумевают под ANOVA с повторными измерениями? Опишите разложение вариа-
ции в ANOVA с повторными измерениями.
14. Какие различия между метрическим и неметрическим дисперсионным анализом?
15. Опишите два критерия, используемые для изучения среднего значения в совокупностях
при неметрическом ANOVA.
16. Что такое многомерный дисперсионный анализ? Когда его лучше использовать?



635
Глава 16. Дисперсионный и ковариационный анализ
Задачи
1. Получив ряд жалоб от читателей, редколлегия студенческой газеты решила переоформить
первую страницу. Разработали два новых варианта — В и С, которые сравнили со старым
вариантом А. Сформирована случайным образом выборка из 75 студентов и по 25 студентов
распределены для оценки каждого из трех вариантов. Студентов попросили оценить эффек-
тивность варианта по одиннадцатибальной шкале (1 бал— плохо, 11 —отлично).
a) Сформулируйте нулевую гипотезу.
b) Какой статистический критерий вам следует использовать?
c) Сколько степеней свободы связано со статистикой, лежащей в основе критерия для про-
верки гипотезы?
2. Маркетолог-исследователь хочет проверить гипотезу о том, что в генеральной совокупности
не существует различий в важности покупок для потребителей, которые живут на севере,
юге, востоке и западе Соединенных Штатов Америки. После сбора данных и дисперсион-
ного анализа получены результаты, представленные в следующей таблице.
Степени Сумма Средние F (отношение Вероятность
Источник вариации
свободы квадратов квадраты дисперсий)

Меаду группами 3 70,212 23,404 1,12 0,3
Внутри групп 996 20812,416 20,896
a) Достаточно ли оснований для отклонения нулевой гипотезы?
b) Какое заключение можно сделать на основании данной таблицы?
c) Если среднее значение важности покупок рассчитано для каждой группы, то, как вы
считаете, выборочные средние одинаковы или разные?
d) Чему равен размер выборки в данном исследовании?
3. В пилотном исследовании, где изучалась эффективность трех рекламных роликов (А, # и С),
выбрали 10 потребителей для оценки рекламы по девяти балльной шкале Лайкерта. Полу-
ченные данные приведены в таблице.
a) Вычислите категориальную и общую средние.
b) Вычислите SSy, SSt и SSautufiKU.
c) Вычислите корреляционное отношение г\2.
d) Вычислите значение F.
e) Эффективны ли в равной степени все три ролика?
Рекламные ролики

в С
А

7
4 8
л 7
П
3 6 7
4 5 6
8
4
3
7
6
Л

( 6
г
>
3 8
5
:• 4 5
:; 4 6



636 Часть lit. Сбор, подготовка и анализ данных
4. Маркетологи с помощью эксперимента проверили влияние дизайна упаковки и оформления
витрины на вероятность покупки сухого завтрака Product 19. Дизайн упаковки и оформление
витрины изменялись на двух уровнях каждый, что вылилось в план 2 x 2 . Вероятность покуп-
ки измерялась по семибалльной шкале. Результаты частично приведены ниже в таблице.
a) Заполните до конца таблицу, вычислив значения среднего квадрата, F, значимости Ей (о2.
b) Как интерпретировать главные эффекты?
Источник вариации Сумма Степени of
Средний F Значимость F
квадратов свободы квадрат

Дизайн упаковки 68,76 1
Оформление витрины 320,19 1
Двухфакторное взаимодействие 55,05 1
Остаточная ошибка 176,00 40


УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET
И КОМПЬЮТЕРА
1. Используя соответствующие программы для компьютера на свой выбор (SPSS, SAS, BMDP,
Minitab и Excel), проанализируйте данные табл. 16.2. Выполните однофакторный ANOVA,
двухфакторный ANOVA и ковариационный анализ. Сравните полученные результаты с
приведенными в книге.
2. Используя подходящую компьютерную программу, проанализируйте данные задачи 3.


КОММЕНТАРИИ
1. Thomas Kiely, "The Internet: Fear and Shopping in Cyberspace"1, Harvard Business Review, July-
August 1997, p. 13—14; Pradeep Korgaonkar, George Moschis, "The Effects of Perceived Risk and
Social Class on Consumer Preferences for Distribution Outlets" in Paul Bloom, Russ Winer, Harold
H. Kassarjian, Debra L. Scammon, Bart Weitz, Robert Spekman, Vijay Mahajan, Michael Levy
(eds.) Enhancing Knowledge Development in Marketing, Series № 55 (Chicago, IL: American Mar-
keting Association, 1989), p. 39-43.
2. Michael Wilke, "Health Reports in Vogue Again for Drug Advertisers", Advertising Age, August 18,
1997, p. 31; Easwar S. Iyer, "The Influence of Verbal Content and Relative Newness on the Effec-
tiveness of Comparative Advertising", Journal of Advertising 17 (1988), p. 15—21.
3. По последним применениям дисперсионного анализа см. работы Sajeev Varki, Rowland T. Rust,
"Satisfaction Is Relative", Marketing Research: A Magazine of Management & Applications, Summer
1997, p, 14—19; Rohit Deshpande, Douglas M. Stayman, "A Tale of Two Cities: Distinctiveness Theory
and Advertising Effectiveness", Journal of Marketing Research, February 1994, p. 57—64.
4. Daniel B. Wright, Understanding Statistics (Thousand Oaks, CA: Sage Publications, 1993); M.J.
Norusis, The SPSS Guide to Data Analysis for SPSS/PC+ (Chicago: SPSS Inc., 1991), p. 4.
5. Wade C. Driscoll, "Robustness of the ANOVA and Tukey-Kramer Statistical Tests", Computers &
Industrial Engineering, October 1996, p. 265-268; Richard K. Burdick, "Statement of Hypotheses in
the Analysis of Variance", Journal of Marketing Research, August 1983, p. 320-324.
6. F -критерий представляет собой обобщенную форму ( -критерия. Если случайная пе-
ременная является t -распределенной с л степенями свободы, то г подчиняется
F -распределению с 1 и п степенями свободы. Если есть два факторных уровня или
факторных эксперимента, то дисперсионный анализ эквивалентен двусторонней про-
верке с помощью / -критерия.


Глава 16. Дисперсионный и ковариационный анализ 637
7. Хотя расчеты аналогичны для модели с фиксированными факторами и случайными, ин-
терпретация результатов разная. Сравнение этих методов можно найти в работах Amir Frez,
Matthew С. Bloom, Martin T. Wells, "Using Random Rather Than Fixed Effects Models in Meta-
Analysis: Implications for Situational Specificity and Validity Generalization'', Personnel Psychology,
Summer 1996, p. 275-306; John W. Neter, Applied Linear Statistical Models, 4th ed. (Burr Ridge,
IL: Irwin, 1996),
8. Dawn Wilensky, "Cents and Sensibility", Discount Store News, March 4, 1996, p. 18—19; Denise T,
Smart, James E. Zemanek, Jr., Jeffrey S. Conant, "Videolog Retailing: How Effective Is This New
Form of Direct Mail Marketing?", in Paul Bloom, Russ Winer, Harold H. Kassarjian, Debra L.
Scammon, Bart Weitz, Robert Speckman, Vijay Mahajan, Michael Levy (eds.), Enhancing
Knowledge Development in Marketing, Series № 55 (Chicago, IL: American Marketing Association,
1989), p.85.
9. Мы рассматриваем только полные факториальные модели, которые объединяют все воз-
можные комбинации уровней факторов. Например, см. статью Geeta Menon, "Are the Parts
Better Than the Whole? The Effects of Decomposition Questions on Judgements of Frequent Be-
haviors", Journal of Marketing Research, August 1997, p. 335—346.
10. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publi-
cations, 1997); Jerome L. Mayers, Fundamentals of Experimental Design, 3rd ed. (Boston, MA: Al-
lyn & Bacon, 1979). Также см. статью Mark T. Spence, Merrie Brucks, "The Moderating Effects of
Problem Characteristics on Experts' and Noveces' Judgements", Journal of Marketing Research,
February 1997, p. 233-247.
11. Jacques Tacq, Muftivariate Analysis Techniques in Social Science Research (Thousand Oaks, CA: Sage
Publications, 1997); Wayne W. Daniel, James C. Terrell, Business Statistics, 7th ed. (Boston, MA:
Houghton Mifflin, 1995).
12. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publi-
cations, 1997).
13. Robert A. Peterson, Alain J. Jolibert, "A Meta-Analysis of Country-of-Origin Effects", Journal of
International Business Studies, Fourth Quarter 1995, p. 883—900; Paul Chao, "The Impact of Coun-
try Affiliation on the Credibility of Product Attribute Claims", Journal of Advertising Research, April-
May 1989, p, 35-41.
14. Хотя это и считается наиболее обшим методом выполнения дисперсионного анализа, воз-
можны и другие ситуации. Например, эффекты ковариаций и факторов могут быть инте-
ресны в равной степени или набор ковариаций может быть очень важным. Текущее приме-
нение см. в статье Kevin Lane Keller, David A. Aaker, "The Effects of Sequential Introduction of
Brand Extensions", Journal of Marketing Research, February 1992, p. 35—50.
15. Для более детального обсуждения см. работы John W, Neter, Applied Linear Statistical Models,
4th ed. (Burr Ridge, IL: Irwin, 1996); A.R. Wildt, O.T. Ahtola, Analysis ofCovariance (Beverly Hills,
CA: Sage Publications, 1978).
16. U.N. Umesh, Robert A. Peterson, Michelle McCann-Nelson, Rajiv Vaidyanathan, "Type IV Error
in Marketing Research: The Investigation of AN OVA Interactions", Journal of the Academy of
Marketing Science, Winter 1966, p. 17—26; William T. Ross, Jr., Elizabeth H. Greyer, "Interpreting
Interactions: Raw Means or Residual Means", Journal of Consumer Research, September 1993,
p. 330—338; J.H. Leigh, T.C. Kennear, "On Interaction Classification", Educational and
Psychological Measurement, Winter 1980, p. 841-843.
17. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publi-
cations, 1997); Brian Wansink, "Advertising's Impact on Category Substitution", Journal of
Marketing Research, November 1994, p. 505—515; Laura A. Peracchio, Joan Meyers-Levy, "How
Ambiguous Cropped Objects in Ad Photos Can Affect Product Evaluations", Journal of Consumer
Research, June 1994, p. 190-204.
18. Rohit Verma, John C. Goodale, "Statistical Power in Operations Management", Journal of Operations
Management, August 1995, p. 139—152; Gordon A. Wyner. ''The Significance of Marketing Research",

638 Часть III. Сбор, подготовка и анализ данных
Marketing Research: A Magazine of Management & Applications, Winter 1993, p. 43—45; Alan Sawyer, J.
Paul Peter, "The Significance of Statistical Significance Tests in Marketing Research", Journal of
Marketing Research, May 1983, p. 125; R.F. Beltramini, "A Meta-Analysis of Effect Sizes in Consumer
Behavior Experiments", Journal of Consumer Research, June 1985, p. 97—103.
19. Эта формула не подходит, если делают повторные измерения по зависимой переменной.
См. работы Edward F. Fern, Kent В. Monroe, "Effect-Size Estimates: Issues and Problems in In-
terpretation", Journal of Consumer Research, September 1996, p. 89—105; David H. Dodd, Roger F.
Schultz, Jr., "Computational Procedures for Estimating Magnitude of Effect for Some Analysis of
Variance Designs", Psychologists Bulletin, June 1973, p. 391—395.
2
20. Формулу пт приписывают У. Хейсу. См. работу W.L. Hays, Statistics for Psychologists (New
York, NY: Holt, Rinehart & Winston, 1963). Современное применение см. в статье S. Rat-
neshwar, Shelly Chaiken, ''Comprehension's Role in Persuasion: The Case of Its Moderating Effect
on the Persuasive Impact of Source Cues", Journal of Consumer Research, 1991, p, 52—62. Относи-
тельно альтернативного метода см, также статью Adam Finn, Ujwal Kayande, "Reliability As-
sessment and Optimisation of Marketing Measurement", Journal of Marketing Research, February
1997, p. 262-275.
21. Edward F. Fern, Kent B. Monroe, "Effect-Size Estimates: Issues and Problems in Interpretation",
Journal of Consumer Research, September 1996, p. 89—105; Jacob Cohen, Statistical Power Analysis for
the Gehavioral Sciences (New York, NY: Academic Press, 1969).
22. John W. Neter, Applied Linear Statistical Models, 4th ed. (Burr Ridge, IL: Irwin, 1996); B.J. Winer,
Donald R. Brown, Kenneth M. Michels, Statistical Principles in Experimental Design, 3rd, ed. (New
York, NY: McGraw-Hill, 1991).
23. Возможно объединение межгруппового и внутригруппового факторов в одной модели. См.,
например, работы Michael К. Mount, Marcia R. Sytsma, Joy F. Hazucha, Katherine E. Holt,
•'Rater-Ratee Effects in Developmental Performance Ratings of Managers", Personnel Psychology,
Spring 1997, p. 51—69; Susan M. Broniarczyk, Joseph W. Alba, "The Importance of the Brand in
Brand Extension", Journal of Marketing Research, May 1994, p. 214—228; Aradhna Krishna, "The
Effect of Deal Knowledge on Consumer Purchase Behavior", Journal of Marketing Research, Febru-
ary 1994, p. 76-91.
24. См. работы Thomass Novak, "MANOVAMAP: Geographical Representation of MANOVA in
Marketing Research", Journal of Marketing Research, August 1995, p. 354—374; J.H. Bray, S.E.
Maxwell, Multivariate Analysis of Variance (Beverly Hills, CA: Sage Publications, 1985).
Относительно применения MANOVA см. статью Sajeev Varki, "Satisfaction is Relative",
Marketing Research: A Magazine of Management & Applications, Summer 1997, p. 14-19.
25. Neil R. Abramson, Robert J. Keating, Henry W. Lane, "Cross-National Cognitive Process Differ-
ences: A Comparison of Canadian, American and Japanese Managers", Management International
Review, Second Quarter 1996, p. 123—147; Ishmael Akah, "A Cross-National Analysis of the Per-
ceived Commonality of Unethical Practices in Marketing Research", in William Lazer, Eric Shaw,
Chow-How Wee (eds.), World Marketing Congress (International Conference Series), vol. IV (Boca
Raton, FL: Academy of Marketing Science, 1989), p. 2—9.
26. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publica-
tions, 1998); Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks,
CA: Sage Publications, 1993); Mohamed Afzal Norat, "Software Reviews", Economic Journal: The
Journal of the Royal Economic Society, May 1997, p. 857—882; John Wass, "How Statistical Software
Can be Assessed", Scientific Computing and Automation (October 1966).
27. Patricia L. Smith, Eltwood F. Oakley, "Gender-Related Differences in Ethical and Social Values of
Business Students: Implications for Management", Journal of Business Ethics, January 1997, p. 37—45;
Ishmael Akaah, "Differences in Research Ethics Judgements between Male and Female Marketing
Professionals", Journal of Business Ethics, August 1989, p. 375—381.




Глава 16. Дисперсионный и ковариационный анализ 639
Г л а в а 17
Корреляция и регрессия
После изучения материала этой главы вы должны уметь ...
1. Разбираться в том, что собой представляют парная корреляция, частная корреляция,
частичная корреляция и показать, почему они являются основой для регрессионного
анализа.
2. Объяснить природу и методы двумерного регрессионного анализа и описать общую модель,
процедуры оценки параметров, нормирование коэффициента регрессии, проверки значи-
мости, процедуру определения точности прогноза, анализ остатков и перекрестную провер-
ку модели.
3. Объяснять природу и методы множественного регрессионного анализа и значение частных
коэффициентов регрессии.
4. Описать специализированные методы, используемые в рамках множественного регресси-
онного анализа, особенно пошаговую регрессию, регрессию с фиктивными переменными, а
также дисперсионный и ковариационный анализ с регрессией.
5. Объяснить неметрическую корреляцию и такие показатели, как коэффициенты ранговой
корреляции Спирмена и Кендалла.


КРАТКИЙ ОБЗОР
В главе 16 рассматривались взаимосвязи между /-критерием, дисперсионным и ковариаци-
онным анализом, а также регрессией. В этой главе вы познакомитесь с регрессионным анали-
зом, объясняющим вариацию в доли рынка, продажах, предпочтении торговой марке и других
маркетинговых результатах, получаемых при управлении такими маркетинговыми перемен-
ными, как реклама, цена, распределение и качество продукции. Однако прежде чем присту-
пить к изучению регрессии, мы рассмотрим парную корреляцию и частный коэффициент кор-
реляции, лежащие в основе регрессионного анализа.
Разбираясь с регрессионным анализом, мы сначала обсудим самый простой его тип — дву-
мерную регрессию, опишем процедуры оценки, нормирования коэффициентов регрессии,
проверку и определение тесноты и значимости связи между переменными, а также точность
прогноза и допущения, которые лежат в основе регрессионного анализа. Затем мы разберем мо-
дель множественной регрессии, уделив особое внимание интерпретации параметров, тесноте
связи, проверкам значимости и анализу остатков.

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГ)



( Множественная регрессия
В ходе реализации проекта "Выбор универмага" маркетологи использовали множественный
регрессионный анализ для разработки модели, объясняющий выбор того или иного кон-
1 кроткого универмага, исходя из его оценки респондентами по восьми критериям. Зависи-
мой переменной в данном случае служило предпочтение, отдаваемое каждому универмагу.
В качестве независимых переменных выбраны оценки каждого магазина по следующим па-
раметрам: качество товаров; их разнообразие и ассортимент; условия обмена и возврата про-
данных товаров; услуги продавцов; цены; удобное расположения; планировка универмага;
| условия предоставления кредита и выполнения расчетов за покупки. Анализ показал, что |

640 Часть III. Сбор, подготовка и анализ данных
все факторы, рассматривавшиеся в качестве критерия выбора магазина, за исключением
фактора "услуги продавцов", являются значимыми для объяснения предпочтения магазина
клиентом. Коэффициенты всех переменных оказались положительными. Это означает, что
чем выше оценки каждого из значимых факторов конкретного магазина, тем выше его
предпочтение. Модель хорошо согласуется с фактическими данными, и на ее основе можно
f хорошо прогнозировать предпочтения в выборе универмага.

Ниже рассматриваются такие вопросы регрессионного анализа, как пошаговая регрессия,
мул ьти колли неарность, относительная важность независимых переменных (предикторов) и
перекрестная проверка. Мы опишем регрессию с фиктивными переменными и использование
этой процедуры для выполнения дисперсионного и ковариационного анализа. Рассмотрим на
примерах применение регрессионного анализа.

ПРИМЕР. Как регрессионный анализ помог фирме Avon
Компания Avon Products, Inc. одно время испытывала нехватку торговых агентов, которые
служили основой ее бизнеса, предлагая продукцию компании путем личной продажи. Что-
бы выявить факторы, обусловившие сложившуюся ситуацию, были разработаны компью-
терные регрессионные модели. Они показали, что самой значимой переменной является
уровень денежного взноса, который торговые агенты платят за продукцию компании. Руко-
водствуясь полученными данными, компания снизила взнос. Это позволило увеличить ко-
личество сотрудников и снизить текучесть кадров [1].



I ПРИМЕР. Internet-революция в торговле
Многие эксперты по розничной торговле считают, что продажа товаров через Internet pe-
j волюционизирует розничную торговлю. Рассмотрим результаты маркетингового исследова-
j ния, в рамках которого проводился корреляционный анализ предпочтений потребителей к
I электронным покупкам посредством видеотекса (услуга покупки товаров на дому с помо-
| гдью компьютера). Для объяснения потребительских предпочтений были выбраны предла-
| гаемые в литературе психографическая, демографическая и информационная переменные.
j Исследование проводилось в Южной Флориде, где с 1983 года функционирует компания
I Viewtron, предлагающая видеотекс-услуги. Компания Viewtron, филиал корпорации Knight-
\ Ridder Corporation, тратит миллионы на рекламу в этой сфере услуг. Все респонденты знако-
I мы с понятием компьютеризированной покупки товаров на дому.
Для анализа данных маркетологи воспользовались множественной регрессией. Ее общая
i модель оказалась значимой при уровне значимости, равном 0,05. Одномерная проверка с
| помощью ^-критерия показала, что следующие переменные значимы при уровне значимо-
I сти, равном 0,05 или ниже: ценовая ориентация, пол, возраст, род деятельности, этническая
1 принадлежность и образование. Ни одна из трех информационных переменных (СМИ, уст-
\ ная информация, реклама) не связаны статистически значимым образом с зависимой пере-
\ менной, которой являлось предпочтение потребителей.
Полученные результаты означают, что покупать товары через Internet предпочитают бе-
1 лые, женщины, среднего возраста, хорошо образованные, руководители, и ориентированные
| на цену товара. Информация такого типа представляет ценность для целевого маркетинга в
I сфере электронной торговли |2].

Эти примеры иллюстрируют использование регрессионного анализа для определения неза-
висимых переменных, которые обуславливают статистически значимую вариацию в исследуе-
мой зависимой переменной; установления структуры и формы взаимосвязи, силы взаимосвязи
и определения предсказанных значений зависимой переменной. Главное в регрессионном ана-
лизе — это понять, что такое парная корреляция.



641
Глава 17. Корреляция и регрессия
ПАРНАЯ КОРРЕЛЯЦИЯ
Часто при проведении маркетингового исследования нас интересует связь между двумя
метрическими переменными, как, например, в следующих ситуациях.
• Насколько сильно связан объем продаж с расходами на рекламу?
• Существует ли связь между долей рынка и количеством торгового персонала?
• Связано ли восприятие качества товаров потребителями с их восприятием цены?
В таких ситуациях наиболее широко используемой статистикой является коэффициент пар-
ной корреляции, г (product moment correlation г), который характеризует степень тесноты связи
между двумя метрическими (измеряемыми с помощью интервальной или относительной
шкал) переменными, скажем, Хп Y. Этот коэффициент используют, чтобы определить, суще-
ствует ли между переменными линейная зависимость. Он показывает степень, в которой ва-
риация одной переменной X связана с вариацией другой переменной Y, т.е. меру зависимости
между переменными Л" и Y.

Коэффициент парной корреляции г (product moment correlation r)
Статистический показатель, характеризующий степень тесноты связи между двумя метриче-
скими переменными.

Поскольку этот коэффициент первоначально предложил Карл Пирсон (Karl Pearson), его
также называют коэффициентом корреляции Пирсона. Кроме того, он известен как простой коэф-
фициент корреляции, линейный коэффициент корреляции или просто коэффициент корреляции,
Имея выборку, размером п наблюдений, коэффициент парной корреляции г, для переменных
Хтл Кможно вычислить по формуле:




Разделив числитель и знаменатель на (п ˜ 1) получим:
±(X,-X)(Y,-Y)

п-



л-1
±(X,-X)(Y,-Y)
л-1



л-1
п˜\
covv
=
sxsr
В этих уравнениях X и X обозначают выборочные средние, а Sx и Sy— соответствующие
стандартные отклонения. COV^ представляет собой ковариацию (covariance) между X и Y, явля-
ясь мерой зависимости Хи Y.



642 Часть III. Сбор, подготовка и анализ данных
Ковариация (covariance)
Систематическая взаимосвязь между двумя переменными, при которой изменение одной
переменной вызывает соответствующее изменение другой переменной (COVxy).

Ковариация может быть как положительной, так и отрицательной. Деление на SxSy приво-
дит к нормированному виду, так что коэффициент корреляции г находится в пределах от ми-
нус 1 до плюс 1. Обратите внимание, что коэффициент корреляции никак не связан с едини-
цами измерения, в которых выражены переменные.
Предположим, что исследователь хочет выяснить, зависит ли отношение респондента к ме-
стожительству от длительности проживания его в этом городе. Отношение выражают в 11-
балльной шкале (1— не нравится город, 11 — очень нравится город), а продолжительность
проживания измеряют количеством лет, которые респондент прожил в этом городе. Получен-
ные от 12 респондентов данные приведены в табл. 17.1.
.„
\ Таблица 17.1 Отношение
i сти проживания в нем
Номер респондента Отношение к городу Длительность проживания Влияние погодных условий
1 10 3
6
12 11
9
2
12 4
3 8
1
4 3 4
11
10
5 12
•: 1
6 6
7
5 В
1
а 4
8 2
8
9 18
11
10
10 9
У
11 17 8
Ю
5
2
2
12

Коэффициент корреляции можно вычислить по формуле:
— _ (10 + 12 + 12 + 4 +12 +6 + 8+ 2 +18 + 9 +17 + 2) _ п
А — ' У, ЗЗЗ

12
- (6 + 9+8 + 3 + 10 + 4 + 5 + 2 + 11 + 9 + 10 + 2)
= 6,583
Y=
12

E(jr, - Jf )(^ - У) = (Ю - 9,33) (6 - 6,58) + (12 - 9,33) (9 - 6,58)+

+ (12 - 9,33) (8 - 6,58) + (4 - 9,33) (3 - 6,58)+
+ (12 - 9,33) (10 - 6,58) + (6 - 9,33) (4 - 6,58)+
+ (8 - 9,33) (5 - 6,58) + (2 - 9,33) (2 - 6,58)+
+ (18 - 9,33) (11 - 6,58) + (9-9,33) (9-6,58)+
+ (17 - 9,33) (10 - 6,58) + (2 - 9,33) (2 - 6,58)+
= - 0,3886 + 6,4614 + 3,7914 + 19,0814+
+ 9,1314+8,5914 + 2,1014 + 33,5714+
+ 38,3214-0,7986 + 26,2314 + 33,5714= 179,6668




643
Глава 17. Корреляция и регрессия
? Х - А: ) = (10 - 9,33)2 + (12 - 9,33)2 + (12 - 9,33)2 + (4 - 9,33)2
(,
/-1
2 2 2 2
+ (12 - 9,33) + (6 - 9,33) + (8 - 9,33) + (2 - 9,33) +
+ (18 - 9,33)2 + (9 - 9,33)2 + (17 - 9,33)2 + (2 - 9,33)2 =
= 0 4 8 + 7, 1289 + 7, 1289 + 28,4089+
,49
+ 7,1289 + 11,0889 + 1,7689 + 53,7289+
+ 75, 1689 + 0,1089 + 58,8289 + 53,7289 = 304,6668
2
и
2 2 2 2
? Г -У) = ( - 6,58) + (9 - 6,58) + (8 - 6,58) + (3 - 6,58)
(, 6
i-i
+(10 - 6,58)2 + (4 - 6,58)2 + (5 - 6,58)2 + (2 - 6,58)2+
+ (11 - 6,58)2 + (9 - 6,58)2 + (10 - 6,58)2 + (2 - 6,58)2=
= 0,3364 + 5,8564 + 2,0164 + 12,8164+
+ 1 1,6964 + 6,6564 + 2,4964 + 20,9764 +
+ 19,5364 + 5,8564 + 1 1,6964 + 20,9764 = 120,9168
Таким образом
=0.936.
,
^(304,6668X120,9168)
В этом примере г = 0,9361, что близко к 1. Это означает, что отношение респондента к сво-
ему городу сильно зависит от времени проживания в нем. Более того, положительный знак г
указывает на прямую связь (прямопропорциональную): чем дольше респондент проживает в
городе, тем больше он ему нравится, и наоборот.
Так как коэффициент корреляции показывает меру, в которой вариация значений одной
переменной зависит от вариации другой, то г можно выразить через разложение полной вариа-
ции (см. главу 16). Другими словами,
объяснимое изменение
г = --
полная вариация
_SS,
ssy
_ полная вариация - вариация ошибки _
полная вариация



Следовательно, г* показывает, какая доля вариации одной переменной обусловлена вариа-
цией другой. И г, и г2 являются симметричными показателями связи между переменными.
Иначе говоря, корреляция между Хм Хта же, что и корреляция между Уи X. Корреляция не за-
висит оттого, какая из переменных взята в качестве зависимой, а какая в качестве независи-
мой. Коэффициент корреляции является мерой линейной зависимости, и он не предназначен
для измерения силы связи в случае нелинейной зависимости. Таким образом, г = 0 просто оз-
начает отсутствие линейной зависимости между X и Y. Это не означает, что А" и У не взаимо-
связаны. Между ними может существовать нелинейная зависимость, которую нельзя опреде-
лить с помощью коэффициента корреляции г (рис. 17.1).
Если коэффициент корреляции вычисляют не для выборки, а для всей генеральной сово-
купности, то он обозначается греческой буквой р (ро). Коэффициент г — это оценка р. Обрати-
те внимание, что расчет г предполагает, что X и У— метрические переменные, кривые распре-
деления которых имеют одинаковую форму. Если эти допущения не удовлетворяются, то зна-
чение г уменьшается и р получается недооцененным. В маркетинговых исследованиях данные,
полученные с использованием относительной шкалы при небольшом числе категорий, могут
не быть строго интервальными. Это приведет к снижению г и недооценке р [3].



644 Часть III. Сбор, подготовка и анализ данных
I




1
-3


Рис. 17. 1. Нелинейная зависимость, для которой г˜0

Статистическую значимость связи между двумя переменными, измеренную коэффициен
том корреляции г, можно легко проверить. Гипотезы имеют такой вид:



Статистику, лежащую в основе критерия для проверки гипотезы, вычисляют по формуле:
п-2
\-г2
которая имеет /-распределение с я — 2 степенями свободы [4]. Для коэффициента корреля-
ции, вычисленного на основе данных, приведенных в табл. 17.1, значение/-статистики равно:

12-2
I = 0.9361 2
1-(0,9361)

а число степеней свободы — 12 — 2 = 10. Из таблицы /-распределения (табл. 4 Статистического
приложения) критическое значение t-статистики для двусторонней проверки и уровне значи-
мости а = 0,05 равно 2,228. Следовательно, нулевую гипотезу об отсутствии связи между пере-
менными Хи У отклоняют. Это наряду с положительным знаком коэффициента корреляции
показывает, что отношение респондента к своему городу прямо пропорционально зависит от
продолжительности проживания его в городе. Более того, высокое значение г показывает, что
эта связь сильная.
При выполнении многомерного анализа данных часто полезно изучить простую корреля-
цию между каждой парой переменных. Эти результаты представляют в форме корреляционной
матрицы, которая показывает коэффициент корреляции между каждой парой данных. Обыч-
но, рассматривают только самую нижнюю треугольную часть матрицы. Все элементы по диаго-
нали равны 1,00, так как переменная коррелирует сама с собой. Верхняя треугольная часть мат-
рицы — зеркальное отражение нижней треугольной части матрицы, поскольку г— симметрич-
ный показатель связи между переменными. Форма корреляционной матрицы для пяти
переменных от Vt до К5 представлена ниже:



645
Глава 17. Корреляция и регрессия
V, Vg V9 V< V5
V,
Vi 0,5
V, 0,3 0,4
V4 0,1 0,3 0,6
Vs 0,2 0,5 0,3 0,7

Хотя матрица простых коэффициентов корреляций позволяет уяснить суть попарных свя-
зей, иногда исследователю хочется изучить связи между двумя переменными при условии
управления одной или несколькими переменными. В последнем случае следует оценивать ча-
стную корреляцию.


ЧАСТНАЯ КОРРЕЛЯЦИЯ
В то время как линейный коэффициент корреляции — это показатель силы связи,
описывающий линейную зависимость между двумя переменными, частный коэффициент
корреляции (partial correlation coefficient) — это мера зависимости между двумя перемен-
ными при фиксированных (исключенных) или скорректированных эффектах одной или
нескольких переменных.

Частный коэффициент корреляции (partial correlation coefficient)
Мера зависимости между двумя переменными после фиксации (исключения, корректиров-
ки) эффектов одной или нескольких переменных.

Эта статистика позволяет ответить на следующие вопросы,
• Зависит ли объем продаж от расходов на рекламу, если фиксировать влияние цены
(исключить эффект цены)?
• Существует ли связь между долей рынка и количеством торгового персонала, если за-
фиксировать эффект от усилий по продвижению товара?
• Связано ли восприятие качества товаров потребителями с их восприятием цены, если
исключить эффект торговой марки?
Предположим, что в этих ситуациях исследователь хочет вычислить силу связи между X и
Y, исключив при этом эффект влияния третьей переменной Z. Поступая логично, сначала сле-
дует удалить эффект Zn3 значения переменной X. Для этого следует использовать коэффици-
ент парной корреляции га между X и Z, и вычислить значения X, исходя из информации о Z.
Затем полученное значение X вычитают из фактического значения X, получая скорректирован-
ное значение X. Аналогично корректируют значения Y, чтобы исключить эффект, и скорректи-
рованный коэффициент обозначают г^.. Статистически, поскольку простой коэффициент кор-
реляции между двумя переменными полностью описывает линейную зависимость между ни-
ми, частный коэффициент корреляции можно вычислить, зная только эти простые
коэффициенты корреляции и не используя отдельные наблюдения.



Предположим, что исследователь хочет рассчитать силу связи между отношением к городу,
переменная Y, и продолжительностью проживания в нем, переменная Х„ фиксируя при этом
эффект третьей переменной, а именно, погодных условий, переменная Х2. Эти данные приве-
дены втабл. 17.1.



646 Часть III. Сбор, подготовка и анализ данных
Линейные коэффициенты корреляции между переменными равны:
гТЖ| =0,9361, rv), =0,7334, г1]Л, =0,5495
Частный коэффициент корреляции можно вычислить по формуле:
0,9361-(0,5495)(0,7334)
гм.д = . V• Д- V =0,9386
1
^1-(0,5495)'>/1-(0,7334)
Результаты показывают, что исключение эффекта, связанного с погодными условиями,
незначительно воздействует на зависимость между отношением к городу и продолжительно-

<<

стр. 23
(всего 35)

СОДЕРЖАНИЕ

>>