<<

стр. 19
(всего 35)

СОДЕРЖАНИЕ

>>

борки. И наконец, поскольку во многих странах рабочая этика находится не на таком высоком
уровне, как в США, следует ожидать, что проблема мошенничества будет стоять в них более
остро. Очень большое значение имеет проверка результатов работы на местах. Как видно из
описанного ниже примера, правильное применение соответствующих процедур позволяет зна-
чительно уменьшить проблемы и получить в итоге достоверные и полезные для клиента ре-
зультаты опроса.

ПРИМЕР. Любовь к американским товарам объединяет европейцев
Исследование отношения покупателей к товарам, проведенные британской компанией
Research Internationa/, специализирующейся на маркетинговых исследованиях, показали,
что, несмотря на объединение в Общий рынок, потребители в Европе проявляют большую
приверженность к американским товарам. По оценкам специалистов, ожидается, что в ско-
ром времени любовь к американским товарам объединит потребителей Европы. Исследова-
ния проводились в Германии, Великобритании, Италии и Нидерландах. Исходя из предпо-
ложения, что соотечественники смогут собрать более точные данные, во всех странах ис-
пользовались только местные интервьюеры и контролеры. При этом весь полевой персонал
был очень тщательно подготовлен и работал под строжайшим контролем, что позволило


Глава 13. Полевые работы 511
обеспечить качественные результаты исследования и свести к минимуму колебания показа-
телей по разным странам вследствие различия в процедурах опроса.
В обшей сложности было проведено 6724 интервью. Оказалось, что в некоторых странах
европейцы высоко оценивают американские товары потому, что те отличаются новаторст-
вом, а в других их считают модными и очень качественными. Интересно отметить, что
французы, которые считаются противниками всего американского, также оказались при-
верженцами американской продукции. Из 1034 опрошенных французских потребителей
40% ответили, что американские товары модные, 38% считают, что они новаторские, а 15%
заявили, что американская продукция отличается высоким качеством. Примерно такие же
результаты исследований были получены во всех четырех упомянутых выше странах, Полу-
чить качественные итоги исследований стало возможно благодаря использованию местного
персонала, его тщательной подготовке и строгому контролю над его работой.
Результаты данного исследования очень полезны для компаний, которые планируют
расширение присутствия американских товаров на европейском рынке. Как отметил дирек-
тор по европейским операциям британской компании Henley Center, специализирующейся
на экономических прогнозах и консультациях, Эрик Салама (Eric Salama): "Американским
компаниям не следует скрывать тот факт, что они американские, а наоборот, по нашему
мнению, им стоит делать на это упор и постараться извлечь выгоду из своего американского
наследия" [21].



ЭТИКА МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЙ
Независимо от того, кем собраны данные — собственным отделом маркетинговых исследо-
ваний либо международным агентством, специализирующимся на сборе информации, необ-
ходимо, чтобы все сведения были получены с соблюдением определенных этических стандар-
тов. Маркетологи и полевой персонал должны работать так, чтобы респонденты, высказывая
свою точку зрения, не испытывали никаких неудобств. Один из путей достичь этого заключа-
ется в обеспечении респондентов всей необходимой информацией о фирме, проводящей ис-
следование, и проекте, в исчерпывающих ответах на их вопросы и в точном определении обя-
занностей и ожиданий интервьюера и респондента в самом начале опроса. Более того, интер-
вьюер должен сразу уведомить респондента, что тот не обязан отвечать на вопросы, которые
хотел бы оставить без ответа, и что, почувствовав дискомфорт, он может прервать интервью в
любой момент. Исследователь и полевой персонал несут моральную ответственность и обязаны
уважать личную жизнь, чувства и достоинство респондента [22]. Кроме того, необходимо, что-
бы после беседы с интервьюером у респондента осталось позитивное и приятное впечатление.
Все это обеспечит благосклонное отношение и готовность респондентов к возможному сотруд-
ничеству в будущем.
Кроме того, исследователи и агентства, ведущие опросы на местах, несут ответственность
перед клиентами и обязаны точно следовать определенным процедурам отбора, подготовки,
контроля, проверки результатов опросов и оценки персонала. Они должны обеспечить целост-
ность процесса сбора данных. Все процедуры, связанные со сбором данных на местах, следует
подробно оформить документально, и эту документацию предоставить клиенту. Как подтвер-
ждает описанный ниже пример, правильные действия исследователей и агентств по сбору ин-
формации способствуют устранению множества морально-этических проблем, связанных с ра-
ботой на местах.
-™—-»———-^
ПРИМЕР. Компания Sophisticated Data Research — лидер по сбору информации
Информация, которая предоставляется при звонках по номерам "800-", при использова-
нии кредитных карточек или при покупке товаров в магазинах, часто применяется для со-
ставления списков покупателей и потенциальных клиентов. Такие списки крайне редко 1
продаются организациям, специализирующимся на телемаркетинге или на прямом марке-
! тинге. Общественное мнение по этому вопросу, однако, несколько иное: многие считают, i


512 Часть III. Сбор, подготовка и анализ данных
что маркетологи и исследователи в сфере маркетинга неправомерно используют собранную I
ими информацию. Такое неверное восприятие формирует негативное отношение к марке-
тинговым исследованиям.
Стараясь изменить такое положение, многие агентства, специализирующиеся на марке- i
тинговых исследованиях и сборе информации на местах, каждое интервью начинают с об- i
суждения этого вопроса. Так, при контакте с потенциальными респондентами компания I
Sophisticated Data Research (SDR), работающая в Атланте, знакомит их с информацией о своей \
фирме и о характере проводимого маркетингового исследования. Таким образом, респон-
денты убеждаются в том, что SDR действует в полном соответствии с этическими нормами. I
Некоторые фирмы, занимающиеся маркетинговыми исследованиями, и агентства по сбору I
данных на местах сообщают потенциальным респондентам телефонные номера, по которым |
можно бесплатно получить дополнительную информацию либо проверить сведения, пре- I
доставленные интервьюерами. Подобные мероприятия повышают уровень информирован-
I ности населения и улучшают отношение респондентов к опросам, что позволяет компании |
f SDR собирать более достоверную и полную информацию для своих клиентов [23].



ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА
Независимо от выбранного метода опроса (по телефону, лично, по почте или и примене-
нием электронных средств), Internet играет очень важную роль на всех этапах полевых работ:
при отборе и подготовке персонала, при контроле над его работой, при проверке результатов
опроса и оценке персонала. Если говорить, скажем, о подборе кадров, то с помощью Internet
будущих интервьюеров можно искать, проводить с ними собеседование и нанимать. На-
пример, вы можете начать этот процесс с размещения объявлений о вакансиях для интер-
вьюеров на Web-странице своей компании, на электронных досках объявлений и на других
подходящих сайтах. Несомненно, это ограничит поиск сотрудников кругом людей, интере-
сующихся Internet, но, возможно, в современных условиях для маркетинговых исследований
нужны именно такие служащие.
Сеть Internet с ее мультимедийными возможностями может стать отличным вспомогатель-
ным инструментом для подготовки полевого персонала по всем аспектам ведения опросов. На-
пример, в ходе такой подготовки можно пользоваться индивидуальными тренинговыми про-
граммами, что значительно повышает результативность обучения. Электронная почта и защи-
щенные чаты повышают эффективность взаимосвязи между контролерами и интервьюерами.
Размещение на защищенном Web-сайте отчетов о ходе опроса и информации о качестве прове-
дения интервью и затратах, благодаря чему все заинтересованные стороны в любой момент по-
лучат к ней доступ, повысит контроль из центрального офиса.
Если респонденты имеют электронный адрес или доступ в Internet, очень упрощается про-
цедура проверки правильности результатов работы по сбору данных, особенно при телефонных
опросах. Таким респондентам можно разослать по электронной почте краткий проверочный
опрос или попросить их посетить Web-сайт, на котором такой опрос размещен. И наконец, с
помощью Internet на стадии подготовки информируют будущих полевых работников относи-
тельно оценочных критериев, а они, в свою очередь, пользуются этим средством связи для опе-
ративного предоставления информации об эффективности своей работы.
Для выбора респондентов, планирования работы интервьюеров, контроля и наблюдения
используются компьютеры. Сегодня существует целый ряд специальных программ, например
Ci3 Sistem, разработанная компанией Sawtooth Software, Inc. Компьютеризированные системы
Ci3 применяются для управления процессом опроса, что делает их незаменимым инструмен-
том при проведении маркетинговых исследований. Компьютерная техника используется также
для работы со списками почтовой рассылки. С ее помощью, например, такие списки можно
сортировать по индексам, географическим регионам либо по каким-либо другим, заранее оп-
ределенным характеристикам. Компьютеры также отслеживают электронным способом случаи,
когда при почтовом опросе не поступает ответа. Компьютерная техника позволяет составлять


Глава 13. Полевые работы 513
точные и своевременные отчеты, используемые в процессе наблюдения и контроля над работой
персонала на местах: отчеты о квотах, о распределении звонков (call disposition), о возникнове-
нии инцидентов, заключительные отчеты по данным о респондентах и отчеты об эффективно-
сти работы интервьюеров. Такая возможность автоматизации процесса отчетности повышает
действенность наблюдения и контроля и способствует повышению качества полученных дан-
ных в целом. Поскольку благодаря использованию компьютеров для составления сводных от-
четов требуется намного меньше времени, больше внимания можно уделить интерпретации
полученных данных и непосредственно наблюдению над процессом сбора информации.

Распределение звонков (call disposition)
В отчете о распределении звонков фиксируются результаты интервью, проведенных по
телефону.


В центре внимания Burke
Компания Burke делает все возможное, чтобы интервьюеры, работающие в рамках того
или иного проекта, имели необходимую подготовку и мотивы для хорошей работы, и чтобы
их работа должным образом контролировалась и оценивалась предельно точно. Все это по-
зволяет повысить эффективность и качество ее исследований. Как же компании удается
управлять этим сложным процессом?
Первый этап заключается в поиске хороших менеджеров. Для реализации программ по
подготовке менеджеров компания менеджеров нанимает самых лучших из своих интервьюе-
ров и людей с университетским образованием. Каждый служащий перед поступлением на
работу проходит 6—12-месячную подготовку (в зависимости от опыта и уровня образова-
ния), затем проходит 24 двух-трехчасовые тренировочные программы, после чего проводит-
ся тестирование полученных им знаний (его выполняет старший менеджер по сбору дан-
ных). Основное внимание уделяется стандартным процедурам сбора информации. Кроме
того, в рамках программы по подготовке менеджеров дополнительно изучаются следующие
дисциплины, а именно:
• обслуживание клиентов;
• методы управления выборорчным наблюдением;
• управление кадрами;
• управление взаимоотношениями (отношения между служащими, оценочные процеду-
ры, разрешение конфликтов и т.д.).
В компании Burke в департаменте по сбору информации постоянно работают специали-
сты по кадровым вопросам, в обязанности которых входит найм и подготовка как менедже-
ров, так и штата для работы на местах. Компания старается нанимать сотрудников из трех
основных групп населения: студентов колледжей; лиц, желающих иметь дополнительный
заработок; интервьюеров, нацеленных на карьеру в этой деятельности. Для привлечения та-
ких людей Burke использует разнообразные способы:
• реклама (в газетах и по радио);
• ярмарки вакансий, специализированные выставки, дни открытых дверей;
« подробные внутренние справочные программы;
• работа в студенческих общежитиях;
• использование временного штата.
В компании Burke разработаны и применяются четко определенные процедуры отбора и
подготовки работников по сбору данных на местах, На одном из этапов первичного про-
смотра претенденту предлагается простой тест на проверку грамотности и умения считать.
К сожалению, высокий процент кандидатов не в состоянии пройти этот тест или делают это


514 Часть III. Сбор, подготовка и анализ данных
с большим трудом. В подготовительном процессе компании уделяется большое внимание !
улучшению этих навыков. На начальной стадии занятий кандидатам предлагается принять j
участие в работе дискуссионной группы, и в ходе их общения за ними ведется наблюдение, |
оценивается их способность слушать других и логически и точно реагировать на услышан-
ное. После прохождения этих проверок принимается окончательное решение, которое осно-
вывается на следующем:
• практические занятия по набору телефонных номеров под тщательным наблюдением
контролера;
• прослушивание и оценка контролерами;
• тренинги и обсуждение успешных интервью в группе;
• способность читать и вызывать собеседника на диалог;
• явный профессионализм;
• навыки при выполнении стандартных процедур и основных рекомендаций.
Интервьюеры проходят курсы по следующим направлениям:
• как вести себя в случае отказа респондента отвечать на вопрос и как правильно прекра-
щать интервью;
• эффективность процесса опроса;
• речевой курс (правильное произношение и т.д.);
• машинопись;
• тренинг по работе с клиентом (проведение опроса в качестве представителя конкретной
организации).
Для обеспечения целостности процесса сбора данных в каждом проекте Burke постоянно
отслеживает качество и последовательность работы интервьюеров:
• ежедневное прослушивание и оценка каждого интервьюера по каждому проекту;
• стандартизация отчетности с использованием компьютерных систем управления;
• продолжительность интервью каждого интервьюера;
коэффициент прерывания интервью на одного интервьюера;
распределение звонков на одного интервьюера;
время работы в электронной компьютерной сети, подробный отчет с продолжением;
участие руководителей высшего звена в программах открытого мониторинга, в рамках
которых менеджеры произвольно выбирают интервьюера и слушают, как он работает.



РЕЗЮМЕ
В распоряжении маркетологов имеется две основные возможности для сбора данных — они
могут создать свой собственный коллектив либо заключить контракт с агентством, специали-
зирующимся на полевых работах. Полевой персонал должен состоять из здоровых, инициатив-
ных, коммуникабельных, приятных, образованных и опытных людей. Они должны пройти
подготовку по важнейшим аспектам полевых работ, включая то, как следует налаживать перво-
начальный контакт, как задавать вопросы, как стимулировать исчерпывающие ответы, как за-
писывать ответы и заканчивать интервью. Наблюдение над работой полевого персонала заклю-
чается в контроле качества и редактирования данных, в выборочном контроле, контроле для
выявления случаев мошенничества и контроле из центрального офиса. Проверка результатов
полевых работ выполняется повторным обзваниванием 10—25% респондентов, указанных ин-
тервьюером, и выяснения, действительно ли их опрашивали. Работа полевого персонала оце-


Глава 13. Полевые работы 515
нивается на основе их денежных и временных затрат, показателей доли ответивших от общего
количества намеченных респондентов, качества опроса и качества собранных данных.
Поскольку во многих странах нет местных агентств, специализирующихся на сборе данных,
если речь идет о международных маркетинговых исследованиях, отбор, подготовка, наблюде-
ние за работой персонала по сбору информации и его оценка приобретает даже большее значе-
ние. Морально-этический аспект работы по сбору данных на местах заключается в том, что оп-
рос должен вестись в дружественной и непринужденной манере, что позволит сформировать у
респондента позитивное отношение к таким опросам. Необходимо сделать все возможное, что-
бы полученные данные были высокого качества. Качество работы на местах значительно по-
вышается благодаря Internet и компьютерной технике.


ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ
• выборочный контроль (sampling control) • распределение звонков (call disposition)
• стимулирование ответов (probing)


УПРАЖНЕНИЯ
Вопросы
1. Какие возможности для сбора информации есть в распоряжении маркетолога?
2. Опишите процесс полевых работ.
3. Какой квалификацией должен обладать полевой персонал?
4. Каковы основные рекомендации относительно процедуры предложения вопросов?
5. В чем заключается стимулирование полных ответов?
6. Как записывать ответы на неструктурированные вопросы?
7. Как интервьюер должен прекращать интервью?
8. Каковы аспекты наблюдения за работой полевого персонала?
9. Как управлять проблемами отбора респондентов?
10. В чем заключается проверка результатов полевых работ? Как она проводится?
11. Опишите критерии, используемые при оценке работы персонала по сбору информации.
12. Опишите основные источники ошибок в ходе полевых работ.

Задачи
1. Составьте несколько инструкций для студентов для проведения личного опроса на дому.
2. Прокомментируйте следующие ситуации, которые могут возникнуть в процессе полевой
работы, и предложите методы их решения.
a) Один из интервьюеров имеет очень большой показатель отказов респондентов отвечать
при личном опросе на дому.
b) При опросе с использованием автоматизированных компьютерных систем при первой
попытке набора многие номера океазываются занятыми.
c) Один из интервьюеров сообщил, что в конце интервью многие респонденты спрашива-
ют его, правильно ли они ответили на вопросы.
d) В ходе проверки результатов опроса одна из респонденток сообщила, что не может
вспомнить, чтобы ей кто-либо звонил с просьбой ответить на вопросы, а интервьюер
настаивает на том, что он проводил опрос.

516 Часть III. Сбор, подготовка и анализ данных
УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET
И КОМПЬЮТЕРА
1. Посетите Web-сайты каких-либо компаний, специализирующихся на маркетинговых ис-
следованиях. Составьте отчет по всем материалам, связанным с полевыми работами, разме-
шенными на этих сайтах.
2. Посетите Web-сайт Marketing Research Association (www. mra-net. org) и внимательно озна-
комьтесь с разделами этического кодекса, относящимися к процессу сбора данных. Со-
ставьте краткий отчет.
3. Воспользуйтесь специальным программным обеспечением PERT/CPM, например
MacProject, Timeline, Harvard Project Manager, Microsoft Project или Category PertMaster, и
разработайте график полевых работ для проведения обще национального опроса о предпоч-
тениях потребителей по поводу продуктов быстрого приготовления на основе 2500 интер-
вью в Лос-Анджелесе, Солт-Лэйк-Сити, Далласе, Сант-Луисе, Милуоки, Нью-Орлеане,
Цинциннати, Орландо, Атланте, Нью-Йорке и Бостоне.


КОММЕНТАРИИ
1. Reg Baker, "Nobody's Talking", Marketing Research A Magazine of Management & Applications,
Spring 1996, p. 11-A; "Study Tracks Trends in Refusal Rates", Quirk's Marketing Research Review,
August-September 1989, p. 16-18, 42-43.
2. Gale D. Muller, Jane Miller, "Interviewers Make the Difference", Marketing Research A Magazine of
Management & Application, Spring 1996, p. 8—9; "JDC Interviews Michael Redington", Journal of
Data Collection, Spring 1985, p. 2-6.
3. James H. Frey, Sabine M. Oishi, How to Conduct Interviews by Telephone and In Person (Thousand
Oaks, CA: Sage Publications, 1995).
4. Gale D. Muller, Jane Miller, "Interviewers Make the Difference", Marketing Research A Magazine of
Management & Applications, Spring 1996, p. 8—9; Jean Morton-Williams, Interviewer Approaches
(Brookfield: Ashgate Publishing Co, 1993).
5. Joseph A. Catina, Diane Bemson, Jesse Canchola, Lance M. Pollack et al, "Effects of Interviewer
Gender, Interviewer Choice, and Item Wording on Responses to Questions Concerning Sexual Be-
havior", Public Opinion Quarterly., Fall 1996, p. 345—375; Philip B. Coulter, "Race of Interviewer
Effects on Telephone Interviews", Public Opinion Quarterly, Summer 1982, p. 278—284; Eleanor
Singer, Martin R. Frankel, Marc B. Classman, "The Effect of Interviewer Characteristics and Ex-
pectations on Response", Public Opinion Quarterly, Spring 1983, p. 68—83.
6. Darren W. Davis, "Nonrandom Measurement Error and Race of Interviewer Effects among African
Americans", Public Opinion Quarterly, Spring 1997, p. 183—207; Raymond F. Barker, "A Demo-
graphic Profile of Marketing Research Interviewers", Journal of the Market Research Society (UK),
July 29, 1987, p. 279-292.
7. M.K. Kacmar, W.A. Hochwarter, "The Interview as a Communication Event A Field Examination
of Demographic Effects on Interview Outcomes", Journal of Business Communication, July 1995,
p. 207—232; Martin Collins, Bob Butcher, "Interviewer and Clustering Effects in an Attitude Sur-
vey", Journal of the Market Research Society (UK), January 1983, p. 39—58.
8. James H. Frey. Sabine M. Oishi, How to Conduct Interviews by Telephone and in Perwn (Thousand
Oaks, CA: Sage Publications. 1995); Bud Phillips, "The Four Faces of Interviewers", Journal of Data
Collection, Winter 1983, p. 35-40.
9. Pamela Kiecker, James E. Nelson, "Do Interviewers Follow Telephone Survey Instructions",
Journal of the Market Research Society^ April 1996, p, 161—176; P.J. Guenzel, T.R. Berkmans,
C.F. Cannell, General Interviewing Techniques (Ann Arbor, MI: Institute for Social Research, 1983).


Глава 13. Полевые работы 517
10. Mick P Couper, "Survey Introductions and Data Quality", Public Opinion Quarterly, Summer 1997,
p. 317-338.
11. Эта методика соответствует той, которую использует Burke Marketing Research, Cincinnati.
12. "Market Research Industry Sets Up Interviewing Quality Standards", Management Auckland, March
1997, p. 12; "JDC Interviews Michael Redington", Journal of Data Collection, Spring 1985, p. 2—6.
13. Данный раздел тесно связан с Interviewer's Manual, rev. ed. (Ann Arbor, MI: Survey Research
Center, institute for Social Research, University of Michigan); PJ. Guenzel, T.R. Berkmans, C.F.
Cannell, General Interviewing Techniques (Ann Arbor, MI: Institute for Social Research).
14. См. работы Interviewer's Manual, p. 15—19; Michelle Marchetti, "Probing Customer Problems",
Sales & Marketing Management, March 1996, p. 46.
15. Interviewer's Manual, rev. ed. (Ann Arbor, MI: Survey Research Center, Institute for Social
Research, University of Michigan), p 16. Перепечатывается с разрешения Institute for Social
Research.
16. "Market Research Industry Sets Up Interviewing Quality Standards", Management-Auckland,
March 1997, p. 12; Jean Morton Williams, Wendy Sykes, "The Use of Interaction Coding and Fol-
low up Interviews to Investigate Comprehension of Survey Questions", Journal of the Market
Research Society, April 1984, p. 109-127,
17. Robert F. Hurley, Jukka M. Laitamaki, "Total Quality Research Integrating Markets and the Or-
ganization", Call forma Management Review, Fall 1995, p. 59—78; Martin Collins, Bob Butcher,
"Interviewer and Clustering Effects in an Attitude Survey", Journal of the Market Research Society
(UK), January 1983, p. 39-58.
18. Samuel Greengard, "50% of Your Employees Are Lying, Cheating & Stealing", Workforce, October
1997, p. 44—53; Donald S. Tull, Larry E, Richards, "What Can Be Done about Interviewer Bias", in
Jagdish Sheth (ed.), Research in Marketing (Greenwich, CT: JAI Press, 1980), p. 143-162.
19. Elame D. Pulakos, Neal Schmitt, David Whitney, Matthew Smith, "Individual Differences in Inter-
viewer Ratings. The Impact of Standardization. Consensus Discussion, and Sampling Error on the
Validity of a Structured Interview", Personnel Psychology, Spring 1996, p. 85—102.
20. Jack Edmonston, "Why Response Rates Are Declining", Advertising Age's Business Marketing, Sep-
tember 1997, p.12,
21. Thomas T. Semon, "Select Local Talent When Conducting Research Abroad", Marketing News,
September 15, 1997, p. 28, Laurel Wentz, "Poll Europe Favors U.S. Products", Advertising Age,
September 23, 1991).
22. James E. Nelson, Pamela L. Kiecker, ''Marketing Research Interviewers and Their Perceived Ne-
cessity of Moral Compromise", Journal of Business Ethics, October 1996, p. 1107—1117.
23. Glen J. Nowak, Joseph Phelps, "Direct Marketing and the Use of Individual-Level Consumer In-
formation Determining How and When Privacy Matters", Journal of Direct Marketing, Autumn
1997, p. 94-108.




518 Часть III. Сбор, подготовка и анализ данных
Г л а в а 14
Подготовка данных к анализу
После изучения материала этой главы вы должны уметь ...
1. Описать суть и этапы подготовки к анализу данных, собранных в результате маркетингово-
го исследования.
2. Объяснить, как ведется проверка и редактирование анкет, и описать суть работы с неудов-
летворительными ответами с помощью повторных полевых работ, присвоения пропущен-
ных значений и отсеивания неудовлетворительных ответов.
3. Перечислить основные рекомендации относительно кодирования анкет, содержащих
структурированные и неструктурированные ответы.
4. Обсудить процесс "очищения" данных и методы, используемые для работы с пропущен-
ными ответами: замена их нейтральными значениями, использование вмененных ответов,
исключение наблюдения целиком и попарное исключение переменных.
5. Дать определение причин и описать методы статистической корректировки данных: умно-
жение на весовой коэффициент, переопределение переменной и преобразование шкалы.
6. Описать процедуру выбора стратегии анализа данных и назвать факторы, влияющие на это
решение.
7. Описать классификацию основных статистических методов, уметь подробно классифици-
ровать одномерные и многомерные методы статистического анализа.
8. Понимать суть внутри культурного, пан культурного и межкультурного подходов к анализу
данных в процессе выполнения международных маркетинговых исследований.
9. Дать определение этическим проблемам, связанным с обработкой данных, особенно с про-
цессом отбраковки неудовлетворительных ответов, нарушением предположений, лежащих
в основе различных методов анализа данных, оценкой и интерпретацией результатов иссле-
дования.
10. Описать использование Internet и компьютеров при подготовке данных к анализу и в ходе
самого анализа.


КРАТКИЙ ОБЗОР
Определив проблему маркетингового исследования и разработав наиболее подходящий под-
ход к ее решению (глава 2), нужно составить соответствующий план проведения исследования
(главы 3—12). Затем следует этап, на котором проводится сбор данных (полевые работы) (глава 13),
завершив который, исследователь может перейти к подготовке данных и их анализу. Эта деятель-
ность составляет пятый этап маркетинговых исследований. Перед тем как передать исходные
данные, содержащиеся в анкетах, для статистического анализа, их необходимо преобразовать в
подходящую для анализа форму. Качество статистических результатов напрямую зависит от того,
насколько тщательно и аккуратно данные готовились к анализу. Недостаточное внимание к этой
деятельности может серьезно исказить статистические выводы, что, в свою очередь, ведет к непра-
вильной интерпретации данных всего маркетингового исследования.
В этой главе описывается процесс сбора данных, который начинается с проверки полноты
заполнения анкет. Затем мы обсудим вопросы редактирования данных и дадим общие реко-
мендации относительно того, как работать с нечитабельными, неполными, непоследователь-
ными, неоднозначными и прочими ответами неудовлетворительного качества. Мы также

Глава 14. Подготовка данных к анализу 519
опишем процедуры кодирования, преобразования и "очистки" данных и при этом уделим осо-
бое внимание работе с пропущенными ответами и вопросам статистической корректировки
данных. В этой главе также обсуждаются проблемы выбора стратегии анализа собранных дан-
ных и рассказывается о классификации статистических методов. Кроме того, вы найдете опи-
сание различных принципов подхода к анализу данных, применяемых в процессе междуна-
родных маркетинговых исследований: внутри культурные, панкультурные и межкультурные
подходы. Здесь также описываются этические вопросы, связанные с обработкой данных, и осо-
бое внимание уделяется отбраковке (отсеиванию из анализа) неудовлетворительных ответов,
проблемам нарушения предположений, лежащих в основе выбранного метода анализа, а также
оценке и интерпретации полученных результатов. И наконец, в этой главе обсуждается роль
Internet и компьютеров в процессе подготовки и анализа собранных данных.
Начнем с ряда примеров, связанных с подготовкой данных.

ПРИМЕР. Обычное "очищение" данных
По данным корпорации Joann Harristhal of Custom Research, Inc., заполненные анкеты, по-
ступившие с мест сбора данных, зачастую содержат множество мелких ошибок, и происхо-
дит это вследствие неодинакового качества проведения опросов. Например, нередко ответы
не обводятся кружком либо не совсем точно выдерживаются шаблоны пропусков.
Такие, казалось бы, безобидные ошибки обходятся очень дорого. Учитывая это, при вво-
де ответов из анкет в память компьютера специалисты Custom Research запускают специаль-
ную "чистящую" программу для проверки полноты и правильности их заполнения. Расхо-
ждения обычно выявляются в распечатках в процессе их проверки контролером, в обязанно-
сти которого входит составление сводных таблиц. При обнаружении ошибки проводятся
определенные корректирующие мероприятия, и только после этого данные направляются на
анализ. По мнению специалистов из Custom Research, такая процедура значительно повыша-
ет качество результатов статистического анализа [1].



СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

Подготовка данных к анализу
В ходе реачизации проекта "Выбор универмага" информация собиралась в ходе личных ин-
тервью с респондентами на дому. Анкеты после их сдачи интервьюерами редактировались
бригадирами, тщательно проверялись на наличие неполных и логически непоследователь-
ных ответов или лишней информации. Анкеты с неудовлетворительными ответами возвра-
щались на места сбора данных (в "поле"), и интервьюеры еще раз встречались с указанными
респондентами, чтобы получить всю необходимую информацию. В результате девять анкет
все же были отсеяны из анализа, поскольку доля ответов неудовлетворительного качества в
них была очень велика. В итоге размер финальной выборки составил 271 анкету.
Для кодирования анкет была разработана кодовая книга. Кодирование довольно простое,
поскольку в анкете не было открытых вопросов, Затем данные вводились в память компью-
тера, после чего около 25% введенного объема информации проверялось на наличие ошибок
ввода с клавиатуры. Данные были "подчищены" путем выявления и отсеивания ответов,
выпадающих из определенного диапазона, и логически непоследовательных ответов. По-
давляющая часть рейтинговой информации собиралась с использованием шестибалльной
шкалы, поэтому ответы 0, 7 и 8 считались выходящими за пределы диапазона, а код 9 при-
сваивался пропущенным ответам.
Все пропущенные ответы отсеивались по методу исключения объекта целиком, в соотвстст- |
вии с которым анкеты, в которых было пропущено хотя бы одно значение, в анализ не I
включались. Такой способ исключения выбран потому, что количество наблюдений с про- \
пущенными переменными было незначительным, а размер выборки достаточно велик. I
I В процессе статистической корректировки данных вместо категориальных переменных бы-
| ли подставлены заменители. Кроме того, новые переменные выводились на основе исход- |

520 Часть lit. Сбор, подготовка и анализ данных
ных. Так, в результате суммирования рейтинговых оценок степени ознакомления респон-
дентов с десятью универмагами был вычислен коэффициент степени ознакомления и раз- [
работана стратегия анализа данных.

Описанный выше пример отражает разные стадии процесса подготовки данных к анализу.
Обратите внимание на то, что этот процесс начинается, когда работа по сбору данных на местах
еще продолжается. Приведенный выше пример, описывающий опыт компании Custom Research,
свидетельствует об огромной важности процедуры "очищения" данных, выявления ошибок и
корректировочных мероприятий перед тем, как приступить к анализу собранных данных.


ПРОЦЕСС ПОДГОТОВКИ ДАННЫХ К АНАЛИЗУ
Наглядное отображение процесса подготовки данных к анализу представлено на рис. 14.1.
Весь этот процесс определяется предварительно подготовленным планом анализа данных, ко-
торый составляется еще в ходе разработки всего плана маркетингово-
го исследования (см. главу 3). Первым его этапом выступает про- Подготовка
верка пригодности анкет, Затем наступает черед редактирования, предварительного
кодирования и переноса данных. Данные очищаются и при необ- плана проведения
анализа данных.
ходимости проводится работа с пропущенными данными, Часто
необходимо также провести статистическую корректировку ин-
формации для того, что бы сделать ее репрезентативной для гене-
ральной совокупности. Затем исследователю необходимо выбрать Проверка анкет
подходящую стратегию анализа данных.
Подготовка данных должна начинаться сразу же после того, как
станут доступными первые анкеты, в то время как полевые работы
Редактирование
еще продолжаются. Поэтому, если возникнут проблемы, ход полевых
работ можно скорректировать в нужном направлении.


ПРОВЕРКА АНКЕТ
Первый этап проверки анкет заключается в их проверке на пол-
ноту заполнения и качество интервьюирования. Зачастую этот про-
цесс ведется параллельно с полевыми работами. Следует отметить,
что если эта процедура выполняется по контракту специализирован-
ным агентством, исследователь обязан провести независимую про-
верку после ее завершения. Анкеты, поступившие с мест сбора дан-
ных, могут быть не приняты по следующим причинам.
1. Не заполнены отдельные части анкеты.
2. Представленные ответы свидетельствует о том, что респондент не Статистическая
понял вопросов либо не точно следовал инструкциям по запол- корректировка данных
нению анкеты. Например, не был соблюден шаблон пропусков
ответов.
3. Ответы варьируются очень незначительно или не варьируются
вовсе, например, респондент пометил одни четверки в серии се-
мибалльных рейтинговых шкал.
Рис. 14. ]. Процесс подго-
4. Возвращенная анкета является неполной — отсутствует одна или товки данных к анализу
несколько страниц.
5. Анкета получена по истечении заранее определенного срока сдачи.
6. Ответы в анкете даны респондентом, не входящим в группу, выделенную для участия в ис
следовании.


521
Глава 14. Подготовка данных к анализу
Если были определены конкретные квоты респондентов либо назначены размеры ячеечных
групп, все принятые анкеты необходимо соответствующим образом классифицировать и подсчи-
тать. Любые проблемы, связанные с выполнением требований, предъявляемых к выборкам,
должны выявляться своевременно, и необходимые корректировочные мероприятия, например,
дополнительные интервью в ячейках, представленных по результатам опроса недостаточно полно,
следует провести перед тем, как приступать к редактированию данных.


РЕДАКТИРОВАНИЕ ДАННЫХ
Процесс редактирования (editing) заключается в обработке собранных анкет для повышения
точности и аккуратности представленных в них данных. Он заключается в просмотре анкет, в
ходе которого выявляются нечитабельные, неполные, логически непоследовательные или не-
однозначные ответы.

Редактирование (editing)
Обработка анкет, повышающая точность и аккуратность представленной в них информации.

Если ответы неаккуратно и небрежно записаны, они могут быть неразборчивыми. Такая
ситуация более типична для анкет, содержащих много неструктурированных вопросов. Чтобы
правильно закодировать данные, они должны быть читабельными. Кроме того, анкеты бывают
в разной степени не до конца заполнены. Они могут содержать несколько или множество во-
просов без ответов.
На этапе редактирования исследователь проводит предварительную проверку анкет на
предмет логической непоследовательности представленных в них ответов. Существует ряд яв-
ных несоответствий, выявить которые не составляет большого труда. Так, возможна ситуация,
когда респондент сообщает, что его годовой доход составляет не больше 20 тысяч долларов, но
при этом указывает, что является постоянным покупателем таких престижных универмагов,
как Saks Fifth Avenue или Neiman-Marcus.
Ответы на неструктурированные вопросы могут быть неоднозначными, в результате их
сложно точно интерпретировать. Бывает, что ответ респондента записан сокращенно либо при
его записи использованы слова, имеющие несколько смысловых значений. Даже если вопросы
структурированы, нередки ситуации, когда респондент помечает больше одного варианта отве-
та на вопрос, по которому необходимо дать однозначный ответ. Предположим, респондент по-
мечает пункты 2 и 3 по пятизначной рейтинговой шкале. Как следует расценивать такой ответ:
что он имел в виду значение 2,5? В таком случае дело осложняется еще тем, что в процедуре ко-
дирования используются только целые числа.

Работа с ответами неудовлетворительного качества
При получении анкет, содержащих ответы неудовлетворительного качества, их обычно от-
правляют обратно на места сбора данных для уточнения, либо назначаются пропущенные зна-
чения, либо такие анкеты отбраковываются и не включаются в анализ.
Возврат анкет на место сбора данных. Анкеты, содержащие неудовлетворительные резуль-
таты опроса, возвращаются на места сбора данных, и интервьюеров обязуют провести повтор-
ное интервью. Такой вариант обычно применяется при проведении промышленных маркетин-
говых исследований, для которых характерны выборки небольших размеров и идентифициро-
вать респондентов, предоставивших ответы низкого качества, не составляет большого труда.
Однако данные, полученные в результате вторичного опроса, могут сильно отличаться от пер-
воначальных. Эта разница обуславливается, например, тем, что между опросами прошло опре-
деленное время, а также тем, что опросы проводились с использованием разных режимов
(например, первый раз по телефону, а второй — в ходе личного контакта).
Назначение пропущенных значений. Если возвращение анкеты на место сбора данных при-
знано экономически нецелесообразным, редактор может самостоятельно присвоить неудовле-

Часть III. Сбор, подготовка и анализ данных
522
творительным откликам пропущенные значения. Рекомендуется применять этот метод в сле-
дующих случаях: если количество респондентов, ответы которых признаны неудовлетвори-
тельными, невелико; доля ответов неудовлетворительного качества в ответах каждого респон-
дента незначительна; переменные по неудовлетворительным ответам не основные.
Отсеивание анкет респондентов, содержащих ответы неудовлетворительного качества.
При этом методе респонденты, предоставившие ответы неудовлетворительного качества, про-
сто отбраковываются и их анкеты не включаются в анализ. Данный способ эффективен в сле-
дующих случаях: если доля "неудовлетворительных" респондентов невелика (меньше 10%); ес-
ли размер выборки велик; если "неудовлетворительные" респонденты явно не отличаются от
"удовлетворительных" (например, по демографическому признаку или основным характери-
стикам использования товара); если доля неудовлетворительных откликов на каждого респон-
дента велика; если пропущены ответы по основным переменным. Однако бывают ситуации,
когда "неудовлетворительные" респонденты отличаются от "удовлетворительных" либо реше-
ние признать респондента "неудовлетворительным" предельно субъективно. В этих случаях
использование данного метода повлечет за собой искажение данных. Если исследователь при-
нимает решение отбраковать неудовлетворительные ответы того или иного респондента, он
должен отчитаться, на основе какой именно процедуры он идентифицировал данного респон-
дента. Это подтверждается следующим примером.

ПРИМЕР. Отсеивание респондента из анализа
В процессе межкультурного исследования поведения менеджеров по маркетингу в ряде
англоязычных африканских стран разослали анкеты в 565 фирм. Возвращено было 192 за-
полненные анкеты, из которых четыре сразу отбраковали, поскольку респонденты ответили,
что они не несут непосредственной ответственности за принятие решений общего характера
в маркетинге. Решение об отсеивании этих четырех анкет приняли на том основании, что
размер выборки был достаточно велик, а доля "неудовлетворительных" респондентов незна-
чительна [2].



КОДИРОВАНИЕ
Процедура кодирования (coding) заключается в присваивании кода, обычно цифрового, ка-
ждому возможному варианту ответа по каждому вопросу.

Кодирование (coding)
Процедура присвоения кода конкретному ответу на конкретный вопрос. Информация, полу-
ченная в результате исследования и образующая код, распределяется по столбцам.

Код включает указание на положение столбцов (полей) и информации, которая в них со-
держится. Так, пол респондентов может кодироваться следующим образом: 1 — для женщин и
2 — для мужчин. Поле отображает единичный элемент данных, например пол респондента.
Запись состоит из ряда соответствующих полей: пол, семейное положение, возраст, состав се-
мьи, занятие респондента и т.д. Все демографические и личностные характеристики респон-
дента, как правило, содержатся в одной регистрационной записи. Обычно каждая запись со-
стоит из 80 столбцов, хотя это и не обязательное условие. На одного респондента можно завести
несколько записей.
Данные (т.е. все записи) по всем респондентам хранятся в компьютерном файле, пример
которого вы видите в табл. 14.1. Столбцы представляют собой поля, а строки — записи.
В табл. 14.1 представлены фрагменты закодированных данных по респондентам, опрошенным
в ходе реализации уже привычного нам проекта "Выбор универмага".
Все данные соответствуют схеме кодирования, изображенной на рис. 14.2.




Глава 14. Подготовка данных к анализу 523
Таблица 14.1. Демонстрационный компьютерный файл из проекта "Выбор универмага"
Поля
Номера столбцов
1-3 4 5-6 7-8 96. 3S 77
Записи ...
Запись №1 001 1 31 01 6544234553
Запись №11 002 1 31 01 5564435433
Запись №21 003 1 31 01 4655243324
Запись №31 004 1 31 01 5463244645
55 6652354435
Запись №2701 271 1 31


Название переменной
Номер
Номер Номер Инструкции кодирования
столбца переменной вопроса

1 Идентификационные данные о рес-
1-3 Номера от 001 до 890. При необходимо-
понденте сти добавьте перед числом ноль
Номер записи
• 2 1 (Одинаково для всех респондентов)
Код проекта
3
5,6 31 (Одинаково для всех респондентов)
4
7-8 Код интервью Как указано в анкете
9-14 5 Код даты Как указано в анкете
15-20 6 Код времени Как указано в анкете
Проверочный код
21-22 7 Как указано в анкете
Пробел
23-24 Не заполняйте эти столбцы
25 В Кто ходит за покупками 1 Мужчины — 1
Женщины — 2
Прочее — 3
Введите обведенный номер
Пропущенные значения — 9
Степень знакомства с магазином 1
26 9 На По вопросам a-j вопроса II введите об-
веденные номера
Не очень знаком — 1
lib
27 IQ Степень знакомства с магазином 2
Очень знаком — 6
Пропущенные значения — 9
Степень знакомства с магазином 3
26 И Не
35 IP Степень знакомства с магазином 10 III
36 19 Частота: магазин 1 Ilia По вопросам a-j вопроса III введите об-
веденные номера
Частота: магазин 2 Illb Никогда— 1
20
'•'•:
Очень часто — 6
Пропущенные значения — 9
45 28 Частота: магазин '10 IHJ
46-47 Пробел Не заполняйте эти столбцы
Рейтинг магазина 1: качество
48 29 IVa Для вопросов IV-XI введите обведен-
ные номера
IVa
57 38 Рейтинг магазина 10: качество
39 IVb
58 Рейтинг магазина 1: разнообразие
67 43 IVb
Рейтинг магазина 10: разнообразие
49
68 IVc
Рейтинг магазина 1: цены
IVc
77 Рейтинг магазина 10: цены
78-80 Пробел He заполняйте эти столбцы

Рис. 14.2. Фрагмент кодировочной книги, содержащий информацию по первой записи Й/w проекта
"Выбор универмага "


Часть III. Сбор, подготовка и анализ данных
524
Столбцы 1—3 представляют собой одно поле, и в них указаны номера респондентов, за-
кодированные номерами от 001 до 271. Столбец 4 содержит номер записи. В нем проставлено
значение 1 для всех строк, поскольку в нашем примере отображается только первая запись по
всем респондентам. В столбцах 5 и 6 содержится код проекта, 31. В столбцах 7 и 8 указывает-
ся код интервьюера от 01 до 55, поскольку в данном опросе задействовано 55 интервьюеров.
Колонки 26—35, каждая из которых представляет определенное поле, содержат рейтинговую
оценку (от 1 до 6) степени ознакомления респондентов с 10 универмагами, вошедшими в ис-
следование. И наконец, столбец 77 отображает рейтинговую оценку цен универмага №10.
Обратите внимание, что столбцы 78 и 80 не заполнены. По каждому респондент)' представ-
лено 10 записей. Количество строк составляет 2710, что указывает на то, что в данном файле
содержится информация, полученная от 271 респондента.
Если анкета включает только структурированные вопросы или очень незначительное коли-
чество неструктурированных вопросов, она кодируется заранее. Это означает, что коды при-
сваиваются, прежде чем начинается непосредственная полевая работа. Если же в анкете содер-
жатся в основном неструктурированные вопросы, коды присваиваются уже после того, как за-
полненные анкеты возвращаются с места сбора данных (так называемое посткодирование) [3].
Предварительное кодирование кратко обсуждалось в главе 10, посвященной описанию струк-
туры анкет. Ниже вашему вниманию представлены дальнейшие основные рекомендации по
этой процедуре [4].

Кодирование вопросов
Код респондента и номер записи необходимо указывать для каждой записи данных. Сле-
дует также включать дополнительные коды для каждого респондента: код проекта, код ин-
тервьюера, код даты и времени, проверочный код. Настоятельно рекомендуется также ис-
пользовать фиксированные коды полей (fixed field code), в которых номер записей по каждому
респонденту одинаков, и в одних и тех же колонках по всем респондентам указываются одни
и те же данные.

Фиксированный код поля (fixed field code)
Код, в котором номер записей по каждому респонденту кодируется одним и тем же номе-
ром, в одних и тех же столбцах по всем респондентам указываются одни и те же данные.

Если это возможно, по всем пропущенным данным следует использовать стандартные ко-
ды, Так, переменную, указываемую в одном столбце, можно закодировать №9; для перемен-
ной, указываемой в двух столбцах, назначить код 99 и т.д. Следует помнить, что коды пропу-
щенных значений должны отличаться от кодов, присвоенных ответам, полученным надлежа-
щим способом в ходе опроса.
Кодирование структурированных вопросов — относительно простая процедура, поскольку в
этом случае варианты ответов определяются заранее. Исследователь присваивает каждому воз-
можному варианту ответа код и указывает соответствующую запись и столбец, в который эти
коды будут введены. Например:
1. Действителен ли на сегодня ваш паспорт?
Да 2. Нет (2/54)
Ответ "Да" на этот вопрос закодирован кодом 1, а ответ "Нет" — кодом 2. Числа в скобках
говорят о том, что данный присвоенный код указывается во второй записи по данному респон-
денту в столбце 54. Поскольку вопрос предусматривает только один ответ и на выбор предло-
жено всего два варианта (1 или 2), одного столбца достаточно. Как правило, одного столбца бы-
вает достаточно для кодирования любого структурированного вопроса, предполагающего один
вариант ответа, если на выбор предлагается меньше девяти вариантов ответов.
Если же существует большое количество вариантов ответов, для каждого возможного
варианта следует выделить отдельный столбец. К таким вопросам относятся, например,



Глава 14. Подготовка данных к анализу 525
вопросы об использовании торговой марки, о читательских и зрительских предпочтениях
респондентов и т.д. Например:
Вопрос: Какие счета вы имеете в данном банке?(Пометить крестиком все варианты ответа)
Запись №9
Обычный сберегательный счет D (62)
Обычный текущий счет D (63)
Ипотечный (64)
Счет НАУ П (65)
Клубный счет (рождественский и т.д.) D (66)
Кредитная линия П (67)
Срочный сберегательный счет (срочные депозиты и т.д.) (68)
Страхование жизни в сберегательном банке П (69)
Заем на усовершенствование жилища D (70)
Заем на приобретение автомобиля (71)
Другие услуги (72)
Для примера представим, что респондент помечает обычный сберегательный, текущий и
срочный сберегательный счета. Таким образом, в записи №9 в столбцах 62, 63 и 68 введен код 1.
Во всех остальных столбцах (64, 65, 66, 67, 69, 70, 71 и 72) проставляется код 0.
Кодирование неструктурированных вопросов или вопросов, допускающих несколько ва-
риантов ответа, представляет более сложную задачу. Сначала ответы респондентов дословно
записываются в анкету. Затем для них разрабатываются коды, которые и присваиваются
конкретным ответам. Иногда, основываясь на предыдущих проектах или на теоретических
предпосылках, маркетолог может разработать коды еще до начала работы по сбору данных.
Однако обычно к этой процедуре приступают только тогда, когда получены заполненные
анкеты. После этого исследователь составляет список, включающий 50-100 наиболее частых
вариантов ответов на неструктурированные вопросы, и определяет категории, подлежащие
кодированию. После того как коды разработаны, необходимо подготовить кодировщика, ко-
торый будет присваивать записанным в словарной форме ответам соответствующие коды.
Обычно при кодировании неструктурированных вопросов и анкет вообще рекомендуется
выполнять следующие правила [5].
Коды категорий должны быть взаимоисключающими и взаимоисчерпываюшими. Катего-
рии считаются взаимоисключающими, если каждому ответу присваивается только один код.
Категории не должны перекрывать одна другую. Категории считаются взаимоисчерпывающи-
ми, если каждый ответ соответствует одному из кодов, присвоенных данной категории. Этого
можно достичь введением дополнительного кода категории, например "другое" или "ни один
из предложенных вариантов". Однако следует помнить, что в эту категорию должна войти
только незначительная часть ответов (не больше 10%). Подавляющая часть ответов должна от-
носиться к значимым категориям.
По наиболее важным вопросам коды категорий должны присваиваться даже в том случае,
если они не упоминались ни одним из респондентов. Иногда важно знать именно то, что ни-
кто из отвечающих не дал тот или иной вариант ответа. Представим, например, что руководство
одной крупной компании, выпускающей потребительские товары, решило выяснить, нравится
ли потребителям упаковка новой марки мыла. С этой целью при кодировании вариантов отве-
тов на вопрос "Что вам больше всего не нравится в этой марке мыла?" была включена отдель-
ная категория "упаковка". Данные кодируются для того, чтобы сохранить как можно больше
деталей ответов. Например, собрав данные о частоте перелетов, совершаемых бизнесменами с
использованием конкретных коммерческих авиалиний, необходимо закодировать ее подробно,
а не просто сгруппировать по двум кодам категорий — "летаю часто" и "летаю нечасто". Эти
данные по частоте перелетов позволят исследователю впоследствии разграничить категории
бизнесменов-путешественников несколькими разными способами. Если же категории опреде-
лены заранее, последующий анализ данных ограничится только этими категориями.

526 Часть III. Обор, подготовка и анализ данных
Кодировочная книга
Кодировочная книга (codebook) содержит инструкции по кодированию, а также необходи-
мую информацию о переменных, используемых в конкретном наборе данных.

Кодировочная книга (codebook)
Книга, содержащая инструкции по кодированию и необходимую информацию о перемен-
ных, используемых в конкретном наборе данных.

Кодировочная книга применяется как руководство для кодировщика и помогает исследова-
телю правильно определять и располагать переменные. Даже если анкета закодирована заранее,
следует подготовить формальную кодировочную книгу. Кодировочная книга обычно включает
следующую информацию: номер столбца, номер записи, номер переменной, название пере-
менной, номер ответа, инструкции по кодированию. На рис. 14.2 изображен фрагмент из ко-
дировочной книги, разработанной для проекта "Выбор универмага".

Кодирование анкет
На рис. 14.3 приведен пример кодирования анкеты. На нем изображена часть закодирован-
ной анкеты, которая использовалась в ходе реализации проекта "Выбор универмага".

И наконец, в этой части нашей анкеты мы просим вас дать определенную информацию о себе,
которая необходима нам для выполнения классификации
Часть D Запись№7
1. Ответы на вопросы данной анкеты предоставлены (29)
1. Мужчиной-главой семьи
2. Женщиной-главой семьи
3. Совместно мужчиной и женщиной
2. Семейное положение (30)
1. Замужем (женат)
2. Никогда не была замужем (женат)
3. Разведен(а)/Живетотдельно/Вдов(а)
3. Укажите общее количество членов семьи, живущих с вами в одном доме (31—32)
4. Укажите количество детей, живущих с вами
a) Младше 6 лет (33)
b) Старше 6 лет _ (34)
5. Укажите количество детей, живущих отдельно (35)
6. Обведите кружком общее количество лет учебы (если таковой имеется, ука-
жите эти же данные по своему супругу)
Средняя Незаконченное Законченное высшее
школа высшее образование образование
a) Вы 8 или меньше 9 10 13141516 17 18 19 2021 22 или (36-37)
1112 больше
b) Супруг (а) 8 или меньше 9 10 13141516 17 18 19 20 21 22 или (38-39)
11 12 больше
7. а) Укажите свой возраст (40—41)
Ь) Укажите возраст супруга (супруги) (42—43)
8. Если работаете, укажите род деятельности обоих супругов, пометив все необ-
ходимые категории
44 45
Мужчина Женщина
1. Профессионально-техническая
2. Менеджмент и управление _ ____

Глава 14. Подготовка данных к анализу 527
3. Торговый работник
4. Офисная или подобная работа
5. Рабочий/оператор
6. Работник на дому
7. Прочее (пожалуйста, назовите)
8. Данных нет
9. Принадлежит ли семье занимаемое ею жилье? (46)
1. При надлежит семье
2. Арендуется
10. Сколько лет ваша семья проживает в районе Атланты? (47-48)
__лет
11. Каков общий годовой доход вашей семьи до уплаты налогов. Пометьте нуж- (49-50)
ный вариант.
01. Меньше 10000 долл. _ 08. От 40000 до 44999 __
02. От 10000 до 14999 _ 09. От 45000 до 49999 _
03. От 15000 до 19999 _ 10. От 50000 до 54999 _
04. От 20000 до 24999 _ 11. От 55000 до 59999 _
05. От 25000 до 29999 _ 12. От 60000 до 69999 _
06. От 30000 до 34999 13. От 70000 до 89999 _
07. От 35000 до 39999 14. 90000 и больше
Примечание. В столбцах 1-3 данной записи содержатся идентификационные сведения о респонденте,
в столбце 4 — номер записи (7), столбцы 5 и б пустые. Столбцы с 7 по 27 включают информацию из части
С данной анкеты, столбец 28 пустой. Таким образом, информация по части D анкеты кодируется, начи-
ная с колонки 29.
Рис. J4.3. Пример кодирования анкеты: кодирование демографических данных

Данную анкету закодировали заранее. Код респондента и номер записи указан по каждой
записи. Первая запись содержит дополнительные коды: код проекта, код интервьюера, коды
даты и времени и проверочный код. Полезный совет: рекомендуется разграничивать отдельные
части анкеты пробелами. Иногда вместо вписывания кодов в анкету они заносятся в специаль-
ный документ, содержащий 80 столбцов и известный как "кодировочная таблица".


ПРЕОБРАЗОВАНИЕ ДАННЫХ
Преобразование данных заключается в переносе закодированных данных из анкеты или
копировочных таблиц на диски или магнитные ленты либо во введении их непосредственно в
компьютер через клавиатуру. Если данные собраны с использованием автоматизированных
компьютерных систем, их преобразование не обязательно, поскольку они вводятся в компью-
тер в процессе их сбора. Данные можно вводить не только с клавиатуры, но и в процессе считы-
вания меток или маркеров с бланков, оптического сканирования или компьютеризированного
сенсорного анализа (рис. 14.4).
Для того чтобы воспользоваться методом считывания меток с бланков, ответы должны
записываться специальным карандашом в конкретные поля анкеты, закодированные для
данного ответа. Зафиксированные таким образом данные могут считываться машиной. Оп-
тическое сканирование заключается в прямом машинном считывании кодов с одновремен-
ным преобразованием данных. Известным примером оптического сканирования может слу-
жить преобразование штрих-кода при считывании его в кассах супермаркетов. Технический
прогресс привел к созданию систем компьютеризированного сенсорного анализа, благодаря
которым можно автоматизировать процесс сбора данных. Вопросы выводятся на специаль-
ной компьютеризированной панели, а ответы с помощью сенсорных устройств вводятся не-
посредственно в компьютер.



528 Часть III. Сбор, подготовка и анализ данных
Используя метод ввода ответов с клавиатуры, полностью избежать ошибок трудно, по-
этому необходимо проверять введенные массивы данных, по крайне мере частично. Для
проверки правильности введенных данных применяется проверочный компьютер и второй
оператор. Второй оператор повторно вводит данные из закодированных анкет, после чего
преобразованные данные, введенные двумя операторами, сравниваются по записям. Любое
расхождение между двумя комплектами преобразованных данных исследуется с тем, чтобы
выявить и исправить ошибки в результате ввода данных с клавиатуры. Если проверяются
результаты ввода всего набора данных, время и затраты на преобразование данных удваива-
ются. Учитывая дополнительные временные и денежные затраты, а также то, что опытные
операторы по вводу данных работают довольно точно и практически без ошибок, обычно
достаточно сверить 20—25% данных.




Бланш,
Автоматизированные Огттическое Компьютеризированный
заполненные методом,
ATI/CAP! - сканирование сенсорный анализ
позволяющим считывание
.- меток или маркеров с них-.



Проверка достоверности
данных: Исправление ошибок s
результате ввода с клавиатуры˜
ВНННВЯвВЯН^^^И



Диски




Преобразованные да


Рис. 14.4. Преобразование данных

Если используются автоматизированные системы CATI и CAPI, правильность ввода дан-
ных проверяется по мере их поступления. При вводе неприемлемого варианта ответа компью-
тер выдает респонденту или интервьюеру соответствующее предупреждение. Если же ответ
приемлем, интервьюер или респондент могут увидеть его на экране и проверить его правиль-
ность до передачи на дальнейшую обработку.
Выбор метода преобразования данных зависит от способа проведения интервью и наличия
необходимого оборудования. При использовании методов CAPI и CATI данные вводятся непо-
средственно в компьютер. Ввод данных с клавиатуры терминала с электронно-лучевой трубкой
(CRT) чаще всего применяется при опросе по телефону, при обходе домов, при опросах в уни-
вермагах и по почте. Поскольку при опросах на дому все чаше применяются специальные кла-
виатуры и портативные компьютеры, в последнее время интенсивно используются системы
для компьютеризированного сенсорного анализа. Оптическое сканирование широко применя-
ется при проведении струкурированных и периодически повторяющихся опросов, а метод
считывания меток или маркеров с бланков — при специальных наблюдениях [6].



Глава 14. Подготовка данных к анализу 529
ОЧИЩЕНИЕ ДАННЫХ
Процедура очищения данных (data cleaning) заключается в проверке состоятельности соб-
ранных данных и работе с пропущенными ответами.

Очищение данных (data cleaning)
Тщательная и всесторонняя проверка состоятельности собранных данных и работа с пропу-
щенными ответами.

Предварительная проверка состоятельности собранных данных проводится на этапе редак-
тирования, но проверка, которая проводится на стадии очищения данных, намного точнее и
тщательнее, поскольку выполняется с использованием компьютерной техники.

Проверка состоятельности данных
Проверка состоятельности данных (consistency checks) позволяет выявить данные, выходя-
щие за пределы определенного диапазона, и логически непоследовательные ответы либо опре-
делить экстремальные значения.

Проверка состоятельности данных (consistency checks)
Часть процесса очищения собранных данных, когда исследователь выявляет данные, выхо-
дящие за пределы конкретного диапазона, и логически непоследовательные ответы либо
определяет экстремальные значения. Данные со значениями, не указанными в кодировоч-
ной схеме, не принимаются.

Значения, выпадающие из конкретного диапазона, нельзя использовать в анализе, и их
необходимо исправить. Представим, например, что респондентов попросили выразить сте-
пень их согласия по ряду вопросов относительно стиля жизни по шкале от 1 до 5. Код 9 ис-
пользуется для обозначения пропущенных ответов, а значения 0, 6, 7 и 8 выходят за пределы
назначенного диапазона. Существует множество компьютерных пакетов, например APSS,
SAS, BMDP, Minitab и Excel, с помощью которых можно написать программы выявления по
каждой переменной значений, выходящих за пределы определенного диапазона, а также
распечатать код респондента, код переменной, название переменной, номер записи и столб-
ца и выпадающее из необходимого диапазона значение [7]. Все это значительно упрощает
процедуру систематической проверки каждой переменной по каждому ее значению, выхо-
дящему из определенного диапазона. Правильные ответы можно определить, возвратившись
к отредактированному и закодированному варианту анкеты,
Различают несколько типов логической непоследовательности ответов. Так, респондент
может указать, что обычно при междугородних переговорах пользуется специальной карточ-
кой, но при этом отметить, что ни разу не звонил. Либо респондент указывает, что часто поль-
зуется каким-то товаром, и в то же время отмечает, что никогда его не приобретал. Чтобы вы-
явить такие ответы и провести соответствующую корректировку, всю необходимую информа-
цию (код респондента, код переменной, название переменной, номер записи и столбца и
выпадающее из необходимого диапазона значение) нужно распечатать,
И наконец, необходимо тщательно проанализировать экстремальные значения. Следует
помнить, что экстремальные значения — не всегда результат ошибок, нередко они указыва-
ют на то, что существуют определенные проблемы с качеством собранных данных. Напри-
мер, чрезмерно заниженная оценка какой-либо торговой марки может быть результатом то-
го, что респондент просто без разбора пометил 1 по всем ее характеристикам (по рейтинговой
шкале от 1 до 7).




530 Часть III. Сбор, подготовка и анализ данных
Работа с пропущенными ответами
Пропущенными ответами (missing responses) называют значения переменных, которые оста-
лись неизвестными исследователю либо потому, что ответы респондентов были неоднозначны,
либо неправильно или неразборчиво записаны.

Пропущенные ответы (missing responses)
Значения переменных, неизвестные по причине того, что респонденты не дали однозначных
ответов на предложенный вопрос.

Работа с пропущенными ответами связана с рядом проблем, особенно если доля таких отве-
тов превышает 10%. Существует несколько методов работы с пропущенными ответами [8].
Замена пропущенного значения нейтральным. По этому методу вместо пропущенных ответов
подставляются нейтральные значения, обычно среднее значение по данной переменной. При
этом среднее значение переменной остается неизменным, а другие статистические данные, на-
пример корреляция, искажаются незначительно. Хотя этот подход и имеет ряд преимуществ,
подстановка среднего значения (например, 4) вместо всех пропущенных ответов респондентов
весьма неоднозначна и сомнительна, если учесть, что если бы они все же ответили, то могли бы
выбрать значительно более высокий (например, 6 или 7) или более низкий (1 или 2) рейтинго-
вый показатель [9].
Замена пропущенного значения условным (вменение значений). Для определения условного
значения или вычисления подходящих ответов на пропущенные вопросы можно использовать
структуру ответов респондентов по другим вопросам. На основе имеющихся данных исследова-
тель пытается определить, какие ответы дал бы конкретный респондент, если бы он ответил на
все вопросы. Это можно сделать статистически, на основе собранных данных, определив взаи-
мосвязи между пропущенной переменной и другими переменными. Так, показатель частоты
использования товара можно связать с размером семей респондентов, предоставивших инфор-
мацию по этим показателям. Затем пропущенные данные по использованию товара можно вы-
числить, воспользовавшись показателем размера семьи респондента. Однако следует помнить,
что этот метод очень трудоемок и нередко серьезно искажает данные. Чтобы избежать этого,
для вычисления условных значений по пропущенным ответам разработаны сложные статисти-
ческие процедуры, о чем рассказывается в следующем примере.

ПРИМЕР. Вменение значений повышает целостность массива данных
Рассмотрим исследование, определяющее, насколько семьи желают учитывать рекомен-
дации служб, занимающихся аудитом расхода электроэнергии (зависимая переменная) с
учетом определенных финансовых факторов. В качестве независимых переменных исполь-
зовались пять финансовых факторов, которыми манипулировали на известных уровнях, их
значения благодаря удачно выбранному плану исследования были всегда известны. Однако
в анкетах некоторые значения зависимой переменной оказались пропущенными. Их заме-
нили условными (вмененными), вычисленными статистическим методом на основе соот-
ветствующих значений независимых переменных. Такая работа с отсутствующими значе-
ниями в огромной мере упростила последующий анализ и повысила достоверность его ре-
зультатов [10].

Исключение объекта целиком. При исключении объекта целиком (casewise deletion) все на-
блюдения или респонденты с пропущенными ответами исключаются из анализа.

Исключение объекта целиком (casewise deletion)
Метод работы с пропущенными ответами, при котором наблюдения или респонденты с
пропущенными ответами исключаются из анализа.




Глава 14. Подготовка данных к анализу 531
Поскольку нередки случаи, когда многие респонденты не отвечают на те или иные вопро-
сы, данный метод может вызвать значительное сокращение выборки. Следует помнить, что ис-
ключение большого количества данных нежелательно, поскольку процесс сбора данных дорог
и требует больших временных затрат. Кроме того, респонденты с пропущенными значениями
систематически отличаются от респондентов, ответивших на все вопросы. В таких случаях ис-
ключение по данному методу может значительно исказить результаты опроса.
Попарное исключение переменных. При попарном исключении (pairwise delition) вместо от-
браковывания всех случаев с любыми отсутствующими значениями исследователь во всех
своих вычислениях рассматривает только наблюдения или респондентов, по которым есть
полные ответы.

Попарное исключение (pairwise delition)
Метод работы с пропущенными значениями, в соответствии с которым наблюдения или
респонденты с пропущенными данными не отбраковываются автоматически; исследователь
во всех своих вычислениях учитывает только наблюдения или респондентов, по которым
есть полные ответы.

В результате разные вычисления в ходе анализа могут основываться на разных размерах вы-
борок. Такая процедура обычно применяется при следующих условиях: если размеры выборки
велики, если количество пропущенных ответов незначительно, если переменные не сильно
взаимосвязаны. Следует помнить, что и в этом случае данная процедура может привести к не-
достоверным и даже нелогичным результатам исследования.
Применение разных методов работы с пропущенными значениями нередко приводит к
разным итогам, особенно если пропуск ответов носит систематический характер, а переменные
тесно взаимосвязаны. Таким образом, исследователю необходимо свести к минимуму количе-
ство пропущенных ответов. Кроме того, прежде чем выбрать конкретный метод для работы с
пропущенными значениями, он должен тщательно проанализировать все последствия приме-
нения той или иной процедуры.


СТАТИСТИЧЕСКАЯ КОРРЕКТИРОВКА ДАННЫХ
Процедуры статистической корректировки данных включают взвешивание, переопределе-
ние переменной и преобразования шкалы. Все эти корректировки необязательны, но, приме-
няя их, можно значительно повысить качество анализа.

Взвешивание
При взвешивании (weighting) каждому наблюдению или респонденту в базе данных при-
сваивается весовой коэффициент, отображающий степень его значимости по сравнению с дру-
гими наблюдениями или респондентами.

Взвешивание (weighting)
Метод статистической корректировки данных, при котором каждому наблюдению или рес-
понденту в базе данных присваивается весовой коэффициент, отображающий степень его
значимости по сравнению с другими наблюдениями или респондентами.

Значение 1,0 применяется для обозначения наблюдения с отсутствием весового коэффици-
ента. Цель взвешивания заключается в том, чтобы увеличить либо уменьшить в выборке коли-
чество наблюдений с определенными характеристиками (в главе 12 обсуждалось использование
метода взвешивания для корректировки ситуаций с отказом отвечать на вопросы).
Взвешивание чаще всего применяется для того, чтобы выборочные данные максимально
точно представляли конкретные характеристики генеральной совокупности. Например, оно
может использоваться, чтобы повысить значимость наблюдений или респондентов, по кото-

532 Часть III. Сбор, подготовка и анализ данных
рым были собраны данные более высокого качества, чем по другим. Существует еще одно при-
менение взвешивания, которое заключается в корректировке выборки с тем, чтобы повысить
значимость ответов респондентов с определенными признаками. Если проводится опрос для
определения, какие изменения стоит вносить в существующую продукцию, исследователь мо-
жет принять решение присвоить больший весовой коэффициент ответам респондентов, кото-
рые пользуются данным товаром чаще других. Этого можно достичь присвоением весового ко-
эффициента 3,0 тем покупателям, которые покупают исследуемую продукцию чаще всех, ко-
эффициента 2,0 — тем, кто пользуется ею в средних пределах, и 1,0 •— тем, кто приобретает этот
товар редко либо не пользуется им никогда. Метод взвешивания следует применять с огромной
осторожностью, поскольку это разрушает саму природу самовзвешиваемости любого выбороч-
ного обследования. Если исследователь все же решил воспользоваться данным методом, он
должен тщательно задокументировать всю процедуру взвешивания и составить соответствую-
щую часть отчета по проекту [11]. Важность соблюдения данного принципа подтверждает при-
мер, описанный во врезке 14.1 "Практика маркетинговых исследований" [12].

Врезка 14.1. Практика маркетинговых исследований

Internet-исследование компании Nielsen Media Research: нужен ли весовой коэффициент
Совсем недавно компания Nielsen Media Research, долгое время занимающаяся маркетин-
говыми исследованиями, связанными с телевидением, стала объектом острой критики со
стороны ряда телевизионных сетей, не согласных с методами, используемыми компанией в
процессе опросов. Кроме того, в другой, новой и потенциально важной сфере этого бизнеса,
а именно, в проведении опросов с использованием Internet, Nielsen также столкнулась с тем,
что результаты се исследований нередко ставятся под сомнение. Вследствие огромного
влияния электронной торговли на мир бизнеса рекламодателям необходимо знать, какое
количество людей занимаются бизнесом с использованием Internet, чтобы определить, вы-
годно ли им размещать рекламу в этой сети.
Компания Nielsen провела исследование для CommerceNet, группе компаний, в которую
входят Sun Microsystems и American Express, цель которого — определить общее количество
пользователей Internet. Исследования показали, что доступ к Internet имеют 37 миллионов
людей старше 16 лет, и 24 миллиона пользовались им в последние три месяца. Известно, что
когда статистики подозревают, что собранные данные недостоверны, они пользуются мето-
дом взвешивания, который позволяет привести в соответствие выборку и генеральную сово-
купность. Взвешивание необходимо использовать с тем, чтобы избежать смещения в сторо-
ну одного демографического сегмента.
Данные, полученные компанией Nielsen, умножались на весовой коэффициент, выве-
денный на основе пола респондентов, а не на основе их образования, что могло бы привести
к тому, что генеральная совокупность сдвинулась бы в сторону взрослого населения, имею-
щего образование. Далее компания применила взвешивание с использованием весового ко-
эффициента по возрасту и доходу. По мнению многих специалистов, такой подход неправи-
лен, поскольку весовые коэффициенты должны использоваться одновременно, а не в про-
цессе отдельных расчетов. Исследователи компании Nielsen не согласны с тем, что их
выборка неверна, и считают, что не ошиблись в ходе проведения обследования. Однако, по-
скольку большинство третьих сторон не приняли методов работы этой компании, ей все еще
предстоит подтвердить достоверность результатов своих исследований.

ПРИМЕР. Получение весового коэффициента при анализе состава посетителей
сетей ресторанов быстрого обслуживания
В регионе Лос-Анджелес-Лонг-Бич был проведен почтовый опрос, цель которого — вы-
явить предпочтения той или иной сети ресторанов быстрого обслуживания. Полученный в
итоге состав выборки отличался по уровню образования респондентов от распределения это-
го признака в генеральной совокупности, составленного на основе данных, полученных в


Глава 14. Подготовка данных к анализу 533
результате недавно проведенной переписи населения. По этой причине выборку
"взвесили", чтобы сделать ее более репрезентативной с учетом уровня образования посети-
телей. Весовые коэффициенты определялись делением процента генеральной совокупности
на соответствующей процент выборки. Распределение образования по каждой выборке и ге-
неральной совокупности, а также использованные весовые коэффициенты, приведены в
следующей таблице.
Использование взвешивания для повышения репрезентативности данных
Уровень образования (в годах) Доля в выборке (%) Доля в генеральной совокупности <%) Вес
2,49 4,23 1,70
Начальное образование {от 0 до 7 лет)
щи
8 лет 2,19 1,74
Среднее образование
6,39
от 1 до 3 лет 8,65 1,35
4 года 29,24 1,15
25,39
Среднее специальное и высшее образование
22,33 29,42
от 1 до 3 лет 1,32
15,02 12,01
4 года 0,80
14,94 7,36 0,49
от 5 до 6 лет
12,18 6,90 0,57
7 лет и больше
100,00 100,00
1
Итого

Как мы видим, категории, недостаточно представленные в выборке, получили более вы-
сокие весовые коэффициенты, в то время как для категорий, представленных излишне пол-
но, назначены меньшие весовые коэффициенты. Таким образом, данные по респондентам,
имеющим 1—3-годичное среднее специальное образование, умножались на коэффициент
1,32, а данные по респондентам, которые учились в высших и средних учебных заведениях 7
лети больше, умножались на 0,57.


Переопределение переменной
Процедура переопределения переменной (variable respecification) заключается в преобразова-
нии данных для создания новых переменных либо изменения существующих.

Переопределение переменной (variable respecification)
Преобразование данных для создания новых переменных либо изменения существующих с
тем, чтобы они точнее соответствовали основным задачам исследования.

Цель переопределения состоит в создании переменных, максимально отвечающих основ-
ным задачам исследования. Предположим, что изначальной переменной был показатель ис-
пользования продукции по 10 категориям ответов. Их можно сократить до четырех категорий:
пользуюсь часто, средне, редко или никогда. Кроме того, исследователь может разработать ин-
декс информационного поиска (Index of Information Search— IIS), представляющий собой
сумму информации, которую клиенты стремятся получить от дилеров, менеджеров по продви-
жению товаров на рынке и из независимых источников. Можно воспользоваться коэффициен-
том соотношения переменных. Если, например, соизмеряется количество покупок в универма-
ге (А",) и количество покупок в кредит (Х2), доля покупок в кредит может стать новой перемен-
ной после вычисления соотношения двух исходных переменных (Х,/Х2). Другими способами
переопределения переменной являются извлечение квадратного корня и логарифмические
преобразования, которые часто применяются, чтобы точнее "подогнать" оцениваемую модель
к основным задачам исследования.


534 Часть III. Сбор, подготовка и анализ данных
К важнейшим процедурам переопределения переменной относится также использование
фиктивных переменных для переопределения категорий. Фиктивные переменные (dummy
variables) часто также называют двоичными, дихотомическими, инструментальными или качест-
венными. Это переменные, которые могут принимать только два значения, например, 0 или 1.
i
Фиктивные переменные (dummy variables)
Переменные, способные принимать только два значения, обычно 0 или 1.

Общее правило заключается в следующем: переопределить переменную категории для К-то
числа категорий можно К—1 фиктивными переменными. Почему их должно быть не К, а
именно К—1? Это объясняется тем, что только К—1 категорий независимы. С учетом данных
выборки информацию о f(-R категории можно получить на основе информации о других К— 1
категориях. Так, если рассматривается пол респондентов, переменная имеет две категории, и
при этом необходима только одна фиктивная переменная. Информацию о количестве или
проценте мужчин в выборке можно быстро получить на основе данных о количестве или про-
центе женщин в этой выборке. Концепция применения фиктивных переменных проиллюст-
рирована на следующем примере.

ПРИМЕР. Потребители замороженных продуктов : использование фиктивной
переменной
При исследовании потребления замороженных продуктов респонденты часто классифи-
цируются по таким категориям: "приобретаю часто", "средне", "редко" или "никогда". 1
Обычно этим категориям присваиваются значения 4, 3, 2 и 1 соответственно. Оказалось, что
такое кодирование не подходит для ряда методов статистического анализа. Как видно из ]
следующей таблицы, для проведения этих анализов уровень потребления данной продук- \
ции представлен тремя фиктивными переменными ЛТ,, Х2иХ3.
Код фиктивной переменной
,, Исходный код v v v
Категория использования продукции л. Л,
л.
переменной
Н е пользуюсь 1 1 0 0
Пользуюсь редко 0 1 0
Пользуюсь средне О О
Пользуюсь часто 4 0 0 0
Обратите внимание, что Х{ = 1 для категории людей, которые не потребляют заморожен-
ные продукты, и 0 — для всех остальных категорий. Подобным образом Х2 — 1 — для тех, кто
пользуется такой продукцией редко и 0 — для всех остальных категорий, а Хг = 1 для катего-
\ рии потребителей, пользующихся ею в среднем объеме, и 0 — для всех остальных. При ана-
] лизе фиктивные переменные А",, Х2 и А"3 используются для представления всех групп пользо-
вателей замороженной продукции и тех, кто ею не пользуется.


Преобразование шкалы измерения
Преобразование шкалы (scale transformation) заключается в манипулировании значениями
шкалы с тем, чтобы сравнивать ее с другими шкалами либо как-то иначе преобразовывать дан-
ные и делать их подходящими для анализа.

Преобразование шкалы (scale transformation)
Манипулирование значениями шкалы с тем, чтобы иметь возможность сравнивать ее с
другими шкалами либо каким-либо другим образом преобразовывать данные и делать их
подходящими для анализа.




Глава 14. Подготовка данных к анализу 535
Часто для измерения разных переменных используются разные шкалы. Так, переменные
для оценки имиджа товара измеряются с использованием семибалльной семантической
дифференциальной шкалы, переменные для оценки отношения — по интервальной рейтин-
говой шкале, а переменные для оценки образа жизни — по пятибалльной шкале Лайкерта.
Очевидно, бессмысленно сравнивать респондентов по показателям, зафиксированным с ис-
пользованием разных шкал. Чтобы сравнить баллы, оценивающие отношение, с баллами,
указанными респондентом относительно стиля жизни или имиджа, необходимо преобразо-
вать разные шкалы, Даже если для оценки всех переменных использовалась одна и та же
шкала, разные респонденты нередко пользуются ею по-разному. Некоторые респонденты
при ответах постоянно используют верхние градации рейтинговой шкалы, в то время как
другие — нижнюю ее часть. Различия подобного типа можно откорректировать соответст-
вующим преобразованием данных.

ПРИМЕР. Учреждения здравоохранения — преобразование данных, собранных
в процессе опроса пациентов
В ходе исследования, направленного на определение структуры распределения предпоч-
тений людей, пользующихся услугами учреждений здравоохранения, респондентов просили
оценить степень важности 18 факторов, влияющих на их мнение, по трехбалльной шкале
(очень важно, важно в определенной мере, неважно). Перед анализом все рейтинги, полу-
ченные от респондентов, были преобразованы. По каждому ответившему вывели средний
показатель ответов по всем 18 пунктам. Затем этот средний показатель вычли из каждого
элемента рейтинга, и к разнице прибавили определенную постоянную величину. Таким об-
разом, преобразованные данные А', получили в результате следующих действий:
X, = Х с — X + С
Вычитание среднего значения позволило откорректировать неравномерное использова-
ние респондентами шкалы для оценки важности. Постоянную величину С прибавили с тем,
чтобы все преобразованные данные имели положительные значения, поскольку отрица-
тельный рейтинг важности концептуально бессмыслен. Такое преобразование было жела-
тельным потому, что некоторые респонденты, особенно с невысоким доходом, оценили как
"очень важные" практически все характеристики учреждений здравоохранения. Другие рес-
понденты, особенно с высокими доходом, указали, что для них важные лишь некоторые
признаки. Таким образом, вычитание среднего значения позволило получить более точные
данные об относительной важности разных факторов [13].

В описанном выше примере результаты преобразования шкалы откорректированы только
по усредненным ответам. Существует, однако, и более общая процедура преобразования
шкал — известная как нормализация или нормирование (standardization).

Нормализация, нормирование (standardization)
Корректировка данных для приведения их к одной и той же шкале вычитанием выбороч-
ного среднего и деления полученного значения на стандартное отклонение.

Чтобы нормализовать шкалу X, мы сначала должны вычесть из каждого балла среднее зна-
чение X , а затем разделить полученное число на стандартное отклонение 5^. Таким образом,
нормализованная шкала имеет среднее значение, равное нулю, и стандартное отклонение, рав-
ное 1. По сути, это то же самое, что вычисление z (см. главу 12). Нормализация позволяет ис-
следователю сравнивать переменные, полученные с использованием разных типов шкал [14].
Математически нормализованные значенния z, можно вычислить с помощью следующего
уравнения:
Zj =(X,-X)/s x



536 Часть ill. Сбор, подготовка и анализ данных
ВЫБОР СТРАТЕГИИ АНАЛИЗА ДАННЫХ
Процесс выбора стратегии анализа данных представлен на рис. 14,5.

Предыдущие этапы (1,2 и 3)
процесса маркетинговых
исследований




Конкретные свойства
истических методов


Опыт >л методология
.исследователя

I
Стратегия анализа данных


Рис. 14.5. Выбор стратегии
анализа данных

Выбор стратегии анализа собранных данных основывается на итогах предыдущих этапов
процесса маркетинговых исследований, известных характеристиках информации, свойствах
конкретных статистических методов, а также на опыте и взглядах исследователя.
Необходимо помнить, что анализ данных — это вовсе не конечный этап исследования. Его
цель — получить информацию, которая поможет решить определенную проблему. Выбор стра-
тегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: опреде-
ление проблемы (этап 1), разработка подхода (этап 2) и разработка плана исследования (этап 3).
В качестве "трамплина" используется предварительный план анализа данных, разработанный
как один из элементов плана исследования. Затем, в ходе поступления на последующих стади-
ях процесса исследования дополнительной информации, может понадобиться ввести некото-
рые изменения.
Следующий этап заключается в анализе известных характеристик данных. Так, на выбор
статистического метода сильно влияет то, какие шкалы измерений используются в ходе иссле-
дования (см. главу 8). Кроме того, определено, какие именно методы анализа желательно ис-
пользовать при определенной структуре исследования. Дисперсионный анализ (глава 16) под-
ходит для работы с экспериментальными данными, полученными от проведения причинно-
следственного исследования. Кроме того, очень весомы при выборе стратегии анализа данных
результаты изучения собранных данных на этапе их подготовки к анализу.
Чрезвычайно важно также учитывать конкретные характеристики разных статистических
методов, особенно их основные цели и лежащие в основе предположения. Некоторые методы
лучше всего подходят для исследования различий между переменными, другие -— для оценки
величин соотношений между переменными, а третьи — для составления прогнозов. Кроме то-
го, поскольку все методы основаны на разных предположениях, некоторые из них намного
лучше других выдерживают нарушения этих предположений. Подробная классификация ста-
тистических методов представлена в следующем разделе.
И наконец, на выбор стратегии анализа данных влияет опыт и методология исследователя.
Опытный исследователь, специально подготовленный для проведения статистического ана-


Глава 14. Подготовка данных к анализу 537
лиза, пользуется широким диапазоном приемов, включая сложные статистические методы.
Исследователи отличаются друг от друга предположениями относительно переменных и соот-
ветствующих генеральных совокупностей. Как правило, для анализа данных в ходе реализации
того или иного проекта можно использовать сразу несколько разных методов. Для иллюстра-
ции воспользуемся нашим сквозным примером "Выбор универмага".

СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

Выбор стратегии анализа данных
В процессе анализа в ходе реализации данного проекта маркетологи создали модель выбора
универмага с точки зрения характеристик имиджа универмага. Выборка поделена на две
половины. Респонденты каждой половины разбиты на кластеры на основе того, какие ха-
рактеристики имиджа магазина они считают наиболее важными. Затем определены стати-
стические критерии по кластерам и выявлено четыре основных сегмента. Предпочтения по
отношению к универмагам смоделированы по их оценкам с использованием специальных
переменных для оценки имиджа. Данная модель отдельно оценена для каждого сегмента.
Проведены статистические тесты различий между функциями предпочтений в каждом сег-
менте и перекрестная проверка результатов выборки по каждому сегменту. Описанная выше
стратегия анализа данных наглядно отображена на следующем рисунке [16],


Выборка в целом


11
.Лодвыборка


Заявленная важность характеристик имиджа

I
Кластерный анализ




сдаваемое универмагу как функция переменной:
ишвл


.Оценка модели Оценка модели. Оценка мс

; .
Статистические кртерии для оценки различий между сегментами

1 * i i
Проверка Проверка Проверка Проверка
состоятельности
состоятельности состоятельности состоятельности
к перекрестная
и перекрестная и перекрестная и перекрестная
проверка
проверка проверка проверка
состоятельности состоятельности
состоятельности состоятельности
модели , модели . модели
ЫЭДвЛИ

<<

стр. 19
(всего 35)

СОДЕРЖАНИЕ

>>