Содержание
Цель его заключается в анализе различий между ответами одних и тех же респондентов на одни и те же вопросы в несколько приемов, то есть в течение ряда дискретных временных промежутков. Это будет означать, что в результате будут построены отдельные графики по каждой категории переменной q1, где будут показаны двухуровневые взаимодействия переменных q2 и q3. В целом общая схема интерпретации графиков в дисперсионном анализе состоит из двух этапов. Сначала следует определить категории респондентов, отличающиеся и не отличающиеся друг от друга. При этом интерпретация графиков всегда происходит только по двум переменным (представленным по горизонтальной оси и в виде отдельных линий).
- Теперь щелкните на кнопке Add, чтобы подтвердить построение графика с заданными параметрами.
- Обратите внимание, что одновременно можно сформировать в правом списке Model сколько угодно различных моделей, подбирая только основные, необходимые вам взаимодействия факторов.
- Цель анализа различий — выявление групп респондентов, статистически значимо различающихся между собой.
- После того как SPSS завершит расчеты, связанные с дисперсионным анализом, в окне SPSS Viewer после таблиц появится заданный график.
- Однако в этом случае интерпретация данных графиков является практически неразрешимой задачей.
В нашем случае единственная независимая переменная Возраст имеет больше двух категорий , и поэтому специально выводить для нее средние значения нет смысла (они будут выведены в таблице Homogenous Subsets). Установить равенство/неравенство дисперсий позволяет тест Levene, вывод которого на экран мы покажем ниже. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать. Поэтому рекомендуется сразу вывести тесты для равных и неравных дисперсий, чтобы сократить количество итераций при проведении дисперсионного анализа.
2. Дисперсионный анализ
Однако визуального различия между категориями недостаточно для того, чтобы с уверенностью констатировать наличие статистически значимого различия. На установление статистической значимости различий между целевыми группами респондентов и направлены процедуры, объединенные под названием «Анализ различий». По оси ординат здесь (вертикальная ось) располагаются средние значения кратности покупок глазированных сырков каждой из рассматриваемых половозрастных групп. Так, мужчины младше 18 лет характеризуются существенно меньшей кратностью покупок сырков, чем женщины младше 18 лет.
Итак, вы задали все переменные для исследования и можете использовать кнопки, расположенные в нижней части этого диалогового окна, — так же, как вы делали это при одномерном дисперсионном анализе (см. раздел 3.2.1). В окне Post Hoc задайте апостериорные тесты Scheffe (для равных дисперсий) и Tumhale (для неравных дисперсий) для переменных, имеющих более двух категорий (в нашем случае это только q74 — Возраст). В окне Options выберите параметр Homogeneity Tests и в соответствующее поле поместите переменные с двумя категориями, для которых следует https://deveducation.com/ рассчитать средние значения (q80 — Пол и все взаимодействия, в которых она участвует). Остальные диалоговые окна аналогичны рассмотренным для одномерного дисперсионного анализа, поэтому мы не приводим их второй раз. В диалоговом окне Model можно задать и другие значения, но для большинства задач маркетинговых исследований достаточно оставлять все эти значения по умолчанию. То же самое касается и кнопки Contrasts (исследование взаимодействий между уровнями независимых переменных), а также кнопки Save, позволяющей сохранять некоторые значения.
Итак, в первой таблице, Paired Samples Statistics, вы видите рассчитанные средние значения для обеих тестируемых переменных. Так, в нашем случае респонденты оценили питание в авиакомпании Y в среднем на 0,4 балла выше, чем в авиакомпании Х. Если после этого вы щелкнете на кнопке OK, то получите только одну таблицу, из которой Мультивариантное тестирование можно узнать лишь о наличии/отсутствии значимых различий между возрастными группами. T-тесты для спаренных выборок применяются в случае, когда на различные вопросы отвечает одна и та же группа респондентов. После того как SPSS завершит расчет t-теста, в окне SPSS Viewer появятся две таблицы с результатами (рис. 3.8).
Для этого вновь откроем диалоговое окно Univariate (рис. 3.9) и добавим в область для фиксированных факторов (независимых переменных с фиксированными эффектами) переменную Пол. Иногда при анализе данных маркетинговых исследований достаточно сравнить только две группы респондентов, то есть установить различия между двумя категориями опрошенных. Однако часто у исследователей возникает необходимость проанализировать не две, а три или более категории респондентов. В этом случае следует прибегнуть к использованию дисперсионного анализа, который позволяет анализировать одновременно любое число групп.
1.1. Т-тесты для независимых выборок
В нашем случае это переменная q1_8, кодирующая категории респондентов, посещающих/не посещающих игровые залы марки Х. При проведении многофакторного дисперсионного анализа в диалоговом окне Post Hoc (рис. 3.10) следует добавить к списку исследуемых переменных все независимые факторы, кроме дихотомических. В нашем случае переменная Пол является дихотомической, так что добавлять ее в область Post Hoc Tests for (дополнительно к переменной Возраст) не следует. Таким образом, все параметры этого диалогового окна останутся неизменными по сравнению с предыдущим примером. Данный тест служит для тестирования гипотезы о равенстве дисперсий в тестируемых переменных.
При этом из столбца Mean Difference можно видеть, насколько отличается среднее значение той или иной группы от среднего значения других групп (звездочками отмечены значимые различия при 95%-ном доверительном уровне)1. Для одномерного дисперсионного анализа существует только одна зависимая переменная; для многомерного — несколько. Также в этом разделе мы рассмотрим одномерный дисперсионный анализ с повторными измерениями 1. Цель анализа различий — выявление групп респондентов, статистически значимо различающихся между собой.
Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные (и взаимодействия между ними), то есть выполнить двухфакторный одномерный дисперсионный анализ. Щелкните на кнопке Define, и откроется новое диалоговое окно Repeated Measures (рис. 3.25), похожее (как по внешнему виду, так и по своим функциям) на окно Univariate. В маркетинговых исследованиях этот тип статистического анализа находит весьма разнообразные применения. Он может применяться не только в процессе анализа баз данных по маркетинговым исследованиям, но и в процессе сбора анкет — для контроля работы интервьюеров. Например, если опрос производится каждый день в течение недели в одних и тех же местах, можно анализировать средние значения основных переменных, во-первых, по дням недели, а во-вторых, по каждому интервьюеру. Если будут выявлены существенные различия в анкетах интервьюеров, то высока вероятность фальсификации (тем интервьюером, анкеты которого наиболее сильно отличаются от остальных).
2.1. Одномерный дисперсионный анализ
Выше мы упомянули о специальном тесте, позволяющем установить равенство/неравенство дисперсий. На необходимость проведения данного теста (так же как и многих других) можно указать в диалоговом окне Options, вызываемом одноименной кнопкой в главном диалоговом окне Univariate (рис. 3.11). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Levene на равенство дисперсий (параметр Homogeneity tests). Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномерный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA). В первом случае есть только одна независимая переменная; во втором — несколько.
Несмотря на то что данные методы (особенно обобщенная линейная модель) достаточно сложны для изучения, их применение позволяет поднять аналитическую работу на существенно более высокий уровень. Для иллюстрации процесса построения графиков предположим, что по результатам трехфакторного дисперсионного анализа была установлена статистическая значимость взаимодействия между переменными q3 (Пол) и q4 (Возраст). В окне Profile Plots мы поместили переменную с наименьшим числом категорий q3 в поле Horizontal Axis, а переменную q4 — в поле Separate Lines.
Запустив программу на исполнение щелчком на кнопке OK, в окне SPSS Viewer вы увидите результаты дисперсионного анализа. В целом они аналогичны результатам, отображаемым при одномерном дисперсионном анализе, однако данные результаты значительно обширнее и содержат несколько дополнительных таблиц. Так как настоящее пособие посвящено сугубо практическим задачам использования SPSS в маркетинговых исследованиях, мы рассмотрим только ту часть результатов, которая необходима на практике. Наиболее простым для интерпретации случаем является ситуация, в которой по горизонтальной оси располагается дихотомическая переменная (например, переменная Пол).
После таблицы Tests of Between-Subjects Effects следуют расчеты средних значений для дихотомической переменной q3 (Пол) и для взаимодействия q3 ´ q4 (рис. 3.18). В нашем случае ни переменная q3, ни ее взаимодействие с q4 не являются статистически значимыми, поэтому данные таблицы бесполезны. Однако если бы переменная Пол была значима (то есть различие между мужчинами и женщинами существовало), на основании первой таблицы можно было бы сделать заключение о том, какая именно половая группа покупает больше сырков. Итак, в первой части таблицы мы видим сравнение различий между каждой из четырех возрастных категорий с остальными категориями. На основе этих данных и определяются та или те группы, которые значимо отличаются от других. (статистическая значимость) мы видим, что только группа респондентов старше 60 лет статистически значимо отличается от всех остальных.
2.3. Многомерный дисперсионный анализ
В такой ситуации все равно следует признать рассматриваемую переменную незначимой и в дальнейшем игнорировать связанные с нею апостериорные тесты. Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается кратность покупок в различных возрастных группах респондентов (1 — младше 18 лет; 2 — 19–35 лет; 3 — 36–60 лет; 4 — старше 60 лет). Поскольку в нашем примере тест Ливина является статистически незначимым, то определить значимость различия между двумя тестируемыми группами можно при помощи значения, находящегося на пересечении первой строки и столбца Sig. Значение 0,777 говорит о том, что различие в частоте посещения игровых залов респондентами, посещающими и не посещающими клубы марки Х, является статистически незначимым. В данном диалоговом окне в левом списке содержатся все выбранные для анализа независимые переменные. Чтобы определить пользовательскую модель, в левом списке Factors & Covariates выберите переменные, которые будут включены в итоговую пользовательскую модель.
Глава 3. Анализ различий
Если дихотомических переменных нет, следует выбрать переменную с наименьшим четным количеством категорий и перекодировать данные категории в дихотомию. Для горизонтальной оси следует выбирать именно данную (уже дихотомическую) переменную. Данный способ работает далеко не всегда, ведь часто различия между взаимодействиями факторов находятся именно в тех категориях, которые будут перекодированы (сокращены). 3.2 приведены основные характеристики переменных, участвующих в различных видах дисперсионного анализа.
Фиксированными факторами называют переменные, уровни которых охватывают все возможные состояния этой переменной. Например, пол может быть только мужской или женский, а возраст, например, младше 30 лет, от 30 до 60 лет и старше 60 лет. Случайные факторы представляют переменные, уровни которых охватывают лишь часть из всего многообразия возможных состояний. Так как в нашем случае переменная q4 (Возраст) содержит все возможные возрастные группы респондентов, мы поместили ее в область фиксированных факторов. В заключение настоящего раздела необходимо особо отметить, что графики взаимодействий могут эффективно применяться только при числе взаимодействий 2 (q1 ´ q2) или 3 (q1 ´ q2 ´ q3). При взаимодействиях первого уровня мы говорим уже не о взаимодействиях как таковых, а о главных эффектах , то есть о влиянии на зависимую переменную только каждого фактора в отдельности.
Данная таблица является центральной в выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследуемых переменных. Первое, на что следует обратить внимание при анализе описываемой таблицы, — это величина R2, отражающая долю совокупной дисперсии в зависимой переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на основании независимой переменной. Естественно, что чем меньше независимых переменных, тем меньше величина R2, и наоборот.