Статьи

ANOVA/MANOVA - дисперсионный анализ

Прикладная цель дисперсионного анализа заключается в ответе на вопрос: оказывает ли факторы значимое влияние на зависимую величину или нет. При этом, однако, нужно иметь ввиду, что факторы должны быть представлены в номинальной или порядковой шкале.

Прикладная цель дисперсионного анализа заключается в ответе на вопрос: оказывает ли факторы значимое влияние на зависимую величину или нет. При этом, однако, нужно иметь ввиду, что факторы должны быть представлены в номинальной или порядковой шкале.

Например, мы хотим понять влияет ли фактор "ПОЛ" на размер сумму покупки клиента. В данном случае фактор "ПОЛ" представлен в номинальной шкале и может принимать только два конкретных значения (М/Ж).

Если посмотреть на проблему с другой стороны, то дисперсионный анализ предназначен для ответа на вопрос: значимо ли различаются средние в нескольких группах. В приведенном выше примере мы по сути выясняем существенно ли в статистическом смысле средняя сумма покупки мужчины отличается от средней суммы покупки женщины. Если существенно, то мы говорим - фактор "ПОЛ" оказывает влияние на размер покупки.

Покажем суть дисперсионного анализа на простейшем примере. Допустим, в Вашем магазине два продавца работают посменно. Вы сталкиваетесь с ситуацией, когда товар то пролеживает, то в магазине пустые полки. Попробуем разобраться в сути явления:
Возможно, что один продавец работает недобросовестно, а значит продажи, в среднем у него существенно ниже. Поэтому, завозя товар разным продавцам одинаковыми партиями, Вы упускаете потенциальных клиентов и Ваши деньги связаны в пролеживающем товаре. Формализуем эту ситуацию.

Пусть продажи ведут себя следующим образом

Продавец Продажи за день
Семенова 6
Чичикова 9
Семенова 5
Чичикова 10

Конечно данных должно быть побольше чем четыре наблюдения, но все же...

Дисперсия продаж в целом будет 5.66, а средний объем реализации - 7,5.

Но эта цифра не будет адекватно описывать ни одного из продавцов, поэтому разумно будет вести учет по каждому отдельно. Для первого средний объем составит 5,5 , а дисперсия- 0,5, для второго - 9,5 и 0,5 - соответственно. Итак, ведя дополнительный фактор - продавец, мы снизили общую дисперсию (теперь она равна 1,0) примерно в 6 раз и значительно улучшили качество прогноза продаж.

Более сложная картина в случае, когда у нас не 2 продавца в одном магазине, а 30 торговых точек в разных районах города, разных по площади, рекламе, внешнему виду, близости к магистралям…. И мы хотим понять какие факторы и как влияют на объемы продаж этих точек. Используя дисперсионный анализ вы сможете: во-первых, провести ранжирование факторов по степени влияния на объем продаж; во- вторых, оценить на сколько процентов увеличивается объем продаж при изменении того или иного фактора; в третьих, спрогнозировать объем продаж новой торговой точки.

Стоит отметить, что если факторы представлены в количественной шкале, то дисперсионный анализ все-таки можно провести. В этом случае мы имеем дело с ковариационным анализом.

Использование дисперсионного анализа трудно переоценить. Он присутствует и в регрессионном и дискриминантном и в кластерном анализе. По сути, почти все статистические техники так или иначе используют этот подход.

А если вы занимаетесь отладкой производственного процесса и поиском оптимальных технологических параметров, то дисперсионный анализ должен стать Вашей "рабочей лошадкой".

Остались вопросы?

Напишите нам и мы подробно ответим на все Ваши вопросы!