АННОТАЦИЯ 2
ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ, ТЕРМИНОВ, СОКРАЩЕНИЙ 3
ВВЕДЕНИЕ 5
1 Основные понятия 6
1.1 Основы статистического анализа 6
1.2 Основные понятия теории корреляционного анализа 6
1.3 Проверка на нормальность критерием согласия Пирсона х2 11
1.4 Тест Левена на однородность дисперсий 12
1.5 Проверка статистической значимости 14
2 Технологии Data mining для выявления закономерностей в продажах ... 18
3 Исследование зависимостей в продажах сети магазинов 20
3.1 Исходные данные 20
3.2 Задачи и шаги анализа 20
3.4 Категоризация и подготовка данных для анализа 21
3.5 Проверка статистической значимости коэффициента корреляции 26
3.6 Проведение корреляционного анализа 28
3.7 Выявление самых продаваемых категорий товаров по магазинам 35
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 41
ПРИЛОЖЕНИЕ А Часть макроса для разбиения данных на категории 43
ПРИЛОЖЕНИЕ Б Подготовка данных к анализу 44
ПРИЛОЖЕНИЕ В Тест /2 на нормальность распределения 46
ПРИЛОЖЕНИЕ Г Тест Левена на однородность дисперсий 47
ПРИЛОЖЕНИЕ Д Проверка статистической значимости с помощью перестановочного теста ANOVA и теста Краскела-Уоллиса 48
ПРИЛОЖЕНИЕ Е Расчет корреляций и построение матриц корреляций 49
ПРИЛОЖЕНИЕ Ж Корреляционный анализ меньшей выборки 50
ПРИЛОЖЕНИЕ З Выявление самых продаваемых категорий 51
В современной экономике, где конкуренция между компаниями становится все более ожесточенной, эффективное управление продажами является ключевым фактором для достижения успеха и роста. В этом контексте, понимание тенденций и взаимосвязей между продажами различных видов товаров может быть существенным преимуществом для бизнеса.
Цель данного исследования заключается в проведении корреляционного анализа продаж в сети магазинов по категориям товаров, выявлении существующих связей и их степени на основе базы данных «Чеки».
Проведение корреляционного анализа позволит определить, какие товары наиболее взаимосвязаны друг с другом. Это позволит управляющим и маркетологам сети магазинов выявить успешные стратегии продаж и оптимизировать ассортимент и маркетинговые активности на основе полученных данных.
Задачи работы:
1. Подготовить данные к анализу
2. Определить коэффициент корреляции
3. Построить корреляционные матрицы
4. Проанализировать результаты и сделать выводы о корреляционной связи между категориями товаров
Для достижения поставленных целей в работе используются количественные и статистические методы анализа данных. Анализ проводится с использованием пакетов Python и MSExel со встроенным языком программирования Visual Basic for Applications.
В данной работе приведены результаты предварительной обработки и статистического анализа базы данных «Чеки» с использованием Data mining технологий. Были найдены основные характеристики базы данных и проведена проверка статистической значимости.
В ходе исследования были получены корреляционные связи (корреляционные матрицы и графики) между категориями товаров, найдены самые продающие магазины в представленной сети, определены самые популярные категории товаров.