ВВЕДЕНИЕ 3
ПОСТАНОВКА ЗАДАЧИ 7
Глава 1. Теоретические описание метода решения 14
1.1. Алгоритм решения задачи 18
Глава 2. Численные расчеты 20
2.1. Выделение признакового пространства 20
2.2. Предобработка данных 24
2.3. Выбор оптимального количества кластеров 28
2.4. Результаты кластерного анализа 32
2.5. Анализ результатов 35
Глава 3. Описание программы 45
3.1. Структурное описание кода расчета в R 46
3.1. Инструкция пользователю 47
ЗАКЛЮЧЕНИЕ 51
СПИСОК ЛИТЕРАТУРЫ 53
ПРИЛОЖЕНИЕ
Деятельность любого современного предприятия сопровождается накоплением огромных объемов данных, которые часто имеют разнородную структуру и не поддаются простой агрегации. В результате менеджерам трудно делать
значимые выводы на основе имеющейся информации, что неизбежно усложняет
процесс принятия управленческих решений. Для продуктивной работы с массивами данных требуются специальные средства интеллектуального анализа.
Процесс исследования больших объемов данных с целью обнаружения
скрытых закономерностей и тенденций основан на разных методиках распознавания образов, статистических и математических методах. Технология
DataMining позволяет выявить нетривиальные, не очевидные взаимосвязи в
больших объемах данных, которые трудно обнаружить другими способами. После применения методов DataMining можно утверждать, что с большой вероятностью, найденные с их помощью закономерности присущи и новым наборам данных аналогичной структуры.
Сферы применения DataMining имеют большую географию – она везде,
где имеются какие-либо данные.
DataMining представляет большую ценность для руководителей и аналитиков в их повседневной действительности. Деловые люди осознали, что с помощью методов DataMining они могут получить ощутимые преимущества в
конкурентной борьбе.
Предприятия розничной торговли сегодня собирают подробную информацию о каждой отдельной покупке, используя кредитные карточки с маркой
магазина и компьютеризованные системы контроля. Вот типичные задачи, которые можно решать с помощью DataMining в сфере розничной торговли:
Анализ потребительской корзины (выявление ассоциативных правил) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе. Знание покупательской корзины необходимо для улучшения
рекламы, выработки стратегии создания запасов товаров, способов их раскладки в торговых залах.
- Исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов.
- Создание прогнозирующих моделей дает возможность торговым
предприятиям узнавать характер потребностей различных категорий клиентов с
определенным поведением, например, покупающих товары известных дизайнеров или посещающих распродажи. Эти знания нужны для разработки точно
направленных, экономичных мероприятий по продвижению товаров.
Конечной целью любого бизнес-аналитика является упрощение процесса
принятия бизнес-решений на основе современных методов обработки данных с
целью увеличения прибыли и сведение к минимуму связанных с данным процессом рисков.
Сеть предприятий розничной торговли предназначена для продажи товаров населению. Основными задачами предприятий сети являются: удовлетворение спроса населения, как по ассортименту, так и по качеству товаров; организация соответствующего уровня обслуживания покупателей с предоставлением разнообразных услуг.
Успех в выполнении этих функций во многом зависит от расположения
магазинов розничной торговой сети, выбранного метода размещения как всей
сети в целом, так и каждого магазина в отдельности. Трудоемкий процесс выбора места торгового предприятия многократно окупается впоследствии, оказывая первейшее влияние на успех бизнеса. Поэтому не следует недооценивать
важность этой процедуры.
Роль торговой розничной сети в повышении социальной значимости торговли очевидна. Во-первых, рационально отстроенная сеть позволяет до минимума сократить затраты покупателей на поиск товара, тем самым выполняя основную социальную функцию торговли. Во-вторых, торговля, являясь крупнейшей отраслью экономики, и торговые розничные сети, как флагманы отрасли, приносят большие налоговые отчисления в бюджет, являются работодателями для миллионов россиян, в целом укрепляют экономику, создавая престиж
и инвестиционную привлекательность страны.
Для управления розничной сетью требуется опыт накопленный годами,
наблюдения и аналитические решения руководства и экспертов компании. Но
на сегодняшний день данных знаний недостаточно. При использовании знаний,
которые содержатся в гигабайтах информации, хранящихся в базах данных
компании, эффективность управления повышается в разы. Главной задачей
бизнес-аналитика становится задача извлечения знаний из имеющихся данных.
В помощь к этому приходят средства интеллектуального анализа данных и бизнес-аналитика (DataMiningandBusinessIntelligence).
Так же остро стоит вопрос управления сетью. При небольшом размере сети эту задачу можно решить весьма тривиально, пользуясь классической статистикой и моделированием. Но при определенном росте сети, данный вид управления становится невозможным, и требуется найти такие рычаги управления,
при которых этот процесс был бы менее затратным и более продуктивным.
Основной целью данной работы является выявление кластеров однородных магазинов обувной сети, построение модели управления каждым кластером и выявление скрытых закономерностей, которые будут учитываться при
открытиях новых магазинов.
Для разработки средства поддержки принятия решений для обувной сети
розничных магазинов был проведен анализ операционных показателей за 2 года
работы сети: архивные данные за 2015, 2016 год. Построено расширенное признаковое пространство на основе ежемесячных отчетов о деятельности каждого
магазина сети. При кластерном анализе из выборки были исключены магазины,
которые закрылись к концу 2016 года. Признаковое пространство было сокращено до 11 признаков после выявления линейных связей в признаках по экономической составляющей.
В результате кластерного анализа иерархическим и не иерархическим методом были получены устойчивые кластеры. Для каждого кластера построена
модель поведения по операционным показателям по статье доходов и расходов.
Переменной отклика является операционная прибыль магазина.
По операционным показателям 2015 года с целью тестирования метода,
для магазинов, которые не участвовали в анализе, был проведен прогноз принадлежности к какому либо кластеру. В результате два из трех прогнозируемых
магазинов принадлежат к кластеру в наименьшей средней операционной прибылью. Один магазин принадлежит к кластеру с средней операционной прибылью.
Для каждого выделенного кластера по операционным показателям за
2016 год была построена стратегия поведения в 2017 году.
Расчетные показатели магазинов за первый год работы по утвержденным
бизнес-планам были использованы при прогнозе принадлежности магазина к
одной из выделенных кластеров. По результатам кластерного анализа прогнозное поведение ОРТ №227 соответствует кластеру с средней операционной прибылью, ОРТ № 223 соответствует кластеру с низкой операционной прибылью.52
Все результаты, полученные в ходе исследования и написания магистерской диссертации, были представлены руководству компании, а так же отделу
по развитию розничной сети в качестве средства поддержки принятия решения.
1. Баканов, М.И., Теория экономического анализа / М.И. Баканов, М.В. Мельник, А.Д. Шеремет - М.: Финансы и статистика 2008. - 536с.
2. Близоруков, М. Г. Статистические методы анализа рынка: учебно- метод. пособие / М. Г. Близоруков - Екатеринбург: Ин-т управления и пред-принимательства Урал.гос. ун-та, 2008. - 75 с.
3. Гетьман, В.Г. Финансовый учет. / В.Г. Гетьман - М.: Финансовый и статистика, 2005. - 392 с
4. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов / В.Е. Гмурман - М.: Высшая школа, 2004. - 479с.
5. Енюков, И.С. Факторный, дискриминантный и кластерный анализ/ И.С. Енюков - М: Финансы и статистика, 1989. - 215 с.
6. Загребаев, А.М. Методы математического программирования в за¬дачах оптимизации сложных технических систем: учебное пособие / А.М. За¬гребаев, Н.А. Крицына, Ю.П. Кулябичев, Ю.Ю. Шумилов. - М.: МИФИ, 2007. - 332с.
7. Кабаков Роберт И., R в действии. Анализ и визуализация данных в программе R / пер. c англ. П. А. Волковой. - М.: ДМК Пресс, 2014. - 588 с.
8. Королев, М.А. Статистический словарь/ М.А. Королев/ М.: Финан¬сы и статистика, 1989. - 623 с.
9. Мандель, И.Д. Кластерный анализ / И.Д. Мандель - М.: Финансы и статистика, 1988. - 176с.
10. Миркин, Б. Г. Методы кластер-анализа для поддержки принятия решений/ Б. Г. Миркин - М.: Изд. дом Национального исследовательского уни¬верситета «Высшая школа экономики», 2011. - 88 с.
11. Поручиков, М. А. Анализ данных: учеб.пособие / М.А. Поручиков. - Самара: Изд-во Самарского университета, 2016. - 88 с.
12. Сокэл, Р.Р. Кластер-анализ и классификация: предпосылки и основ¬ные направления. В кн: Классификация и кластер /Под ред. Дж.ВэнРайзина - М.: Мир, 1980. - 158с.
13. Шипунов, А.Б. Наглядная статистика. Используем R!/ А.Б Шипу-нов, Е.М. Балдин, П.А. Волкова, А.И. Коробейников, С. А. Назарова, С.В. Пет¬ров, В.Г. Суфиянов - М.: ДМК Пресс, 2012. - 298 с.
14. Шипунов, А.Б. Основы теории систематики: Учебное пособие / А.Б. Шипунов - М.: Открытый лицей ВЗМШ, Диалог-МГУ, 1999. - 56 с.
15. Шитиков, В.К., Мастицкий С.Э. Классификация, регрессия и дру-гие алгоритмы DataMining с использованием R. 351 с. Электронная книга, адрес доступа: https://github.com/ranalytics/data-mining