Введение 5
1 Применение технологий интеллектуального анализа данных для решения
задач розничной торговли 7
1.1 Обзор предметной области 7
1.2 Обзор существующих подходов в интеллектуальном анализе данных .. 9
2 Математическая модель аффинитивного анализа 13
2.1 Общие ассоциативные правила 13
2.2 Классификация существующих алгоритмов поиска ассоциативных правил 17
2.2.1 Алгоритм Apriori 18
2.2.2 Анализ Apriori-подобных алгоритмов (FP-Growth, Eclat) 22
2.3 Сравнительный анализ алгоритмов поиска частых наборов 26
3 Разработка программного обеспечения для реализации алгоритма 30
3.1 Выбор фреймворка для реализации интерфейса программы 30
3.2 Программная реализация 33
3.3 Тестирование программы 37
Заключение 41
Список используемой литературы и используемых источников 42
На сегодняшний день довольно большое количество информации, используемой в таких различных областях как как розничная торговля, банковский сектор, медицина и так далее, хранится в больших базах данных, но не используется полноценно. Именно поэтому процесс извлечения полезной информации является очень важным.
Особенно актуально это для анализа рыночной корзины, известного также как поиск ассоциативных правил или аффинитивный анализ. Он помогает маркетологу понять поведение покупателей, например, какие продукты покупаются вместе. Существуют различные методы и алгоритмы, позволяющие провести этот анализ.
Исходя из практики анализа рыночной корзины, наиболее эффективными средствами анализа данных являются методы и алгоритмы интеллектуального анализа данных.
Актуальность данной работы состоит в создании удобного и понятного инструмента для анализа большого объема данных в ретейле, который поможет улучшить тактику развития покупательского опыта в рознице.
Таким образом, цель исследования - разработка системы оптимизации расположения товаров на основе интеллектуального анализа данных о покупках для улучшения покупательского опыта.
Поставленная цель решается путем решения следующих задач:
- исследование существующих методов анализа покупательской корзины;
- изучение математической модели аффинитивного анализа данных;
- программная реализация системы оптимизации расположения товаров на основе интеллектуального анализа данных.
В первой главе рассматриваются анализ предметной области, основные подходы в проведении интеллектуального анализа данных, а также структура анализа рыночной корзины.
Во второй главе будут подробно рассмотрены общие принципы аффинитивного анализа, основанные на нем алгоритмы, а также проведена их сравнительная характеристика.
В третьей главе описывается программная реализация системы, выбор фреймворков и ее непосредственное тестирование.
В заключении подводятся итоговые результаты исследования, проделанной работы и их соответствие поставленным задачам.
В первом разделе был проведен полный анализ существующих подходов в современном мерчандайзинге и в интеллектуальном анализе больших объемов данных, а также было рассмотрено и классифицировано такое важное понятие как Data Mining. На основе проведенного анализа был сделан вывод, что при разработке системы оптимизации расположения товаров следует опираться на теорию анализа рыночной корзины покупателя, сформулированную Р. Агравалом.
Во втором разделе теоретически была рассмотрена модель аффинитивного анализа данных и ее основные метрики, также был приведен наглядный пример области их использования и расчета.
Были описаны основные алгоритмы, основанные на поиске ассоциативных правил, такие как Apriori, FP-Growth и Eclat, а именно схемы их работы и подробный анализ каждого из алгоритмов с выделением их преимуществ и недостатков. После на основе проведенных исследований и тестовых данных были составлены сравнительные таблицы, которые показали, что наилучшим решением в сфере анализа рыночной корзины, исходя из поставленной цели, является алгоритм Apriori.
В третьем разделе был осуществлен сравнительный анализ существующих фреймворков для разработки на языке Python, таких как Kivy и PyQt, для наилучшего опыта работы с программой. Далее подробно была рассмотрена программная реализация алгоритма Apriori и проведено последующее тестирование разработанной системы на основе тестового набора данных о транзакциях продуктового магазина.
Таким образом, в ходе выполнения выпускной квалификационной работы была разработана программа для оптимизации системы расположения товаров в торговой точке, на основе интеллектуального анализа данных о покупках, кроме того в полном объеме были выполнены все поставленные задачи.
1. Документация по Python [Электронный ресурс] / URL: https://www.python.org/doc/(дата обращения 10.03.22)
2. Макшанов А.В., Журавлев А.Е. Технологии интеллектуального анализа данных : учебное пособие; под ред. А. Воронова. : Лань, 2018. 212 с.
3. Нордфальт Й. Ритейл-маркетинг: Практики и исследования; под ред. А. Воронова. : Интеллектуальная Литература, 2015. 760 с.
4. Храмов, А. Г. Методы и алгоритмы интеллектуального анализа данных : учебное пособие : Самара : Самарский университет, 2019. 176 с.
5. Agarwal, J. Mining Frequent Quality Factors of Software System Using Apriori Algorithm / Jyoti Agarwal, Sanjay Kumar Dubey, Rajdev Tiwari // Proceedings of the International Conference on Data Engineering and Communication Technology (ICDECT 2016) // Springer Science+Business Media Singapore, 2017. pp. 481-490.
6. Al-Maolegi, M. An improved apriori algorithm for association rules / Mohammed Al-Maolegi, Bassam Arkok // International Journal on Natural Language Computing (IJNLC) vol. 3, 2014. pp. 138-148.
7. Apriori Algorithm for Association Rule Learning — How To Find
Clear Links Between Transactions [Электронный ресурс]. URL: https://towardsdatascience.com/apriori-algorithm-for-association-rule-learning- how-to-find-clear-links-between-transactions-bf7ebc22cf0a (дата обращения:
12.04.2022).
8. An Introduction on Market Basket Analysis [Электронный ресурс].
URL: https://towardsdatascience.com/a-gentle-introduction-on-market-basket-
analysis-association-rules-fa4b986a40ce (дата обращения: 12.04.2022).
9. Association rule learning. [Электронный ресурс] URL: https://en.wikipedia.org/wiki/Association_rule_learning#cite_note-apriori-8(дата обращения: 30.03.2022).
10. Association Rule Mining using ECLAT Algorithm [Электронный ресурс]. URL: https://medium.com/machine-leaming-and-artificial-intelligence/3- 4-association-rule-mining-using-eclat-algorithm-b6e50aab2147(дата обращения: 12.04.2022).
11. Chowdhary, S. A Comprehensive Analysis of Proprietary and Open Source Data Mining Tools / Sonia Rani Chowdhary, Mr Vikash // International Journal of Scientific Research in Computer Science, Engineering and Information Technology, 10.32628/CSEIT206210, 2020. pp. 111-119.
12. Dahbi, A. Using Multiple Minimum Support to Auto-adjust the Threshold of Support in Apriori Algorithm : Azzeddine Dahbi, Youssef Balouki, Taoufiq Gadi // Proceedings of the Ninth International Conference on Soft Computing and Pattern Recognition (SoCPaR 2017) // Springer International Publishing AG 2018. pp. 120-126.
13. Framework [Definition] Types of Frameworks [Электронный ресурс]. URL: https://hackr.io/blog/what-is-frameworks(дата обращения: 5.05.2022).
14. Gar, K. Comparing the Performance of Frequent Pattern Mining Algorithms / Dr. Kanwal Gar, Deepak Kumar // International Journal of Computer Applications vol. 69, 2013. pp. 654-661.
15. Heaton, J. Comparing Dataset Characteristics that Favor the Apriori, Eclat or FP-Growth Frequent Itemset Mining Algorithms // arXiv:1701.09042v1 [cs.DB], 2017. pp. 277-285.
16. Jiawei, H. Data Mining: Concepts and Techniques: The Morgan Kaufmann Series in Data Management Systems 3rd Edition : Morgan Kaufmann, 2011. 744 p.
17. Kaur, M. ECLAT Algorithm for Frequent Itemsets Generation / Manjit Kaur , Urvashi Grag // International Journal of Computer Systems, vol. 1, 2014. pp. 218-220.
18. Kivy: Cross-platform Python Framework [Электронный ресурс]. URL: https://kivy.org/#home(дата обращения: 30.04.2022).
19. Manpreet Kaur, Shivani Kang. Market Basket Analysis: Identify the changing trends of market data using association rule mining // International Conference on Computational Modeling and Security, Springer International Publishing AG, 2017. pp. 138-148.
20. Qt for Python [Электронный ресурс]. URL:
https://doc.qt.io/qtforpython/(дата обращения: 30.04.2022).
21. Rao, A. Application of market-basket analysis on healthcare / Abishek B. Rao, Jammula Surya Kiran1, Poornalatha G // Int J Syst Assur Eng Manag. 2021. pp. 548-555.
22. Sterne, J. Artificial Intelligence for Marketing: Practical Applications : Wiley; 1st edition, 2017. 368 p.
23. Understanding Association Mining and Market Basket Analysis with
Apriori Algorithm using Python [Электронный ресурс]. URL: https://medium.com/analytics-vidhya/understanding-association-mining-and- market-basket-analysis-with-apriori-algorithm-using-python-e216c0d22f3e (дата
обращения: 13.04.2022).
24. Wicaksono, D. The Comparison of Apriori Algorithm with Preprocessing and FP-Growth Algorithm for Finding Frequent Data Pattern in Association Rule / Deo Wicaksono, Muhammad Jambak // Sriwijaya International Conference on Information Technology and Its Applications, vol. 172. pp. 28-35.
25. Zeng, Y. Research of Improved FP-Growth Algorithm in Association Rules Mining / Yi Zeng, Shiqun Yin, Jiangyue Liu, Miao Zhang // Hindawi Publishing Corporation Scientific Programming, vol. 2015. pp 10-15.