Тип работы:
Предмет:
Язык работы:


Исследование алгоритмов построения рекомендательных систем на основе анализа интересов пользователей

Работа №103635

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы79
Год сдачи2021
Стоимость4875 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
218
Не подходит работа?

Узнай цену на написание


Введение 4
Глава 1 Исследование рекомендательных систем 8
1.1 Актуальность рекомендательных систем в области малой электронной
коммерции 8
1.2 Обзор литературы, посвященной исследованию рекомендательных
систем для малых предприятий розничной торговли 10
1.3 Подходы к построению рекомендательных систем 12
1.4 Выбор оптимального подхода к построению рекомендательных систем
в рамках малой электронной коммерции 20
1.5 Постановка задачи прогнозирования пользовательского интереса 22
Глава 2 Описание принципа работы предлагаемой гибридной рекомендательной системы 24
2.1 Краткое описание принципа работы гибридной рекомендательной
системы в области малой электронной коммерции 24
2.2 Неперсонализированная рекомендательная система 25
2.3 Фильтрация на основе содержания 27
Глава 3 Практическая реализация гибридной рекомендательной системы.... 41
3.1 Стек технологий, использованный при реализации предлагаемой
рекомендательной системы 41
3.2 Классы «UserSupercalss» и «ProductSuperclass» 42
3.3 Поведенческий профиль пользователя 43
3.4 Анализатор содержания описаний 45
3.5 Анализатор содержания характеристик 47
3.6 Анализатор содержания изображений 47
3.7 Реализация меры подобия 49
3.8 Формирование пользовательских рекомендаций 50
3.9 Требования к пользовательской стороне рекомендательной системы .. 51
Глава 4 Тестирование разработанной рекомендательной системы 53
4.1 Тестирование качества прогнозирования интереса пользователя
рекомендательной системы 53
4.2 Тестирование возможности интеграции рекомендательной системы в
приложения малой электронной коммерции 58
4.3 Анализ результатов проведенных экспериментов 65
4.4 Развитие предлагаемой рекомендательной системы в дальнейшем 66
Заключение 68
Список используемой литературы 70
Приложение А Блок-схема алгоритма стемминга Портера 74
Приложение Б UML-диаграмма классов, описывающих действия пользователя с товарами в приложении 76
Приложение В UML диаграмма-классов, образующих поведенческий профиль пользователя 77
Приложение Г Блок-схема алгоритма преобразования пикселей изображения из RGB модели в HSB 78
Приложение Д Блок-схема алгоритма k-means 79

За последнее десятилетие электронная торговля в экономическом пространстве приобрела колоссальное значение. И действительно, согласно результатам исследования, проведенного центром исследований в области розничной торговли, в Европе доля оборота бизнеса, занимающегося электронной коммерцией, увеличилась с 9% (2004 год) до 16,7% (2016 год). Также наблюдается тенденция к увеличению доли электронной торговли в обороте и в США. В 2018 году процент продаж электронной коммерции, составил 42,5% от общего объема продаж, в то время как розничные продажи составили 6,4% [18]. На территории же Российской Федерации за 2018 год объем российского рынка онлайн-торговли вырос на 59% по сравнению с показателем предыдущего года и достиг 1,66 трлн руб., исходя из презентации исследования Ассоциации компаний Интернет-торговли (АКИТ) [3].
Из озвученных цифр можно сделать вывод, что во всём мире, несомненно, происходит увеличение доли оборота в сфере электронной торговли, поэтому в ситуации растущей конкуренции бизнесменам следует прилагать больше усилий в рассматриваемой области для привлечения новых клиентов и поддержания их удовлетворенности сервисом, что в свою очередь подразумевает необходимость в специальных инструментах [12].
Одним из таких инструментов, который был представлен в 1992 году, являются рекомендательные системы. Основная цель данного инструмента - это составление списка рекомендаций объектов, хранящихся в приложении, которые бы потенциально могли бы заинтересовать пользователя, исходя из его личных характеристик или журнала взаимодействия с объектами (оценивание/просмотр/добавление в корзину). Рекомендательные системы могут оказать существенное влияние на доход, путём грамотного продвижения товара и удовлетворения спроса пользователей.
Актуальность исследования заключается в том, что разработке рекомендательных систем для малой электронной коммерции уделяется крайне мало внимания, в результате чего традиционные рекомендательные решения довольно проблематично применять в озвученной предметной области по причине незначительного объёма имеющихся данных и отсутствия точной информации вернется ли пользователь в дальнейшем [11].
Целью магистерской диссертации является исследование алгоритмов построения рекомендательных систем в области малой электронной коммерции, направленных на формирование индивидуального списка товаров для пользователя. В данном случае под алгоритмом подразумевается ряд шагов, выполнение которых приведет к построению наиболее эффективной рекомендательной системы в рассматриваемой предметной области.
Рекомендательную систему планируется реализовать в виде библиотеки, которую можно будет интегрировать в веб-приложения, реализованные на фреймворке Spring.
Для достижения указанной цели были поставлены следующие исследовательские задачи:
- проанализировать существующие подходы к построению рекомендательных систем;
- провести анализ проблем, свойственных области малой электронной коммерции, и на их основе выбрать подходящий подход к построению рекомендательной системы;
- описать механизм работы рекомендательной системы, адаптированной под область малой электронной коммерции, посредством использования различных методов и алгоритмов;
- практически реализовать рекомендательную систему на основе описанного механизма работы;
- протестировать качество прогнозирования интереса пользователя и возможность интеграции разработанной рекомендательной системы в сторонние приложения.
Объектом исследования стал процесс прогнозирования интересов пользователя в малой электронной коммерции. Предметом исследования работы является разработка алгоритма для реализации рекомендательной системы, прогнозирующей интерес пользователя к товару в области малой электронной коммерции.
Главной гипотезой, положенной в основу магистерской диссертации, является то, что если осуществить реализацию рекомендательной системы, учитывающей проблемы, свойственные представителям малой электронной торговли, то её внедрение способно повысить эффективность маркетинга, тем самым поспособствовав увеличению объёма продаж товара и лояльности покупателей.
Методологической основой исследования являются работы отечественных и зарубежных специалистов, посвященные проблемам изучению и моделированию рекомендательных систем.
Научная новизна выполненных исследований заключается в разработке наиболее эффективного алгоритма построения рекомендательной системы в области малой электронной коммерции.
Теоретическая значимость работы состоит в уточнении и развитии теоретических основ разработки рекомендательных систем для построения персональных рекомендаций на основе личных предпочтений пользователей.
Практическая значимость определяется тем, что поскольку число рекомендательных алгоритмов для малых предприятий электронной розничной торговли невелико, то создание нового функционального алгоритма может предоставить прекрасную возможность для увеличения продаж малых предприятий электронной коммерции.
Публикации по теме исследования. Основные результаты теоретической части исследования изложены в статьях:
1. Калугин К. Ю. Выбор оптимального подхода к построению рекомендательной системы в сфере малой электронной коммерции. VI Международная научно-практическая конференция (школа-семинар) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук» - 2020 - С. 71-74.
2. Калугин К. Ю. Гибридная рекомендательная система в сфере малой электронной коммерции. VII Международная научно-практическая конференция (школа-семинар) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук» - 2021.
Положения, выносимые на защиту:
1. Результаты исследования области применения рекомендательных систем и принципов их построения.
2. Обоснование выбора подхода к построению рекомендательной системы в области малой электронной коммерции.
3. Описание принципа функционирования предложенной
рекомендательной системы.
4. Практическая реализация рекомендательной системы для малой электронной коммерции и результаты её тестирования.
В ходе работы над диссертацией было написано четыре главы.
Первая глава является теоретической и описывает назначение с характеристиками основных подходов к построению рекомендательных систем. А также обосновывает выбор подхода к построению рекомендательной системы для малой электронной коммерции.
Вторая глава также является теоретической и подробно описывает выбор методов и алгоритмов для реализации выбранного подхода к построению рекомендательный системы.
Третья глава носит практический характер. В этой главе описываются все основные этапы разработки рекомендательной системы.
В четвертой главе осуществляется тестирование качества прогнозирования интереса пользователя посредством нахождения похожих товаров на тот, что его заинтересовал ранее, а также её возможность интеграции в сторонние приложения.
Работа изложена на 75 страницах и включает 24 рисунка, 3 таблицы, 33 источника и 5 приложений.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В процессе выполнения диссертация была определена актуальность исследования, а также проанализировано назначение рекомендательных систем и подходы их построения.
Основной частью данной работы является исследование алгоритмов построения рекомендательных систем. В качестве предметной области была выбрана область малой электронной коммерции.
Исследованный алгоритм действий по созданию рекомендательной системы представляет собой следующий ряд шагов:
- определение наиболее оптимального подхода к построению рекомендательной системы в рамках рассматриваемой предметной области с помощью сравнительного анализа сильных и слабых сторон различных подходов;
- выбор и описание методов и алгоритмов для реализации выбранного ранее подхода;
- осуществление программной реализация предлагаемой
рекомендательной системы с использованием различных инструментов и программных средств;
- тестирование качества прогнозирования пользовательского интереса разработанной рекомендательной системой, а также испытание возможности её интеграции в сторонние приложения.
Реализация предложенного в данной работе способа решения поставленной задачи представляет собой гибридную рекомендательную систему с неперсонализированным подходом и фильтрацией на основе содержания. Фильтрация на основе содержания подбирает похожие товары на тот, что ранее заинтересовал пользователя, используя такие составляющие содержания, как описание, характеристики и преобладающие цвета на изображении товара. По умолчанию при формировании списка рекомендаций применяется только текстовая составляющая содержания товаров (описание и характеристики), однако, если ритейлер считает, что при создании рекомендаций необходимо учитывать цвета изображения товара, то он сможет активировать использование данной характеризующей информации вручную.
Для того, чтобы фильтрация на основе содержания вступила в работу необходимо, чтобы пользователь взаимодействовал хотя бы с одним с товаром. До тех пор же, пока поведенческий профиль пользователя пуст, за формирование списка пользовательских рекомендаций отвечают методы неперсонализированного подхода - метод статистических данных и метод продвижения товаров по признаку. По умолчанию используется реализация метода продвижения товаров по признаку, заключающаяся в продвижение наиболее популярных товаров среди пользователей.
В ходе работы предлагаемая рекомендательная система была практически реализована на объектном-ориентированном языке программирования Java с возможностью интеграции в Spring приложения. Доля правильных ответов и F-мера при тестировании качества прогнозирования интереса пользователя фильтрацией на основе содержания на тестовых данных составили 0,736 и 0,739, соответственно, что позволяет сделать выводы об эффективности способа решения поставленной задачи. При тестировании возможности интеграции рекомендательной системы в сторонние приложения и при её функциональном тестировании программных сбоев обнаружено не было.
Разработанную гибридную рекомендательную систему можно использовать для совершенствования продвижения товаров в онлайн магазинах малой электронной коммерции.
Исходный код был представлен в виде библиотеки и выложен в свободный доступ на GitHub для того, чтобы другие разработчики могли использовать его в своих программных продуктах.
В качестве перспективы развития можно назвать создание рекомендательной системы на основе описанной модели для приложений электронной коммерции, разработанных на платформе Android.



1. Байбардина, Т.Н. Торговая реклама непродовольственных товаров: учеб. пособие / Т.Н. Байбардина, О.А. Бурцева, Т.Л. Процко. - М.: Высшая. школа, 2016. - 207 с.
2. Гречачин, В.А. К вопросу о токенизации текста // Международный научно-исследовательский журнал. - 2016. - №6 (48). - С. 25-27.
3. За 2018 год российский рынок онлайн-торговли вырос на 59% [Электронный ресурс] // Ассоциации компаний Интернет-торговли - Режим доступа: ййр8://’№№№.акй.гн/аналитика-акит2018 (дата обращения: 12.02.2020).
4. Метод k-средних (K-means) [Электронный ресурс] // Loginom - Режим доступа: https://wiki.loginom.ru/articles/k-means.html(дата обращения: 14.02.2020).
5. О программировании, алгоритмах и не только [Электронный ресурс]
// Стоп-символы русского языка - Режим доступа:
http://www.algorithmist.ru/2010/12/stop-symbols-in-russian.html (дата
обращения: 18.02.2020).
6. Новый мир e-commerce в России: как изменился рынок в 2020 году и
что его ждет [Электронный ресурс] // Sostav - Режим доступа: https://www.sostav.ru/publication/cityads-45530.html (дата обращения:
24.05.2021).
7. Плавное введение в Natural Language Processing (NLP) [Электронный ресурс] // DataStart - Режим доступа: https://datastart.ru/blog/read/plavnoe- vvedenie-v-natural-language-processing-nlp(дата обращения: 09.04.2020).
8. Реализация алгоритма k-means (k-средних) на примере работы с пикселями [Электронный ресурс] // Хабр - Режим доступа: https://habr.com/ru/post/427761(дата обращения: 07.02.2020).
9. Рекомендательные системы: You can (not) advise [Электронный ресурс] // Хабр - Режим доступа: https://habr.com/ru/post/176549(дата обращения: 27.04.2020).
10. Стеммер Портера для русского языка [Электронный ресурс] // Medium - Режим доступа: https://medium.com/@eigenem/стеммер-портера-для- русского-языка-d41c38b2d340 (дата обращения: 18.05.2020).
11. Часть 1. Введение в подходы и алгоритмы [Электронный ресурс] //
IBD Developer - Режим доступа:
https://www.ibm.com/developerworks/ru/library/os-recommender1/index.html(дата обращения: 11.12.2019).
12. Часть 2. Механизмы с открытым исходным кодом [Электронный
ресурс] // IBD Developer - Режим доступа: URL:
https://www.ibm.com/developerworks/ru/library/os-recommender2/index.html(дата обращения: 25.03.2020).
13. Цвет и его модели [Электронный ресурс] // КомпьюАрт - Режим доступа: https://compuart.ru/article/23772(дата обращения: 27.02.2020).
14. Beginners Guide to learn about Content Based Recommender Engines Python [Электронный ресурс] // Analytics Vidhya - Режим доступа: https://www. analyticsvidhya. com/blog/2015/08/beginners-guide-learn-content- based-recommender-systems (дата обращения: 17.05.2020).
15. Goodreads Datasets [Электронный ресурс] // UCSD Book Graph - Режим доступа: https://sites.google.com/eng.ucsd.edu/ucsdbookgraph/home(дата обращения: 07.06.2021).
16. Image Based Product Recommendation System [Электронный ресурс]
// Roberto Reif - Режим доступа:
https://www.robertoreif.com/blog/2018/05/14/product-recommendations-using- image-similarity-yy76x(дата обращения: 12.03.2020).
17. Non-Personalised Recommender System in Python [Электронный ресурс] // Medium - Режим доступа: https://medium.com/@tomar.ankur287/non- personalised-recommender-system-in-python-42921 cd6f971 (дата обращения: 18.03.2020).
18. Online: UK, Europe & N. America [Электронный ресурс] // Centre for Retail Research - Режим доступа: https://www.retailresearch.org/online-retail.html(дата обращения: 14.02.2020).
19. Recommender systems [Электронный ресурс] // User Profile - Режим
доступа: http://recommender-systems.org/user-profile(дата обращения:
20.05.2020).
20. Stemming? Lemmatization? What? [Электронный ресурс] // Towards Data Science - Режим доступа: https://towardsdatascience.com/stemming- lemmatization-what-ba782b7c0bd8(дата обращения: 12.05.2020).
21. The list of stop words [Электронный ресурс] // CountWordsFree: Text Processing Tools - Режим доступа: https://countwordsfree.com/stopwords(дата обращения: 17.05.2021).
22. Using python and k-means to find the dominant colors in images [Электронный ресурс] // charlesleifer.com- Режим доступа: https://charlesleifer.com/blog/using-python-and-k-means-to-find-the-dominant- colors-in-images(дата обращения: 10.04.2020).
23. Chen, J. Product recommendation system for small online retailers using association rules mining / J. Chen, C. Miller, G. Dagher // In Proceedings of the International Conference on Innovative Design and Manufacturing. - 2014. - P. 71-77.
24. Falk K. Practical Recommender Systems, Manning Publications: 1st edition. - 2019. - 432 p.
25. Huang A. Similarity measures for text document clustering, In Proceedings of the Sixth New Zealand Computer Science Research Student Conference, 2008 - 49-56 pp.
26. Jawaheer, G. Modeling user preferences in recommender systems: a classification framework for explicit and implicit user feedback / G. Jawaheer, P. Weller, P. Kostkova // ACM Transactions on Interactive Intelligent Systems. - 2014. - Vol. 4. - №2. - P. 1-26.
21. Jones, K.S. A statistical interpretation of term specificity and its application in retrieval // Journal of Documentation. - 2004. - Vol. 60. - №5. - P. 493-502.
28. Kaminskas, M. Product recommendation for small-scale retailers / M. Kaminskas, D. Bridge, F. Foping, D. Roche // In International Conference on Electronic Commerce and Web Technologies. - 2015. - P. 11- 29.
29. Kaminskas, M. Product-Seeded and Basket-Seeded Recommendations for Small-Scale Retailers / M. Kaminskas, D. Bridge, F. Foping, D. Roche // Journal on Data Semantics. - 2016. - Vol. 6. - №1. P. 3-14.
30. Manning, C. D. An Introduction to Information Retrieval Draft / C. D. Manning, P. Raghavan, H. Schutze // Information Retrieval Journal. - 2010. - Vol. 13. - № 2. - P. 192-195.
31. Ming, L. Grocery shopping recommendations based on basket-sensitive random walk / L. Ming, B. M. Dias // In Proceedings of the 15th International Conference on Knowledge Discovery and Data mining. - 2009. - P. 1215-1224.
32. Pazzani, M. Learning and revising user proles: The identication of interesting web sites/ M. Pazzani, D. Billsus // Machine Learning. - 1991. - № 21, P. 313-331.
33. Porter, M.F. An algorithm for suffix stripping // Program: electronic library and information systems. - 1980. - Vol. 14. - № 3. - P. 130-131.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ