1. Введение 4
2. Связанные работы 6
3. Обзор решения 8
4. Входные данные 9
5. Наш подход 12
5.0.1. Фильтрация по времени 12
5.0.2. Фильтрация на основе категорий 13
5.1. Обзор компонентов ранжирования 15
5.1.1. Коллаборативная фильтрация 15
5.1.2. Фильтрация по популярности 16
5.1.3. Фильтрация на основе содежимого (LDA) 17
5.1.4. Фильтрация на основе текущей сессии 18
5.2. Гибридная система 18
6. Оценка качества 19
6.1. Обзор 19
7. Итоги 21
Список литературы 22
Рекомендательная система является важной частью каждого приложения, в котором содержится большое количество контента и действий пользователей. Огромный объем информации приводит к тому, что пользователь не может найти релевантный для себя контент.
Рекомендательные системы используются для рекомендаций фильмов, музыки и книг (7) (9) (8). Рекомендательной системой называется любая система, которая выдает персонализированные рекомендации или направляет пользователя к интересным или полезным объектам в большом пространстве возможных вариантов. Такие системы имеют очевидное преимущество в среде, где объем информации значительно превосходит возможности человека ее исследовать.
Системы рекомендаций теперь являются неотъемлемой частью некоторых сайтов электронной коммерции, таких как Amazon.com и CDNow (12). Критерии «индивидуальности» и «интересности и полезности», отделяют рекомендательную систему от информационно-поисковых систем (1). Семантика поисковой системы - «соответствие»: система должна возвращать все те элементы, которые соответствуют запросу, ранжированные по степени релевантности. Такие методы, как обратная связь по релевантности, позволяют поисковой системе уточнить представление запроса пользователя и представляют собой простую форму рекомендации.
Сфера рекомендаций новостей имеет свою специфику: новости быстро стареют и это нужно учитывать.
Существует три основных типа рекомендаций: на основе памяти, на основе модели и гибридные (10). Методы на основе памяти (6) обычно используют метрики сходства для определения расстояния между двумя пользователями или двумя элементами. Методы, основанные на моделях, используют демографическую, информационную или агрегированную информацию для создания модели, которая генерирует рекомендации. Гибридные методы (3) комбинируют различные типы рекомендателей для повышения качества рекомендаций.
Общие подходы, такие как коллаборативная фильтрация, имеют свои проблемы: холодный старт, масштабируемость и разреженность данных. Контентные подходы страдают от того факта, что мы должны каким-то образом представлять рекомендуемый элемент в пространстве признаков.
В этой статье описана гибридная рекомендательная система.
Для единообразия в ходе работы мы перечисляем некоторые термины с их значениями:
• Рейтинг: скалярное значение, отражающее степень релевантности
• явный (напрямую от пользователя, например, фильм с рейтингом пользователей)
• неявный (выводится из активности пользователя, например, пользователь перестал смотреть фильм через 5 минут)
• Прогноз: оценка рейтинга
• Рекомендация: выбранные ранжированные элементы для пользователя
• Содержимое: атрибуты, текст и т. д .; все о рекомендуемом предмете
Остальная часть диплома организована следующим образом:
• 2 описывает связанные работы
• 3 содержит обзор нашего подхода
• 4 описывает входные данные
• 5 объясняет наш подход
• 6 предоставляет тесты и эксперименты, подтверждающие результаты нашей системы
• 7 представляет выводы.
Система рекомендаций получила широкое распространение в разных сферах. Коллаборативная фильтрация фокусируется на рейтинге, игнорируя особенности самих элементов. Чтобы лучше оценивать предпочтения клиентов в отношении новостей, мы используем модель LDA для рассчёта предпочтения клиентов по новостным темам.
Чтобы прогнозировать рейтинг по новостям, мы принимаем во внимание схожесть клиентов и корреляцию между покупателями и новостями. Эксперимент показывает, что наш гибридный метод рекомендаций, основанный на характеристиках, лучше работает в нашем приложении для социальных сетей.
Мы предлагаем новый гибридный метод рекомендаций, основанный на функциях повышения качества выдачи.
Результаты показывают, что сочетание разных подходов приводит к увеличению вовлеченности пользователей. До внедрения рекомендательной системы пользователь тратил на вкладку новостей около 2 минут. Теперь, когда мы применили гибридную рекомендательную систему, пользователи проводят на вкладке новостей в среднем 5 минут.
[1] Belkin Nicholas, Croft W. Information Filtering and Information Retrieval: Two Sides of the Same Coin? // Commun. ACM. — 1992. — 12. —Vol. 35. — P. 29-38.
[2] Burke Robin. Hybrid Recommender Systems: Survey and Experiments // User Modeling and User-Adapted Interaction. — 2002. —11. —Vol. 12.
[3] Combining Content-Based and Collaborative Filters in an Online Newspaper / M. Claypool, Anuja Gokhale, Tim Miranda et al. // SIGIR 1999.- 1999.
[4] Covington Paul, Adams Jay, Sargin Emre. Deep Neural Networks for YouTube Recommendations // Proceedings of the 10th ACM Conference on Recommender Systems. — New York, NY, USA, 2016.
[5] Dacrema Maurizio Ferrari, Cremonesi Paolo, Jannach Dietmar. Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches // Proceedings of the 13th ACM Conference on Recommender Systems. — RecSys ’19. — New York, NY, USA : Association for Computing Machinery, 2019. — P. 101-109.
[6] Delgado Joaquin, Ishii Naohiro. Memory-Based Weighted-Majority Prediction for Recommender Systems.— 1999. — 01.
[7] Duan L., Street W. N., Xu E. Healthcare information systems: data mining methods in the creation of a clinical recommender system // Enterprise Information Systems.— 2011.— Vol. 5, no. 2.— P. 169-181. - https://doi.org/10.1080/17517575.2010.541287.
[8] He Xu, Min Fan, Zhu William. A Comparative Study of Discretization Approaches for Granular Association Rule Mining // Canadian Conference on Electrical and Computer Engineering.— 2012. — 12.— Vol. 37.
[9] Min Fan, Zhu William. Mining top-k granular association rules for recommendation // Proceedings of the 2013 Joint IFSA World Congress and NAFIPS Annual Meeting, IFSA/NAFIPS 2013.— 2013.-05.
[10] Recommender systems survey / J. Bobadilla, F. Ortega, A. Hernando, A. Gutierrez // Knowledge-Based Systems. — 2013. — Vol. 46. — P. 109-132.— URL: https://www.sciencedirect.com/science/ article/pii/S0950705113001044.
[11] Rendle Steffen, Zhang Li, Koren Yehuda. On the Difficulty of Evaluating Baselines: A Study on Recommender Systems. — 2019.— 05.
[12] Schafer J. Ben, Konstan Joseph, Riedl John. Recommender Systems in E-Commerce // Proceedings of the 1st ACM Conference on Electronic Commerce.— EC ’99.— New York, NY, USA : Association for Computing Machinery, 1999.— P. 158-166.— URL: https://doi. org/10.1145/336992.337035.