Тема: Рекомендательные системы в контексте технологий больших данных
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи 6
Обзор литературы 7
Глава 1. Обзор предметной области 9
§1 Развитие рекомендательных систем 10
§2 Обзор существующих решений 12
§3 Классификация рекомендательных систем 14
3.1 Рекомендательные системы на основе коллаборативной фильтрации 14
3.2 Рекомендательные системы, основанные на контенте 16
3.3 Рекомендательные системы, основанные на знаниях 17
3.4 Гибридные рекомендательные системы 18
§4 Сравнение базовых подходов 20
Глава 2. Проектирование рекомендательной системы 24
§1 Обзор алгоритмов 24
1.1 User-based 24
1.2 Item-based 26
1.3 Similarity Fusion 27
1.4 Regression-Based 28
1.5 Slope One 28
1.6 ALS (Alternating Least Squares) 29
§2 Метрики точности 29
2.1 Точность предсказаний 29
2.2 Точность классификации 30
2.3 Точность ранжирования 31
Глава 3. Реализация рекомендательной системы 32
§1 Реализация системы 32
§2 Оценка качества 36
§3 Выводы 38
Заключение 40
Список литературы 41
📖 Введение
Рекомендательные системы (англ. recommender systems) - программы и сервисы, которые анализируют интересы пользователей и пытаются предсказать, что именно будет наиболее интересно для конкретного пользователя в данный момент времени. Такие системы показывают предпочтительность контента для конкретного юзера на основе данных, указанных пользователем явно или на основе его взаимодействия с системой. Рекомендательные системы должны обладать следующими свойствами: система должна адаптироваться под конкретного пользователя, так как предпочтения могут значительно отличаться у разных людей; система должна учитывать текущие предпочтения пользователя, подстраиваясь под него со временем; система должна постоянно находить новые области информации и предлагать их пользователю. Все это делает ресурсы, основанные на рекомендательных механизмах, привлекательными для пользователя. С другой стороны, подобные системы интересны и владельцам самих ресурсов, на которых размещаются рекомендательные системы, так как с помощью подобных инструментов повышается привлекательность самого ресурса и его контента.
Рекомендательные системы нашли свое применение во многих сферах жизнедеятельности человека: поиске фильмов и научных статей, розничной торговле, социальных сетях, электронной коммерция, онлайн-банкинге и т.д. Подобная задача применима и к сфере музыкальных рекомендаций. В наше время существует большое количество музыкальных сервисов, на которых размещается еще более внушительное число самих музыкальных композиций. Все это делает задачу ручного поиска и прослушивания музыкальных композиций долгой и ресурсоемкой. Поэтому данная задача приобретает все большую актуальность: зачастую пользователь музыкальных сервисов хочет, чтобы система сама предлагала привлекательные для пользователя композиции.
Работа имеет структуру, состоящую из вводного раздела, трех основных глав и заключительной части. В первой главе приведен предметный обзор области рекомендательных систем. Во второй главе освещена практическая часть работы, проведены исследования алгоритмов. Третья глава посвящена реализации рекомендательной системы, показаны результаты работы и оценки ее точности.
✅ Заключение
В качестве базового подхода к решению задачи был выбран метод, основанный на коллаборативной фильтрации и реализованы алгоритмы, основанные как на близости пользователей и объектов, так и на факторизации исходных данных. Лучший результат показал алгоритм ALS, этот факт можно объяснить большой разреженностью исходных данных.
Работа может быть продолжена путем улучшения базовых алгоритмов, экспериментов с построением других гибридных моделей, использования дополнительных метаданных для создания систем, основанных на знаниях и систем на основе контента.





