Тема: Разработка рекомендательной системы на основе извлечения и анализа интересов пользователей
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи
Обзор литературы
Глава 1. Обзор применяемых методо
1.1. Рекомендательные системы
1.2. Классификация текста
1.3. Семантическая близость слов
Глава 2. Практическая реализация системы.
2.1. Обучение классификаторов
2.2. Извлечение временных интересов ..
2.3. Определение семантической близости интересов
с помощью модели word2vec
2.4. Построение рекомендательной системы..
2.5. Программная реализация системы.
Глава 3. Оценка результатов
3.1. Оценка классификации
3.2. Примеры выделения временных интересов..................................35
3.3. Примеры результатов определения близости интересов.............38
3.4 Оценка работы всей системы.
Выводы
Заключение
Список литературы
Приложение
📖 Введение
способен просмотреть ее всю, чтобы выбрать только интересную ему.
Поэтому многие современные сервисы создают рекомендательные системы, которые на основе информации о профиле пользователя и его предыдущему поведению в системе пытаются определить, какие объекты, товары или услуги могут быть ему интересны. Объектами могут быть товары, книги, музыка, фильмы, новости и т. д. Яркими примерами могут служить такие сервисы или сайты, как «Юлмарт», «КиноПоиск», «Яндекс.Дзен» и многие другие. «Юлмарт» — российский онлайн-магазин по продаже непродовольственных товаров и цифрового контента. При просмотре на сайте компании информации о товаре он также отображает список дополнительно рекомендованных товаров на основе просмотров пользователя. Кинопоиск – российский сайт о фильмах, который предлагает пользователю фильмы на основе его предпочтений. «Яндекс.Дзен» – расширение для браузера от компании «Яндекс», ставшее популярным, ищущее в Интернете информацию, которая может быть интересна пользователю, и собирающее ее в персональную ленту.
Как видно из примеров, рекомендательные системы могут служить инструментом для увеличения продаж, продажи более разнообразных объектов, увеличения лояльности пользователей, а также улучшения понимания пользовательских потребностей и желаний. Поэтому они быстро набирают популярность и начинают широко применяться в электронной коммерции, при поиске фильмов, музыки, ПО, научных статей, а также на новостных сайтах и в справочных центрах, а задача разработки эффективных рекомендательных систем является актуальной.
Выделяют два основных метода построения рекомендательных систем
— метод фильтрации на основе содержания и метод коллаборативной фильтрации.
Методы фильтрации на основе содержания основаны на описании объекта и профиле предпочтений пользователя. Описанием объекта является конечное множество его дескрипторов, таких как ключевые слова, бинарные дескрипторы и т. д, а профиль предпочтений представляет собой взвешенный вектор дескрипторов объекта, в котором веса показывают важность каждого дескриптора для пользователя и его вклад в принятие конечного решения.
Этот подход пытается подобрать объекты, похожие на те, которые нравились пользователю ранее, и опирается на методы информационного поиска и машинного обучения. Популярными сервисами, использующими этот тип
рекомендательных систем, являются Rotten Tomatoes, Internet Movie Database и Pandora Radio.
Метод коллаборативной фильтрации базируется на информации об истории поведения пользователей в системе. Например, могут использоваться данные о покупках или оценках. В этом случае для пользователя находятся
похожие на него по истории пользователи, и рекомендация основывается их на отношении к объекту. На данном методе основаны рекомендательные системы таких сервисов, как Last.fm и Amazon.com.
✅ Заключение
Рассмотрены популярные методы машинного обучения для бинарной и мультиклассовой классификации: метод опорных векторов, байесовские методы, деревья принятия решений и метод ближайших соседей. Изучены главные подходы к задаче политематической классификации текстов: методы на основе сведения проблемы к задаче бинарной или мультиклассовой
классификации, такие как Label Powerset и цепной классификатор, и адаптивные методы как адаптивный метод ближайших соседей. Рассмотрены ключевые методы оценки эффективности политематических классификаторов. В результате проведенного исследования на наборе данных лучшим классификатором для задачи классификации текста на естественном русском языке оказался Label Powerset с деревьями принятия решений в качестве базисных классификаторов. Рассмотрены методы построения векторного представления слов на основе нейронных сетей и разработан алгоритм построения набора данных и определены параметры для эффективного обучения модели word2vec. Изучено поведение интересов во времени и предложен алгоритм распознавания циклических, направленных и постоянных интересов. Построена рекомендательная система, учитывающая эти свойства интересов на коллекции документов блог-платформы LiveJournal. Произведена оценка целесообразности использования общей статистики по интересам при составлении рекомендаций и показана статистическая значимость наблюдаемого улучшения работы системы



