Тип работы:
Предмет:
Язык работы:


Анализ и разработка рекомендательной системы

Работа №129616

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы39
Год сдачи2017
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
97
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 6
Обзор литературы 8
Глава 1. Особенности известных рекомендательных систем 10
Глава 2. Методы построения рекомендаций 15
2.1. Метод k-ближайших соседей 15
2.2. Метод SVD 18
Глава 3. Практические результаты 22
Заключение 30
Выводы 31
Список литературы 32
Приложение

В настоящее время нас окружает огромное количество товаров и услуг, а также большие объемы информации, на обработку которой уходит много времени. Такое разнообразие объектов имеет свои плюсы и минусы: с одной стороны, каждый человек может выбрать наиболее подходящий ему объект; с другой стороны, выбрать становится сложнее. Какие же методы используют люди, чтобы все-таки выбрать новый объект среди такого множества?
Например, можно спросить совета у другого человека: друга, специалиста в этой области, консультанта, продавца. Но такой метод нельзя назвать быстрым и точным, ведь рекомендация основана на личном мнении другого человека. Если не задействовать других людей, как же облегчить себе задачу и прийти к нужному решению?
Можно добавить ограничения на поиск, т.е. указать конкретные характеристики, которыми должен обладать объект, тем самым сузив количество рассматриваемых объектов. Такой процесс, безусловно, сужает поиск, но число объектов все равно может остаться очень большим. Задавать «более грубые» значения характеристик (например, узкий диапазон стоимости объекта, точный год выпуска и др.) или определять больший перечень фиксированных свойств (например, размеры, материал и др.), тем самым максимально сужая поиск, не всегда является возможным. Во-первых, при поиске нового объекта человек сам не всегда четко понимает, что же он ищет; во-вторых, сужение поиска в принципе не всегда является нужным.
Так появляется необходимость в построении системы, которая будет выделять объекты не только по фиксированным свойствам, но и с использованием дополнительных данных. Поэтому создаются так называемые рекомендательные системы, которые используют различные принципы построения рекомендаций в зависимости от поставленной задачи.
Основу рекомендательных систем составляют программы, которые формируют рекомендации для пользователей исходя из определенной информации о возможной системе их предпочтений, а также исходя из информации об объектах. Такие системы используются, например, в процессе выбора нового фильма, музыки или книги. Рекомендательные системы полезны не только их непосредственным пользователям, но и владельцам объектов, среди которых пользователь производит выбор. Действительно, рекомендательные системы широко используются, например, в интернет-магазинах, где точность прогноза особенно важна. Чем точнее сформирована рекомендация, тем довольнее останется клиент, что может увеличить прибыль компании. Также рекомендательные системы помогают увеличить объем продаж: предлагают сопутствующие товары или товары из другой области, но которые могут заинтересовать данного пользователя исходя из его предпочтений.
Многие известные по всему миру сайты уже используют рекомендательные системы: Ozon, eBay, Amazon, Кинопоиск, IMDb, Pandora и др., но ни одна из систем не может гарантировать 100% точность сформированной рекомендации. Методы построения прогноза нуждаются в усовершенствовании, а для этого целесообразно провести сравнительный анализ различных типов существующих рекомендательных систем.
Таким образом, разработка рекомендательных систем является актуальной задачей в настоящее время, в связи с чем и была выбрана темой для данной работы. Анализ различных типов рекомендательных систем и методов построения рекомендаций также является важным предметом для исследования, так как выбор метода в конкретной задаче позволяет увеличить точность рекомендаций.
Данная работа связана с вопросами формирования рекомендательных систем для выбора фильмов. В работе рассматривается группа пользователей и набор фильмов, а также оценки фильмов этими пользователями. Учитывая оценки, которые конкретный пользователь поставил части фильмов, прогнозируется его оценка фильмам, которые он ранее не оценивал. Оценка формируется с использованием двух разных подходов: методом k- ближайших соседей с различными мерами сходства пользователей, а также методом приближения матрицы оценок с использованием сингулярного разложения матрицы с различным рангом приближенной матрицы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе проведенных в работе исследований получены следующие основные результаты, которые выносятся на защиту:
1) Показано, что метод приближения матрицы оценок ее сингулярным представлением уменьшенной размерности (метод SVD) не применим к рассматриваемой задаче, поскольку дает большую ошибку (более 20%).
2) Проведен анализ применимости метода ^-ближайших соседей: установлено, что он дает наилучший результат с коэффициентом k=20 среди рассмотренных вариантов.
3) Предложена модифицированная реализация метода k-ближайших соседей для экономии времени вычислений. Она выполнена с использованием модифицированной меры Эвклида с выделением базы действующих пользователей, среди которых производится отбор группы наиболее похожих вариантов.



[1] Т. Сегаран, Программируем коллективный разум, СПб.: Символ-Плюс, 2008.
[2] F. Ricci, L. Rokach, B. Shapira and P. B. Kantor, Recommender Systems Handbook, LLC: Springer Science+Business Media, 2011.
[3] Д. Е. Королева и М. В. Филиппов, «Анализ алгоритмов обучения коллаборативных рекомендательных систем,» Инженерный журнал: наука и инновации, № 6, 2013.
[4] К. В. Воронцов, «Лекции по метрическим алгоритмам классификации,» 2008.
[5] А. И. Жданов, «Введение в вычислительную линейную алгебру,» Самара, 2011.
[6] А. Б. Нугуманова, И. А. Бессмертный, П. Пецина и Е. М. Байбурин,
«Обогащение модели bag-of-words семантическими связями для
повышения качества классификации текстов предметной области,» Программные продукты и системы / Software & Systems, № 2, 2016.
[7] В. В. Стрижов, "Информационное моделирование". Конспект лекций..
[8] «Хабрахабр. Рекомендательные системы: You can (not) advise,» 23. 04. 2013. [В Интернете]. Available: https://habrahabr.ru/post/176549/. [Дата обращения: 21. 04. 2017].
[9] M. Howe, Pandora's Music Recommender.
[10] «Коллаборативная фильтрация,» [В Интернете]. Available: http://intellect.ml/kollaborativnaya-filtratsiya-4778/. [Дата обращения: 02.
04. 2017].
[11] «Хабрахабр. Коллаборативная фильтрация,» 28. 08. 2012. [В Интернете]. Available: https://habrahabr.ru/post/150399/. [Дата обращения: 25. 02. 2017].
[12] М. Кендалл и А. Стьюарт, Статистические выводы и связи, Москва: "Наука", 1973.
[13] А. Е. Умнов, Аналитическая геометрия и линейная алгебра, М.: МФТИ, 2011.
[14] «Grouplens,» [В Интернете]. Available: URL:https://grouplens.org/. [Дата обращения: 17. 02. 2016].


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ