Введение 4
Постановка Задачи 5
1. Обработка и хранение характеристик 6
1.1. Выбор треков 6
1.2. Выделение характеристик 7
1.2.1. Музыкалные теги 7
1.2.2. Аккорды 7
1.2.3. Остальные признаки 8
2. Выбор алгоритмов обучения рек. системы 9
2.1. Кластеризация 9
2.1.1. Walktrap 9
2.2. Персонализированный pagerank 11
3. Тестирование и эксперимент 12
3.1. Результаты анализа данных 12
3.2. Эксперименты и результат 12
Заключение 13
Список литературы 14
Пожалуй, каждый среднестатистический пользователь интернета встречался с рекомендательными системами. Данный подход используется в рекламе, интернет магазинах, различных интернет проектах, посвященных литературе, музыке и кинематографу. Рекомендательная система - это программа, которая пытается предсказать, какие объекты будут интересны пользователю.
Наиболее распостраненные подходы для создания рекомендательных систем:
- коллаборативная фильтрация использует данные о поведении пользователя в прошлом для создания рекомендаций. Помимо данных о конкретном пользователе, анализируются действия других пользователей со схожими характеристиками.
- фильтрация на основе содержания(контенте) использует данные об объектах для построения рекомендаций. Анализ фильтрации на основе содержания музыкальных композиций являлся темой моей преддипломной практики.
- в гибридных системах используются одновременно оба вида фильтрации, как правило, с помощью таких систем достигается более качественный подбор объектов.
В данной работе будет описан процесс создания гибридной рекомендательной системы музыкальных треков. В данном контексте под гибридностью подразумевается возможность добавления в систему признаков, полученных как и с помощью коллаборативной фильрации, так и с помощью фильтрации на основе содержания.
В данной работе была реализована рекомендательная система аудио треков, поддерживающая изменение, добавление и удаление признаков. В ходе работы были проанализированы различные характеристики. Основываясь на анализе, можно сделать вывод, что музыкальные теги - один из основных признаков, приемлемых для создания рекомендательной системы. Одним из возможных путей развития данной системы является добавление большего количества характеристик. [2]
[1] Edge-weighted personalized pagerank: Breaking a decade-old performance barrier / Wenlei Xie, David Bindel, Alan Demers, Johannes Gehrke // Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining / ACM. — 2015. — P. 1325-1334.
[2] Wikipedia. Music Genome Project — Wikipedia, The Free Encyclopedia.— 2017.— [Online; accessed 25-May-2017]. URL: https://en.wikipedia.org/w/index.php?title=Music_Genome_ Project&oldid=779229313.