Тип работы:
Предмет:
Язык работы:


МУЗЫКАЛЬНАЯ РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА

Работа №191828

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы85
Год сдачи2023
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
2
Не подходит работа?

Узнай цену на написание


Аннотация
ВВЕДЕНИЕ 5
1 Изучение предметной области 7
1.1 Обзор рекомендательных систем 7
1.1.1 Определение рекомендаций 7
1.1.2 Музыка отличается 7
1.1.3 Что такое хорошая рекомендация? 8
1.1.4 Извлечение информации о музыке: признаки и контекст 9
1.2 Типы рекомендательных систем 10
1.2.1 Коллаборативный подход 10
1.2.2 Подход, основанный на контенте 12
1.2.3 Подход, основанный на контексте 12
1.2.4 Гибридный подход 13
1.3 Модели машинного обучения для рекомендации на основе контента 13
1.3.1 Логистическая регрессия 14
1.3.2 Деревья решений 16
1.3.3 Случайный лес (Random Forest) 17
1.3.4 Бустинг: Adaboost 18
1.3.5 k-ближайших соседей 19
1.3.6 Метод опорных векторов 21
1.3.7 Наивный Байес 22
1.3.8 Нейронные сети 22
1.4 Признаки для контентной рекомендации 25
1.4.1 Низкоуровневые признаки 25
1.4.2 Признаки среднего уровня 34
1.4.3 Высокоуровневые признаки 35
1.5 Алгоритмы выбора признаков 36
1.5.1 Модель фильтрации 37
1.5.2 Модель обертки 38
2 Реализация рекомендательной системы 40
2.1 Выбранный подход 40
2.2 Наборы данных 40
2.2.1 Используемые наборы данных 41
2.2.2 Аугментация данных 44
2.3 Извлечение признаков 45
2.3.1 Предварительная обработка 45
2.3.2 Выбранные признаки 45
2.3.3 Модель-обертка для выбора признаков 46
2.4 Модели 46
2.4.1 Настройка гиперпараметров 46
2.5 Оценка 48
2.5.1 Оценка классификации с использованием меток 48
2.5.2 Оценка предсказаний с использованием матрицы путаниц 49
2.6 Алгоритм рекомендательной системы 50
3 Результаты 51
3.1 Предварительные результаты 51
3.1.1 Тесты на FMA 51
3.1.2 Тесты на GT ZAN 55
3.2 Создание набора данных 58
3.3 Настройка гиперпараметров 60
3.3.1 Оптимизация логистической регрессии 60
3.3.2 Оптимизация дерева решений и случайного леса 61
3.3.3 Оптимизация Adaboost 62
3.3.4 Оптимизация метода ближайших соседей (k-nearest-neighbours) 63
3.3.5 Оптимизация метода опорных векторов (Support Vector Machine) 63
3.3.6 Нейронная сеть прямого распространения 64
3.3.7 Общие результаты после настройки гиперпараметров 64
3.4 Выбор признаков 65
3.4.1 Самые важные признаки 70
3.5 Аугментация данных 71
3.6 Финальные примеры рекомендаций 72
ЗАКЛЮЧЕНИЕ 75
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 77

В 1979 году появилась первая система рекомендаций. Элейн Рич описала свою библиотечную систему Grundy [1]: она используется для рекомендации книг пользователям после небольшого интервью, в ходе которого пользователю сначала предлагается заполнить свое имя и фамилию, а затем, чтобы определить предпочтения пользователя и классифицировать их "стереотипами", Grundy просит пользователя описать себя несколькими ключевыми словами. После записи информации Grundy делает первое предложение, отображая краткое описание книги. Если предложение не нравится пользователю, Grundy задает вопросы, чтобы понять, в каком аспекте книги он ошибся, и предлагает новую. Однако ее использование ограничено, и Рич сталкивается с проблемами обобщения.
Системы рекомендаций, которые действительно начали развиваться в 1990-х годах, сильно продвинулись в последние годы, особенно с появлением машинного обучения и сетей. С одной стороны, все большее использование современной цифровой среды, характеризующейся избытком информации, позволило нам получить большие базы данных пользователей. С другой стороны, увеличение вычислительной мощности позволило обрабатывать эти данные, особенно благодаря машинному обучению, когда возможности человека перестали быть достаточными для исчерпывающего анализа такого объема информации.
В отличие от поисковых систем, которые получают запросы от пользователя с точными сведениями о том, что они ищут, система рекомендаций не получает прямого запроса от пользователя, а должна предложить новые возможности, изучая их предпочтения на основе их предыдущего поведения.
Торговые сайты, которые стремятся продать максимум товаров или услуг (путешествия, книги и т. д.) клиентам, должны быстро рекомендовать подходящие товары. Что касается сайтов, предлагающих потоковую передачу музыки и фильмов, их целью является удержание пользователей на своей платформе как можно дольше. Общим моментом является необходимость делать адекватные рекомендации. Последние достижения в этой области являются значительными, и такие рекомендации одинаково полезны как для компаний, максимизирующих свою прибыль, так и для клиентов, которые больше не ощущают перенасыщение количеством возможностей. Принятие решений становится проще, и хорошая рекомендация является значительным экономителем времени.
В 2006 году Netflix, который был онлайн-сервисом по аренде DVD, запустил челлендж Netflix с призовым фондом в 1 миллион долларов. Цель конкурса заключалась в создании алгоритма рекомендаций, способного превзойти существующий на 10% в тестах. Конкурс вызвал большой интерес как в научном сообществе, так и среди любителей кино. Приз был выигран спустя 3 года и подчеркнул несколько методов и направлений исследований для решения таких проблем.
Система рекомендаций будет определена в соответствии с определением Берка [2]: это система, способная предоставлять персонализированные рекомендации или направлять пользователя к интересным или полезным ресурсам (называемым элементами) в большом пространстве данных.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Подводя итог, в терминах количественных результатов, окончательная точность классификации по жанрам с использованием модели Support Vector Machine составляет 80% на тестовом наборе данных. Однако стоит отметить, что другие модели, в частности нейронная сеть и случайный лес, показывают многообещающие результаты. Это значение может быть достигнуто после оптимизации гиперпараметров модели, а также этапа выбора признаков. Эти два метода позволяют существенно повысить точность, ограничивая переобучение. Следует учитывать, что это значение является лишь показателем для части проекта, связанной с классификацией. Матрица путаницы (Рис. 25 в предыдущем разделе) ясно предоставляет нам больше информации о результатах. То, на что мы обращаем внимание в матрице путаницы, это диагональ темного цвета, характеризующая высокую степень восстановления исходного жанра, в то время как остальные случаи должны быть как можно более белыми. Окончательная матрица соответствует желаемому. Из матрицы следует, что некоторые жанры легче для нашей системы различить, чем другие. Действительно, классический жанр всегда определяется. В жанрах поп, металл, кантри и блюз система также довольно эффективна и находит жанр четыре раза из пяти. В отличие от этого, рок и диско сложнее определить. Кроме того, хорошая классификация - это не единственный показатель, на котором следует основываться для рекомендации. Действительно, эти категории не являются взаимоисключающими, и некоторые являются поджанрами других, например металл является поджанром рока. Самые полезные признаки для количественной оценки сходства музыки - это восприятие (громкость, резкость, ширина и MFCC), ритм и танцевальность. Действительно, только восприятие вносит более 60% точности с использованием метода SVM. Следует также отметить, что танцевальность, высокоуровневый признак, предоставляет информацию, существенно отличающуюся от более классических признаков, как физических, так и музыкальных, что позволяет явно улучшить производительность (примерно на 10%).
Результаты прослушивания обнадеживающие. Следует отметить, что эти прослушивания были оценены только одним человеком (мной, автором), и оценка по группе лиц позволила бы лучшую оценку. Однако прогресс между прослушиваниями в начале и после оптимизации явный. В то время как система ранее ошибочно рекомендовала блюзовые песни для совершенно другой поп-музыки, рекомендации теперь более логичные и последовательные. Система в основном рекомендует музыку в рамках того же жанра (иногда от того же исполнителя), и реже - более различные композиции. Во всех случаях есть сходство в общем настроении или тональности выбранной музыки, ее ритме, мелодии или даже инструментации.
В заключении стоит отметить, что для того чтобы учесть вкусы пользователя, возможны несколько подходов, большинство из которых уже объяснены в разделе "Введение". В данной диссертации был выбран и реализован метод контентной рекомендации. Полученные результаты показывают, что можно довольно эффективно изучать вкусы пользователя на основе предыдущей прослушанной им музыки для рекомендации новых композиций. Принцип заключается в том, чтобы извлечь как можно больше информации из аудиозаписи в формате mp3 или wav. Музыкальная композиция рассматривается как свидетельство музыкальных предпочтений пользователя. Извлеченная информация может быть музыкальной (высота звука, ритм), физической, полученной с помощью обработки сигналов (спектральное уменьшение), или признаками более высокого уровня (танцевальность). Важно убедиться, что информация является актуальной и нераздутой с помощью алгоритмов выбора признаков. Из лучшего набора признаков алгоритм машинного обучения (в данном случае, метод опорных векторов) классифицирует музыку по жанрам. После этапа классификации следует этап рекомендации. Он заключается в поиске четырех других композиций, которые будут рекомендованы пользователю. Эти композиции будут теми, которые наиболее близки по признакам. Одной из самых сложных задач в этом проекте является оценка. Довольно сложно измерить производительность нашей системы. Исходные результаты основывались на различных классификаторах, изученных в проекте. В то же время проводились прослушивания для оценки рекомендаций и моделей.


1. Rich E. User modeling via stereotypes* // Cognitive Science. - 1979. - Vol. 3, № 4. - P. 329354.
2. Burke R., Ramezani M. Matching Recommendation Technologies and Domains. - 2011. - P. 367-386.
3. Schedl M. Deep learning in music recommendation systems // Frontiers in Applied Mathematics and Statistics. - 2019. - Vol. 5. - P. 44.
4. Schedl M., Knees P., Gouyon F. New Paths in Music Recommender Systems Research. - 2017.
5. McNee S. M., Riedl J., Konstan J. A. Being Accurate is Not Enough: How Accuracy Metrics Have Hurt Recommender Systems // CHI EA ’06. - 2006. - P. 1097-1101.
6. Knees P., Schedl M. Music retrieval and recommendation - a tutorial overview // Proceedings of the 38th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR). - 2015.
7. Knees P., Schedl M. Music Similarity and Retrieval: An Introduction to Audio- and Web-based Strategies. - 2016.
8. P erez-Marcos J., Batista V. Recommender system based on collaborative filtering for Spotify’s users. - 2018. - P. 214-220.
9. Johnson C. From idea to execution: Spotify’s discover weekly. - November 2015.
10. Schafer B., Frankowski D., Herlocker J., Sen S. Collaborative Filtering Recommender Systems.
- 2007.
11. Elahi M., Ricci F., Rubens N. A survey of active learning in collaborative filtering recommender systems // Computer Science Review. - 2016.
12. Kaminskas M., Ricci F. Contextual music information retrieval and recommendation: State of the art and challenges // Computer Science Review. - 2012. - Vol. 6, № 2. - P. 89-119.
13. Gu Z., Guo L., Liu T. Music genre classification via machine learning.
14. Park H-A. An introduction to logistic regression: From basic concepts to interpretation with particular attention to nursing domain // Journal of Korean Academy of Nursing. - 2013. - Vol. 43.
- P. 154-164.
15. Sigmoid-function-2. - URL: https://commons.wikimedia.org/wiki/File:Sigmoid- function-2.svg (access date: 11.04.2023)....60


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ