Тип работы:
Предмет:
Язык работы:


Генерация музыки с помощью нейронных сетей

Работа №126128

Тип работы

Бакалаврская работа

Предмет

нейронные сети

Объем работы55
Год сдачи2020
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
43
Не подходит работа?

Узнай цену на написание


Введение 4
Программные средства использованные в работе 6
Глава 1. Используемые инструменты и архитектуры 7
1.1. Рекуррентные нейронные сети 7
1.2. LSTM сети 8
1.2.1 Forget gate 10
1.2.2 Input gate 11
1.2.3 Output gate 12
1.3. Двунаправленные рекуррентные сети 13
1.4. Механизм внимания 14
1.5. Сверточные сети 15
1.6. Автокодировщик 17
1.7. Вариационный автокодировщик 19
1.8. Генеративно-состязательные сети 20
Глава 2. Данные 22
2.1. Тип данных 22
2.1.1 Аудио формат 23
2.1.2 Символьный формат 24
2.1.3 MIDI 25
2.1.4 Piano roll 26
2.1.5 ABC notation 27
2.2. Генерация последовательностей 28
Глава 3. Обзор существующих моделей 29
3.1. Character-based RNN 29
3.1.1 Входные данные и их обработка 29
3.1.2 Архитектура 30
3.1.3 Результат 30
3.2. MusicVAE 31
3.2.1 Входные данные и их обработка 31
3.2.2 Архитектура 32
3.2.3 Результат 33
3.3. WaveNet 34
3.3.1 Входные данные и их обработка 34
3.3.2 Архитектура 35
3.3.3 Результат 38
3.4. WaveGAN/SpecGAN 38
3.4.1 Входные данные и их обработка 38
3.4.2 Архитектура WaveGAN 39
3.4.3 Архитектура SpecGAN 40
3.4.4 Результат 41
Глава 4. Предлагаемая модель 43
4.1. Входные данные и их обработка 43
4.2. Архитектура сети 43
4.2.1 Описание алгоритма 44
4.3. Параметры моделей 47
4.4. Результаты 47
4.4.1 Генерация и сэмплирование 49
4.5. Вывод 50
4.6. Дальнейшие перспективы развития 51
Заключение 52
Список литературы 53

Актуальность
В наши дни искусственный интеллект активно используется для улуч­шения многих аспектов повседневной жизни людей. Он дает нам рекомен­дации по предметам, которые мы хотим приобрести, переводит текст с од­ного языка на другой, подбирает музыкальный плейлист на основе наших предпочтений, а также выполняет еще множество полезных действий, ко­торые делают нашу жизнь лучше и проще.
Нейронные сети — один из видов машинного обучения. В основе их работы лежат способы функционирования биологических нейронный се­тей. Модели, построенные с их помощью являются очень мощными ин­струментами для решения множества разных задач. Однако, порой, чтобы обучить модель требуется большое количество ресурсов в виде времени и вычислительных мощностей.
Генеративное моделирование — одна из самых обсуждаемых тем в области искусственного интеллекта. Машины можно научить не только ри­совать и писать текст, но и сочинять музыку, для этого достаточно исполь­зовать актуальные примеры генеративных моделей глубокого обучения.
Создание машиной реалистично звучащей музыки является сложной и в то же время интересной проблемой. Существует две основные ветви разработки в этой области. Первая нацелена на решение задачи автомати­ческой генерации музыкальных композиций без участия человека. Вторая же на создание программного обеспечения, которое предоставляет интер­фейс для взаимодействия с человеком, и способна помогать при создании музыкального произведения.
Большинство людей получают удовольствие от прослушивания му­зыки, и если есть какой-то способ генерировать музыку автоматически, особенно достойного качества, то это большой скачок в мире музыкальной индустрии.
В данной работе поставлена задача реализовать и обучить модель, решающую задачу автоматической генерации музыки.
Цель работы
Цель выпускной квалификационной работы является реализация ме­тода автоматической генерации музыки с помощью нейронных сетей.
Постановка задачи
Для достижения цели необходимо:
1. Проанализировать существующие методы и подходы к решению за­дачи генерации музыки.
2. Описать и реализовать архитектуру, способную генерировать музыку.
3. Путем варьирования параметров, получить несколько моделей для сравнительного анализа.
4. Обучить различные модели и сравнить их показатели.
5. Получить музыкальные фрагменты, сгенерированные лучшей моде­лью.
Практическая значимость
Практическая значимость данного исследования крайне высока. Раз­витие области автоматической генерации музыки вносит вклад в жизни не только музыкантов, но и людей, для которых музыка не является основным видом деятельности.
Композиторам более не придется заниматься утомительными вычис­лениями и они смогут всецело посвятить себя творчеству: исследованию и улучшению музыкальной формы, которую создал для них компьютер.
Для игровой и киноиндустрии процесс создания сопровождающих композиций упростится с точки зрения временных и финансовых затрат.
У обычных людей будет возможность не выходя из дома и в любой мо­мент времени услышать свеже сгенерированный музыкальный фрагмент, реализованный на любом существующем музыкальном инструменте, или при желании даже разыгранный целым виртуальным оркестром!
На данном этапе развития этой области уже существуют нейронный сети, которые способны генерировать музыку в стиле Моцарта или Баха. Что означает для нас наличие возможности услышать потенциально воз­можные композиции многих творцов прошлого и даже тех, кто находился у самых истоков современной музыкальной теории.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках исследования были проанализированы существующие ме­тоды генерации музыки. Также была описана и реализована архитектура сети. Путем изменения некоторых слоев, получены сравнительные показа­тели трех моделей. В результате была определена лучшая модель и с ее помощью были сгенерированы музыкальные фрагменты.
В выпускной квалификационной работе я ставил задачу разработать программный комплекс для генерации музыки и успешной ее решил.


[1] Briot J.-P. , Hadjeres G., Pachet F.-D. Deep Learning Techniques for Music Generation. Computational Synthesis and Creative Systems. / Springer, 1st ed, 2019. 284 p.
[2] Francois Chollet. Deep Learning with Python. / Manning Publications, 1st ed, 2017. 384 p.
[3] Sepp Hochreiter, Jurgen Schmidhuber. Long short-term memory // Neural Computation, Vol 9, No 8., 1997. P. 1735-1780.
[4] Andrej Karpathy. The Unreasonable Effectiveness of Recurrent Neural Networks, 2015.
[5] Christopher Olah. Understanding LSTM Networks, 2015.
[6] J.-P. Briot, Francois Pachet. Music Generation by Deep Learning - Challenges and Directions. // Neural Computing and Applications, 2017.
[7] Ke Chen, Weilin Zhang, Shlomo Dubnov, Gus Xia, Wei Li. The Effect of Explicit Structure Encoding of Deep Neural Networks for Symbolic Music Generation. // International Workshop on Multilayer Music Representation and Processing (MMRP), 2019. P. 77-84.
[8] Luke Johnston. Using LSTM Recurrent Neural Networks for Music Generation, 2016.
[9] Allen Huang, Raymond Wu. Deep Learning for Music. // CoRR, Vol. abs/1606.04930, 2016.
[10] Mike Schuster and Kuldip K. Paliwal. Bidirectional recurrent neural networks. // IEEE Transactions on Signal Processing, Vol. 45, No. 11, 1997. P. 2673-2681.
[11] Dzmitry Bahdanau, KyungHyun Cho, Yoshua Bengio. Neural Machine Translation by Jointly Learning to Align and Translate. // CoRR, Vol. abs/1409.0473, 2015.
[12] Guineng Zheng, Subhabrata Mukherjee, Xin Luna Dong, Feifei Li. OpenTag: Open Attribute Value Extraction from Product Profiles. // Association for Computing Machinery, 2018. P. 1049-1058.
[13] Yann LeCun and Yoshua Bengio. Convolutional networks for images, speech, and timeseries. // The handbook of brain theory and neural networks, 1998. P. 255-258.
[14] G. E. Hinton, R. R. Salakhutdinov. Reducing the Dimensionality of Data with Neural Networks. // American Association for the Advancement of Science, Vol. 313, Issue 5786, 2006. P. 504-507.
[15] Diederik P. Kingma, Max Welling, Auto-Encoding Variational Bayes, 2013.
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ