Тип работы:
Предмет:
Язык работы:


Нейросетевые методы генерации музыкальных дорожек

Работа №126276

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы47
Год сдачи2023
Стоимость4940 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
44
Не подходит работа?

Узнай цену на написание


Введение 4
1. Обзор предметной области 8
1.1. Метод представления и кодирования музыки 8
1.1.1. Метод представления 8
1.1.2. Метод кодирования 10
1.2. Статус исследования генерации музыки 11
1.3. Задача генерации музыки 14
1.3.1. Генерация мелодий 14
1.3.2. Гармоническая аранжировка 15
1.3.3. Перенос стиля 16
1.4. Классическая модель 17
1.4.1. Модель LSTM 17
1.4.2. Модель Transformer 19
1.4.3. Модель GAN 21
2. Классическая и усовершенствование модель 22
2.1. Классические модели 23
2.1.1. Генерация музыки на LSTM и Transformer .... 23
2.1.2. Генерация музыки на MuseGAN 27
2.2. Классическая модель и ее усовершенствование 29
2.2.1. Усовершенствованные модели LSTM 29
2.2.2. Усовершенствованные модели GAN 32
2.3. Субъективная оценка результатов 37
3. Заключение 42
Список литературы 44


С развитием компьютерных технологий и распространением электронных устройств музыка все чаще хранится в цифровом виде на компьютерах, а хранение, обработка, сочинение и производство музыки все больше зависят от компьютеров. Эта тенденция определила развитие музыкальных технологий и музыкального интеллекта. Если музыка - это искусство и культурная форма, используемая для выражения мыс-лей и чувств людей и социальных реалий, то генеративный искусственный интеллект - одна из самых революционных технологий нашего времени, меняющая способ нашего взаимодействия с машинами. Генерация музыки изучает идею о том, чтобы позволить компьютерам автоматически создавать музыку с помощью алгоритмов, что обеспечивает музыкальной индустрии более разнообразный спектр музыкальных произведений для удовлетворения потребностей различных аудиторий.
В последние годы глубокие нейронные сети [4] добились значительного прогресса и достигли замечательных результатов в генерации изображений и видео, а также текста [37]. Аналогичные попытки постепенно предпринимаются для применения их в задачах генерации музыки. С развитием методов глубокого обучения [5] применение методов глубо-кого обучения [25] для автоматического генерирования музыки стало актуальным направлением исследований. Методы глубокого обучения позволяют избежать большого количества ручных музыкальных характеристик, которые необходимо маркировать в традиционных алгоритмах машинного обучения, и стали основным подходом к автоматическому генерированию музыки, обусловленным текущими доступными музыкальными данными и хорошими возможностями моделирования. В настоящее время генерация музыки охватывает различные области, такие как генерация полифонической музыки [19], генерация аккомпанемента [34], преобразование стиля [22] и восстановление музыки [27].
Создание музыкального произведения - непростая задача, это не то, что может сделать один человек простым движением руки, скорее, композитору требуется много усилий и времени, чтобы тщательно разработать и создать музыкальное произведение с помощью человеческого труда.
С развитием технологий искусственного интеллекта генерация музыки стала одним из основных направлений исследований в области искусственного интеллекта. Использование нейронных сетей для гене-рации музыки позволяет автоматически генерировать музыку, снижая порог для сочинения треков без необходимости для создателя обладать большим количеством специальных знаний в области теории музыки; все, что требуется, - это четкое представление о том, чего он хочет, и компьютер может сам создать соответствующий трек. Это не только помогает музыкантам в их творческой работе, давая вдохновение и создавая уникальные музыкальные произведения, но и обеспечивает музыкальную индустрию более разнообразным ассортиментом музыкальных произведений, отвечающих потребностям различных аудиторий. В то же время технология генерации музыки может доставить любителям удовольствие от написания и сочинения песен. Генерация фортепианной музыки является одним из наиболее важных применений технологии генерации музыки и имеет широкое исследовательское и практическое значение.
Цель работы
Целью работы является исследование методов генерации фортепианной музыки с использованием нейронных сетей, таких как LSTM, Transformer и GAN, обучение нескольких моделей генерации фортепианной музыки и оценка их производительности. Кроме того, в данной работе оценивается субъективное качество сгенерированных музыкальных клипов с помощью анкеты для выбора лучшей модели генерации фортепианной музыки, а также разрабатывается и внедряется приложение для автоматической генерации музыки на основе этой модели.
Задачи работы
Для достижения цели необходимо:
1. Сбор и подготовка данных, используемых для проведения экспериментов, и их предварительная обработка.
2. Обучение моделей генерированию однодорожечных и многодорожечных музыкальных клипов для фортепиано и выбор оптимального клипа для каждой модели.
3. Разработка анкеты субъективной оценки для распространения среди целевой аудитории и анализ полученных результатов.
4. Разработать программу автоматической генерации музыки LSTM- композитор на основе лучшей модели генерации фортепианной музыки, описав структуру и функциональность программной системы.
Практическая значимость работы
В работе исследуются методы генерации фортепианной музыки с использованием нейронных сетей, таких как LSTM, Transformer и GAN, для обучения пяти моделей генерации фортепианной музыки, а также приводится открытый исходный код этих пяти моделей. Кроме того, в данной работе оценивается субъективное качество сгенерированных музыкальных фрагментов с помощью анкеты, приводится образец анкеты, выбирается лучшая модель генерации фортепианной музыки, разрабатывается и внедряется приложение для автоматической генерации музыки на основе этой модели для генерации фортепианных музыкальных произведений.
Выводы, сделанные в данной работе, имеют большое практическое значение. Во-первых, технология генерирования фортепианной музыки может обеспечить больше творческого вдохновения для авторов фортепианной музыки и больше учебных ресурсов и возможностей для практики для учащихся музыкальных школ, помогая им лучше овладеть знаниями и навыками теории музыки. Во-вторых, фортепианная музыка, как элегантный вид искусства, обладает успокаивающим эффектом и может принести людям внутренний покой и расслабление. Генерирование большего количества произведений классической музыки с помощью технологии генерации музыки может не только предоставить больше возможностей для любителей музыки оценить и научиться, но и позволить большему количеству людей найти эмоциональную поддержку и духовное утешение в прекрасном мире классической музыки. Кроме того, созданные фортепианные пьесы и отрывки могут быть использованы в области музыкального образования, музыкальной терапии и музыкальной композиции, расширяя спектр музыкальных приложений. Наконец, развитие технологии генерации музыки также при-несло новые бизнес-модели и возможности в музыкальную индустрию, способствуя дигитализации и интеллектуальному развитию музыкальной индустрии. Таким образом, результаты исследования, проведенного в данной работе, имеют большое практическое значение для развития музыкальной индустрии и продвижения классической музыки.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Целью работы является исследование методов генерации фортепианной музыки с использованием нейронных сетей, таких как LSTM, Transformer и GAN, обучение нескольких моделей генерации фортепианной музыки и оценка их производительности. Кроме того, в данной работе оценивается субъективное качество сгенерированных музыкальных клипов с помощью анкеты для выбора лучшей модели генерации фортепианной музыки, а также разрабатывается и внедряется приложение для автоматической генерации музыки на основе этой модели.
Основные задачи данной работы заключаются в следующем:
Во-первых, мы собрали и подготовили данные, используемые для проведения экспериментов, выбрали три классические модели LSTM, GAN и Transformer, сгенерировали с помощью этих моделей однодорожечные и многодорожечные фрагменты фортепианной музыки, а также выбрали усовершенствованные модели LSTM и GAN для обучения генерированию фортепианной музыки длительностью около 2 мин.
Во-вторых, в данной работе объективно оцениваются три модели генерации музыки на основе нейронных сетей и субъективно оценивается качество сгенерированных музыкальных фрагментов для выбора лучшей модели генерации фортепианной символьной музыки, что доказывает эффективность и мастерство предложенного метода генерации фортепианной символьной музыки. Среди них, для анкетной части, мы выбрали музыкальные клипы, сгенерированные каждой из этих моде-лей, два клипа классической LSTM и Transformer с хорошим опытом прослушивания, два клипа GAN и по одному клипу продвинутой LSTM и GAN, чтобы провести анкетный опрос, сформировать результаты анкетирования и проанализировать их.
Наконец, в данной работе разрабатывается и внедряется приложение для автоматической генерации музыки на основе лучшей модели генерации музыки фортепианной нотации. В части разработки программного обеспечения мы выбираем лучшую модель среди субъективных моделей и разрабатываем программное обеспечение для автоматической генерации музыки на основе машинного обучения LSTM- composer, предоставляя структуру и функции программной системы. Это может дать создателям и энтузиастам музыки больше вдохновения и творческих инструментов, имеет широкие перспективы применения и коммерческую ценность.
Таким образом, данное исследование имеет важное теоретическое и практическое значение для исследования и применения технологии генерации фортепианной музыки, а также предоставляет новые идеи и методы для развития технологии искусственного интеллекта в музыкальной индустрии.
Исходный код опубликован на платформе GitHub по ссылке https://github.com/wumetay/neural-networks-genenrate-music-tracks.



[1] Vaswani Ashish, Shazeer Noam M., Parmar Niki, Uszkoreit Jakob, Jones Llion, Gomez Aidan N., Kaiser Lukasz, and Polosukhin Illia. Attention is All you Need // NIPS. — 2017.
[2] Baggi Denis and Haus Goffredo. IEEE 1599: Music encoding and interaction //Computer. — 2009. — 04. — Vol. 42. — P. 84 - 87.
[3] Boulanger-Lewandowski Nicolas, Bengio Y., and Vincent Pascal. Mod-eling Temporal Dependencies in High-Dimensional Sequences: Appli-cation to Polyphonic Music Generation and Transcription // Proceed¬ings of the 29th International Conference on Machine Learning, ICML 2012. —2012. —06.—Vol. 2.
[4] Bretan Mason, Weinberg Gil, and Heck Larry. A Unit Selection Methodology for Music Generation Using Deep Neural Networks. — 2016. — 12.
[5] Briot Jean-Pierre and Pachet Francois. Music Generation by Deep Learning - Challenges and Directions // Neural Computing and Ap-plications. — 2020. — 02. — Vol. 32.
[6] Yang Wei, Sun Ping, Zhang Yi, and Zhang Ying. CLSTMS: A Combi-nation of Two LSTM Models to Generate Chords Accompaniment forSymbolic Melody. — 2019. — 05. — P. 176-180.
[7] Eck Douglas and Schmidhuber Juergen. A First Look at Music Com-position using LSTM Recurrent Neural Networks. — 2002.
[8] Chen K., Zhang Weilin, Dubnov Shlomo, and Xia Gus. The Effect of Explicit Structure Encoding of Deep Neural Networks for Symbolic Music Generation // 2019 International Workshop on Multilayer Music Representation and Processing (MMRP). — 2018.—P. 77-84.
[9] Elman Jeffrey L. Finding Structure in Time // Cogn. Sci. — 1990. — Vol. 14. —P. 179-211.
[10] Gatys Leon, Ecker Alexander, and Bethge Matthias. Image StyleTransfer Using Convolutional Neural Networks. — 2016. — 06. — P. 2414-2423.
[11] Wu Shangda, Yang Yue, Wang Zhaowen, Li Xiaobing, and Sun Maosong. Generating Chords from Melody with Flexible Har¬monic Rhythm and Controllable Harmonic Density. — 2021.
[12] Goodfellow Ian J., Pouget-Abadie Jean, Mirza Mehdi, Xu Bing, Warde- Farley David, Ozair Sherjil, Courville Aaron C., and Bengio Yoshua. Generative Adversarial Nets // NIPS. — 2014.
[13] Goel Kratarth, Vohra Raunaq, and Sahoo Jajati. Polyphonic Mu¬sic Generation by Modeling Temporal Dependencies Using a RNN-DBN. — 2014. — 12. — Vol. 8681. —P. 217-224.
[14] Roberts Adam, Engel Jesse, Raffel Colin, Hawthorne Curtis, and Eck Douglas. A Hierarchical Latent Vector Model for Learning Long¬Term Structure in Music. — 2018. — 03.
[15] Hochreiter Sepp and Schmidhuber Jurgen. Long Short-Term Mem¬ory // Neural Computation. —1997. — Vol. 9. — P. 1735-1780.
[16] Huang He, Yu Phillip, and Wang Changhu. An Introduction to Image Synthesis with Generative Adversarial Nets. — 2018. — 03.
[17] Hung Hsiao-Tzu, Wang Chung-Yang, Yang Yi-Hsuan, and Wang Hsin- Min. Improving Automatic Jazz Melody Generation by Transfer Learning Techniques // 2019 Asia-Pacific Signal and Information Pro-cessing Association Annual Summit and Conference (APSIPA ASC). —
2019. —P. 339-346.
[18] Kingma Diederik P. and Welling Max. Auto-Encoding Variational Bayes // CoRR. — 2013.—Vol. abs/1312.6114.
[19] Donahue Chris, Mao Huanru Henry, Li Yiting, Cottrell G., and McAuley Julian. LakhNES: Improving Multi-instrumental Music Gen¬eration with Cross-domain Pre-training // International Society for Music Information Retrieval Conference. — 2019.
[20] Lim Hyungui, Rhyu Seungyeon, and Lee Kyogu. Chord Generation from Symbolic Melody Using BLSTM Networks. — 2017. — 10.
[21] Lo Man Yat and Lucas Simon. Evolving Musical Sequences with N-Gram Based Trainable Fitness Functions. — 2006.—01.—P. 601 - 608.
[22] Brunner Gino, Konrad Andres, Wang Yuyi, and Wattenhofer Roger. MIDI-VAE: Modeling Dynamics and Instrumentation of Music with Applications to Style Transfer // ArXiv. — 2018. — Vol. abs/1809.07600.
[23] Meredith David. Method of Computing the Pitch Names of Notes in MIDI-like Music Representations.— 2004.—01.
[24] Mozer Michael. Neural Network Music Composition by Prediction: Exploring the Benefits of Psychoacoustic Constraints and Multi-scale Processing //Connection Science - CONNECTION. — 1994. — 01.— Vol. 6.—P. 247-280.
[25] Krishnan V., Subramanian Rajarajeswari, Krishnamohan Venkat, Sheel Vivek, and Rajendran Deepak. Music Generation Using Deep Learning Techniques //Journal of Computational and TheoreticalNanoscience. — 2020. — 07. — Vol. 17. — P. 3983-3987.
[26] Wang Ziyu, Zhang Yiyi, Zhang Yixiao, Jiang Junyan, Yang Ruihan, Zhao Junbo Jake, and Xia Gus. PIANOTREE VAE: Structured Rep-resentation Learning for Polyphonic Music // International Society for Music Information Retrieval Conference. — 2020.
[27] Pati Ashis, Lerch Alexander, and Hadjeres Ga6tan. Learning to Tra-verse Latent Spaces for Musical Score Inpainting. — 2019. — 11.
[28] Pinkerton Richard C. Information theory and melody. // Scientific American. —1956. — Vol. 194.—P. 77-87.
[29] Lattner Stefan, Grachten Maarten, Agres Kat, and Can- cino Chacon Carlos. Probabilistic Segmentation of Musical SequencesUsing Restricted Boltzmann Machines. — 2015. — 06. — Vol. 9110.
[30] Putnam Jeffrey. A Grammar-Based Genetic Programming Technique Applied to Music Generation. — 1996. — 01. — P. 363-368.
[31] Sigtia Siddharth, Benetos Emmanouil, Cherla Srikanth, Weyde Till-man, d’Avila Garcez Artur S., and Dixon Simon. An RNN-based Mu¬sic Language Model for Improving Automatic Music Transcription // International Society for Music Information Retrieval Conference. — 2014.
[32] Schulze Walter and Van Der Merwe Brink. Music Generation with Markov Models //Multimedia, IEEE. — 2011. — 04. — Vol. 18.— P. 78 - 85.
[33] Shao Xi, Xu Changsheng, and Kankanhalli Mohan. Unsupervised clas-sification of music genre using hidden Markov model. — 2004. — 07. — P. 2023 - 2026 Vol.3.
[34] Sheng Zhonghao, Song Kaitao, Tan Xu, Ren Yi, Ye Wei, Zhang Shikun, and Qin Tao. SongMASS: Automatic Song Writing with Pre-training and Alignment Constraint // ArXiv. — 2020.—Vol. abs/2012.05168.
[35] Todd Peter. A Connectionist Approach to Algorithmic Composition // Computer Music Journal. — 1989. — 12. — Vol. 13.
[36] Jiang Junyan, Xia Gus, Carlton Dave, Anderson Chris, and Miyakawa Ryan. Transformer VAE: A Hierarchical Model forStructure-Aware and Interpretable Music Representation Learning. —
2020. —05. —P. 516-520.
[37] Fang Yinyin, Xu Yong, Li Heju, He Xin, and Kang Longlong. Writ¬ing in the air: Recognize Letters Using Deep Learning Through WiFiSignals. — 2020. — 07. — P. 8-14.
[38] Zhuang Chen and Jinming Yu. GCA:A chord music generation algo-rithm based on double-layer LSTM. — 2021. — 04. — P. 57-61.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ