📄Работа №199753

Тема: Сравнительный анализ методов извлечения признаков аудио сигнала с помощью нейронных сетей

📝
Тип работы Дипломные работы, ВКР
📚
Предмет информационные системы
📄
Объем: 74 листов
📅
Год: 2023
👁️
Просмотров: 36
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Аннотация
ВВЕДЕНИЕ 5
ГЛАВА 1. ОСНОВЫ АУДИО АНАЛИЗА 8
1.1. Основные задачи аудио анализа 8
1.2. История развития аудио анализа 9
1.3. Основы цифровой обработки аудиосигналов 13
1.4. Методы извлечения признаков аудиосигнала 15
Выводы по первой главе 23
ГЛАВА 2. НЕЙРОННЫЕ СЕТИ 24
2.1. Основные понятия о нейронных сетях и их виды 24
2.2. Свёрточная нейронная сеть 28
2.3. Общая архитектура нейронной сети, используемой для распознавания
акустических событий 34
Выводы по второй главе 36
ГЛАВА 3. ЭКСПЕРИМЕНТЫ И РЕЗУЛЬТАТЫ 37
3.1. Подготовка данных 37
3.2. Архитектура нейронной сети 40
3.3. Описание и проведение эксперимента 43
3.4. Результаты исследования 49
Выводы по третьей главе 57
ЗАКЛЮЧЕНИЕ 58
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 59
ПРИЛОЖЕНИЕ 62

📖 Введение

Аудиосигнал — это звуковой сигнал, который может быть записан и воспроизведен на аудиоустройстве. Из аудиосигнала могут быть извлечены различные признаки, такие как частотные компоненты, спектральные характеристики, длительность звука и другие.
Аудио сигналы являются одним из наиболее распространенных типов данных, которые используются в современном мире. Они могут быть записями голоса, музыки, звуковых эффектов и т.д. Обработка аудио сигналов имеет огромное значение в различных областях, таких как медицина, безопасность, телекоммуникации и другие.
Извлечение признаков аудиосигнала необходимо для получения информации о различных характеристиках и особенностях сигнала. Это может помочь в задачах распознавания речи, идентификации диктора, музыкальном анализе и обработке звука.
Одной из важнейших задач обработки аудио сигналов является классификация. Классификация аудио сигналов заключается в определении категории или жанра аудио записи на основе ее звуковых характеристик. Эта задача имеет широкое применение в музыкальной индустрии, где требуется автоматическое распознавание жанров музыки для ее дальнейшего продвижения и продажи.
Так в своей работе [1] Лысенко Н.С. реализовала алгоритм классификации музыкальных композиций по исполнителям, основанный на мел-частотных спектральных коэффициентах.
Другой областью применения классификации аудио сигналов является медицина. Например, звуковые сигналы могут использоваться для диагностики различных заболеваний, таких как болезни сердца и легких. Кроме того, классификация аудио сигналов может быть полезна в области безопасности, где звуковые сигналы могут использоваться для обнаружения необычных звуковых событий, таких как взрывы или выстрелы.
Ходашинский И.А. в своей работе [2] провел обзор актуальных на данный момент методов анализа биометрических данных в диагностики заболеваний, в которой уделил большое внимание аудио анализу сигналов.
Одним из наиболее эффективных инструментов аудио анализа являются нейронные сети. Нейронные сети - это модели, построенные по принципу работы человеческого мозга и используемые для решения различных задач. Нейронные сети могут быть применены для классификации, распознавания и генерации звуковых сигналов.
Использование нейронных сетей в аудио анализе позволяет автоматизировать ряд задач, которые ранее требовали больших затрат времени и усилий. Кроме того, нейронные сети могут обрабатывать большие объемы данных и выдавать результаты с высокой точностью.
Традиционные методы извлечения признаков аудиосигнала, такие как Мел- частотные кепстральные коэффициенты (MFCC), используются уже давно и успешно применяются в задачах аудио анализа. Однако, нейронные сети предоставляют новые возможности для автоматического извлечения признаков и классификации аудиосигналов.
В настоящее время нейронные сети являются одними из наиболее эффективных инструментов в аудио анализе и классификации аудиосигналов. Это обусловлено их способностью извлекать сложные признаки из сигналов, что делает их более точными и эффективными в сравнении с классическими методами извлечения признаков.
Заключения сравнительного анализа методов извлечения признаков аудиосигнала в задаче классификации с использованием нейронных сетей могут быть полезны для разработки более результативных систем классификации аудио сигналов, что в свою очередь приведет к улучшению качества обработки аудио сигналов в различных областях. Кроме того, решение этих задач поможет улучшить качество жизни людей и повысить эффективность работы в различных отраслях.
...

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Данная исследовательская работа была посвящена изучению различных методов извлечения признаков аудиосигнала, включающих в себя методы на основе частотных (STFT) и кепстральных (MFCC) характеристик сигнала. Указанные методы были реализованы на практике с помощью языка программирования Python.
В ходе проведенного исследования были отобраны наборы данных, содержащий аудиосигналы с различным содержанием, а также проведена предварительная обработка сигналов.
В целях определения эффективности методов извлечения признаков была решена задача классификации. Для этого была реализована и обучена сверточная нейронная сеть, оперируя результатами эффективности которой, можно было судить о применимости исследуемых методов к практической задаче.
На основании полученных результатов можно заключить, что обоснованность использования методов извлечения признаков аудиосигнала варьируется, в зависимости от рассматриваемой задачи. Так задача определения присутствия птичьего пения является более подходящей для частотного и кепстрального анализа, в отличии от классификации различных звуков окружения. На это влияет характер изучаемых аудио данных и отличие исследуемых звуков от шума, наличие которого бывает неизбежно.
Различие результатов методов извлечения признаков аудио сигнала не показали высокое значение. Из этого можно сделать вывод, что для неречевых наборов данных можно использовать любой из изученных методов, в зависимости от потребности в вычислительной мощности, что обеспечивает метод STFT, или в меньшем показателе ошибочных предсказаний, что присуще MFCC методу.
Таким образом, результаты данного исследования могут быть использованы для выбора наиболее эффективного метода для решения задачи классификации аудиоданных в конкретной практической задаче.
Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Н.С. Лысенко, Т.А. Приходько Классификация музыкальных композиций по исполнителям на основе машинного обучения // Прикладная математика: современные проблемы математики, информатики и моделирования. 2020. №II.
2. Ходашинский Илья Александрович, Сарин Константин Сергеевич, Бардамова Марина Борисовна, Светлаков Михаил Олегович, Слёзкин Артем Олегович, Корышев Николай Павлович БИОМЕТРИЧЕСКИЕ ДАННЫЕ И МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ В ДИАГНОСТИКЕ И МОНИТОРИНГЕ НЕЙРОДЕГЕНЕРАТИВНЫХ ЗАБОЛЕВАНИЙ: ОБЗОР // КО. 2022. №6.
3. Huffman, D. (1952). “A Method for the Construction of Minimum-Redundancy Codes”. Proceedings of the IRE. 40 (9): 1098—1101.
4. Welch T. A. A technique for high-performance data compression // Computer.
— 1984. — Т. 6, № 17. — С. 8-19
5. Tang, Y.Y. Wavelet Theory and Its Application to Pattern Recognition / Y. Y. Tang, L. H. Yang, J. Liu, H. Ma Singapore: World Scientific, 2000. 345 p.
6. He K. et al. Deep residual learning for image recognition //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. - 2016.
7. Kingma D., Ba J. Adam: A method for stochastic optimization //arXiv preprint arXiv:1412.6980. - 2014.
8. Федоров Алексей Валерьевич, Омельченко Анатолий Васильевич Синтез и исследование алгоритмов идентификации дикторов по характеристикам остатков линейного предсказания // Радиоэлектроника и информатика. 2006. №4.
9. Иванов И.И. Анализ метода мел-частотных кепстральных коэффициентов применительно к процедуре голосовой аутентификации // Актуальные проблемы гуманитарных и естественных наук. 2015. №10-1.
10. D. A. Huffman, "A Method for the Construction of Minimum-Redundancy Codes," in Proceedings of the IRE, vol. 40, no. 9, pp. 1098-1101, Sept. 1952, doi: 10.1109/JRPROC.1952.273898.
11. J. Ziv and A. Lempel, "Compression of individual sequences via variable-rate coding," in IEEE Transactions on Information Theory, vol. 24, no. 5, pp. 530-536, September 1978, doi: 10.1109/TIT.1978.1055934.
12. Тассов Кирилл Леонидович, Дятлов Роман Андреевич Метод идентификации человека по голосу // Инженерный журнал: наука и инновации. 2013. №6 (18).
13. Кручок Д.Н., Петровский А.А. Система идентифкации диктора в
акустических шумах на основе антропоморфической обработки речевого сигнала // Доклады БГУИР. 2016. №4 (98). URL:
https://cyberleninka.ru/article/n/sistema-identifkatsii-diktora-v-akusticheskih- shumah-na-osnove-antropomorficheskoy-obrabotki-rechevogo-signala (дата
обращения: 31.03.2023).
14. Кулюкин Владимир Алексеевич, Мукерджи Сарбаджит, Буркатовская Юлия Борисовна Классификация аудиофайлов с помощью сверточных нейронных сетей в электронном аудиомониторинге ульев // Вестн. Том. гос. ун - та. Управление, вычислительная техника и информатика. 2018. №45.
15. Альбовский Александр Владимирович, Егоров Никита Андреевич,
Романюк Анастасия Георгиевна Реализация нейронной сети с помощью языка программирования Python // Colloquium-journal. 2020. №9 (61). URL:
https://cyberleninka.ru/article/n7realizatsiya-neyronnoy-seti-s-pomoschyu-yazyka- programmirovaniya-python.
... всего 24 источников

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ