Тип работы:
Предмет:
Язык работы:


АНАЛИЗ АУДИОСИГНАЛА НА БАЗЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Работа №85767

Тип работы

Дипломные работы, ВКР

Предмет

математика

Объем работы45
Год сдачи2017
Стоимость4325 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
148
Не подходит работа?

Узнай цену на написание


Введение 3
1. Методы анализа аудиосигналов 4
1.1. Акустические характеристики речи 4
1.2. Обработка и хранение аналоговых и цифровых сигналов 6
1.3. Теоретические основы искусственных нейронных сетей 10
2. Применение искусственных нейронных сетей для анализа
аудиосигналов 20
2.1. Алгоритм анализа аудиосигналов на базе искусственной
нейронной сети 20
2.2. Описание программного обеспечения для реализованного
алгоритма анализа аудиосигналов 25
2.3. Результаты работы программы 27
Заключение 29
Литература
Приложение

Анализ аудиосигналов является востребованным направлением в различных сферах деятельности человека. Например, он может применяться для распознавания и синтеза речи, в задачах робототехники, при поиске шумов сердца в медицине, идентификации личности в криминалистики и др.
В настоящей работе рассматривается задача распознавание некоторых аудио образов, которые представлены речью человека и, в частности, гласными звуками речи.
Для решения данной задачи возможно использовать ряд математических аппаратов, одним из которых является искусственная нейронная сеть (ИНС).
Целью данной работы является изучение методов анализа аудиосигналов, а также реализация одного из вариантов алгоритма распознавания речи.
Для достижения поставленной цели необходимо решить ряд задач:
1) изучить структуру аудио сигнала, а также его цифровое представление;
2) изучить принципы работы и построения ИНС;
3) разработать алгоритм для распознавания аудиосигналов на базе ИНС;
4) реализовать данный алгоритм в программный продукт.
В качестве новизны можно отметить предложенный в работе модифицированный вариант алгоритма работы с нейронными сетями, лежащих в основе системы распознавания элементов речи. Эта модификация позволяет избавиться от некоторых недостатков, присущих сетям с ассоциативной памятью.
Работа объемом 28 листов основного текста состоит из введения, двух частей, заключения, списка используемой литературы, содержащего четырнадцать источников, и приложения.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Аналоговый сигнал, являясь непрерывной функцией по времени, на электронных носителях сохраняется в виде последовательности амплитуд. Значения амплитуд замеряются через равные промежутки времени, образуя при этом дискретный сигнал, либо цифровой, если он квантуется по уровню. Данные таких сигналов могут храниться в файлах-контейнере WAV.
Для решения задач распознавания образов наиболее оптимальным типом сети является сеть Хопфилда. Она отличается высокой точностью получаемых результатов, возможностью переобучения, а также оптимизацией вычислительных затрат. Существенным недостатком такой сети является небольшая емкость памяти, например, возможность запоминания ассоциативных образов ограничена числом нейронов сети.
После нахождение формант на спектре, который находился при помощи алгоритма быстрого преобразования Фурье, производилось приведение вектора формант к виду входного вектора нейросети и её дальнейшее обучение на эталонных образцах. Некоторые недостатки сети привели к модификации алгоритма. Ее суть состоит в том, что создавался комплекс нейронных сетей Хопфилда, которые работают параллельно.
В работе разработана программа, реализующая алгоритм анализа аудиосигналов. Результаты работы программы оправдали ожидания. Нейросеть на базе этого алгоритма смогла распознать элементы речи, на которой ранее обучилась. Также большую роль сыграла ассоциативная память нейросети, что позволило ей справится с зашумленным образом. Модификация алгоритма позволила избавиться от образов «химер», увеличить скорость распознавания, а также снять ограничение на количество запоминаемых образов нейронной сетью Хопфилда.



1. Фант, Г. Акустическая теория речеобразования / Г. Фант Монография. - М.:Наука. - 1964. - 284с.
2. Фланаган, Дж. Анализ, синтез и восприятие речи / Дж. Фланаган Монография. - Связь. - 1968. - 396с.
3. Лобанов, Б.М. Компьютерный синтез и клонирование речи. /
Б.М. Лобанов, Л.И. Цирульник. - Минск «Белорусская наука». - 2008. - 316 с.
4. Сергиенко, А.Б. Цифровая обработка сигналов / А.Б. Сергиенко - СПб.: Питер. - 2002. - 608 с.
5. Microsoft Corporation Intro to Audio Programming, Part 2: Demystifying the
WAV Format [Электронный ресурс] / Microsoft Corporation. - 2009. Режим до ступа:https://blogs.msdn.microsoft.com/dawate/2009/06/23/intro-
to-audio-programming-part-2-demystifying-the-wav-format/,свободный.
6. Kain, A. K. Artificial Neural Networks: A Tutorial, Computer, Vol.29, No.3, March/1996 / K. A. Kain, Jianchang Mao, K.M.Mohiauddin, pp. 31 - 44.
7. Хайкин, С. Нейронные сети: полный курс, 2-е изд.: пер. с англ. / С. Хайкин. - М.:Вильямс. - 2006. - 1104с.
8. McCalloch, W.S. A logical calculus of the ideas immanent in nervous activity / W.S. McCalloch, W.Pitts // Bull. Math. Biophys. - 1943. - v.5. - pp.115-133.
9. Каширина, И.Л. Искусственные нейронные сети / И.Л. Каширина Учебное пособие. - Воронеж:ВГУ. - 2005. - 51с.
10. Иванов, Ю. С. Обзор методов распознавания образов при разработке автоматической системы идентификации личности по отпечаткам пальцев [Электронный ресурс] / Ю.С. Иванов, Л.В. Астафьева // «Вестник научного общества студентов, аспирантов и молодых ученых», 2014 год, №1. Режим доступа:http://e.lanbook.com/view/journal/194458/, свободный.
11. Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток / Г. Нуссбаумер. - Москва: радио и связь - 1985. - 248с.
12. Оганесян, А.Г. Вычислительная техника и информатика / А.Г. Оганесян, ISSN 0002-306X. Изв. НАН РА и ГИУА. Сер. ТН. 2006. Т. LIX, №1. -
С.179-183.
13. Харари, Ф. Теория графов / Ф. Харрари. - М.: Мир, 1973. - 300 с.
14. Шарп, Дж. Microsoft Visual C#. Подробное руководство / Дж. Шарп. - СПб.:Питер. - 2017. - 848с.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ