Тип работы:
Предмет:
Язык работы:


ГРАФИЧЕСКИЙ СПОСОБ ВЫДЕЛЕНИЯ УЧАСТКОВ, СОСТОЯЩИХ ИЗ ШУМА, В РЕЧЕВОМ ФАЙЛЕ

Работа №77924

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы49
Год сдачи2017
Стоимость4260 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
24
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ
1. ИССЛЕДОВАНИЕ ПРОБЛЕМЫ ВЫДЕЛЕНИЯ УЧАСТКОВ,СОСТОЯЩИХ ИЗ ШУМА, В РЕЧЕВОМ ФАЙЛЕ б
1.1. Общие сведения б
1.2. Ключевые понятия
1.2.1. Фильтрация и фильтры
1.2.2. Преобразование Фурье 8
1.2.3. Преобразование Гильберта 10
1.3. Общая структура алгоритма обнаружения участков, состоящих из шума в речевом файле 10
1.4. Методы обнаружения участков шума в сигнале 12
1.4.1. Анализ сигнала во временной области 12
1.4.2. Анализ сигнала в частотной области 15
2. РАЗРАБОТКА ГРАФИЧЕСКОГО СПОСОБА ВЫДЕЛЕНИЯ УЧАСТКОВ,СОСТОЯЩИХ ИЗ ШУМА, В РЕЧЕВОМ ФАЙЛЕ. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ. ЭКСПЕРИМЕНТЫ
2.1. Разработка графического способа обнаружения участков, состоящих из шума, в речевом файле
2.2. Разработка и создание программного обеспечения системы, позволяющего графически обнаружить участки, состоящие из шума, в речевом файле 24
2.2.1. Выбор состава технических и программных средств24
2.2.2. Описание системы25
2.3. Исследование качества графического способа выделения участков, состоящих из шума, в речевом файле 28
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ПРИЛОЖЕНИЕ


Любой речевой файл помимо основного контента (речи), как правило, содержит также участки, состоящие только из шума. Сегментация сигнала с целью выделения участков, содержащих речь, и участков, состоящих из шума, (далее - шумовые участки) является важным этапом в предварительной обработке звуковых сигналов. Обнаружение шумовых участков сигнала востребовано в качестве первого шага во многих задачах цифровой обработки сигналов, таких как задача улучшения качества речевого сигнала, задача распознавания речи и т.п., а также в программных комплексах, нацеленных на редактирование аудиоматериалов (например, Adobe Audition). В телекоммуникационных системах сегментация сигнала используется для уменьшения объема передаваемых данных благодаря исключению шумовых участков. В частности, она широко применяется в технологиях VoIP, ISDN, в сотовых системах связи [1]. Таким образом, на сегодняшний день проблема детектирования участков шума является достаточно актуальной и выбрана предметом настоящего исследования.
Предложено множество методов, решающих поставленную задачу. Ранние алгоритмы основывались на оценке таких характеристик сигнала, как кратковременная энергия сигнала (англ. short-term energy) [2], число переходов через ноль (англ. zero-krossing rate) [3]. Эти характеристики широко использовались в виду своей низкой вычислительной сложности. Однако у них был серьезный недостаток - они сильно зависели от уровня шума. Поэтому на смену им пришли алгоритмы, построенные на основе оценок спектральной энтропии [4], статистик высших порядков [5] и др. Предлагаются также решения с использованием алгоритмов машинного обучения с учителем, требующие достаточно больших вычислительных ресурсов: CART (Classification and Regression Tree) [6], ANN (Artificial Neural-Network) [7]. Помимо этого, некоторые методы используют модели шумов или вообще представляют собой объединение нескольких простых алгоритмов [8], [9].
Мотивацией данного исследования послужило отсутствие точного решения поднятой проблемы. Согласно [8], идеальный алгоритм обнаружения участков, состоящих из шума, должен иметь следующие характеристики:
• точность. Алгоритм должен давать как можно меньшую ошибку в классификации участков сигнала на шум и речь. Для оценки точности используются значения вероятности принятия участка речи за шумовой участок (ошибка первого рода) и вероятности принятия шумового участка за речевой (ошибка второго рода), а также значение отношения общей длины неправильно классифицированных участков к длине правильно классифицированных участков.
• низкая оценка сложности. Алгоритм должен быть прост в вычислительном смысле с целью возможности применения в реальном времени, т.е. алгоритм должен выполняться за минимально возможное время.
• возможность применения без информации о присутствующем шуме. Фоновый шум может быть различной формы и мощности, однако при работе алгоритма эти и другие характеристики шума не известны.
• устойчивость к ОСШ (отношение сигнал/шум - безразмерная величина, равная отношению мощности полезного сигнала к мощности шума [10]). Алгоритм должен одинаково хорошо работать как в случае высокого ОСШ, когда средняя амплитуда шума значительно меньше средней амплитуды речевого сигнала, так и в случае низкого ОСШ.
Несмотря на множественность предлагаемых алгоритмов, решения, удовлетворяющего всем указанным требованиям, нет. Это связано, в первую очередь, с некоторой противоречивостью выдвинутых критериев. Так, к примеру, при повышении уровня устойчивости к ОСШ и точности алгоритм неуклонно усложняется и становится более вычислительно затратным. И наоборот: простые методы сегментации обычно недостаточно точны и надежны, хотя порой они и дают лучший результат, нежели сложные алгоритмы. Поэтому в работе в качестве объекта исследования рассматривается новый способ обнаружения участков шума в речевом сигнале - графический. Предлагаемый метод основывается на предположении о том, что во временной области участки сигнала, состоящие только из шума, имеют прямоугольную форму, тогда как участки с речью, как правило, более неправильной формы. Предполагается, что такой метод даст результаты не хуже известных алгоритмов детектирования шума, таких как алгоритм на основе оценки энтропии («Robust entropy based endpoint detection for speech recognition in noisy environments» [4]), и алгоритм, построенный на базе MULSE («A new robust voice activity detection method based on genetic algorithm» [11]).
Цель работы - разработка и создание системы, позволяющей в речевом файле обнаружить графически участки чистого шума и выделить их. Поставленная цель предполагает выполнение следующих задач:
I. исследование проблемы выделения участков, состоящих из шума, в речевом файле;
II. разработка графического способа выделения участков, состоящих из шума, в речевом файле.
Таким образом, в первой главе работы исследуется проблема обнаружения участков, состоящих из шума, в речевом файле, и проводится ее комплексный анализ.
Во второй главе осуществляется разработка и создание программного обеспечения системы, позволяющего графически обнаружить участки, состоящие из шума, в речевом файле, а также исследуется качество графического способа в сравнении с методами [4] и [11].


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В работе изучена проблема обнаружения участков шума в речевом файле, проведен анализ ее условий и требований. Разработан и теоретически обоснован новый способ детектирования шумовых участков сигнала - графический, - а также создана открытая система, реализующая его. Рассмотрены и проанализированы основные методы решения поднятой проблемы, а также сформулированы основные критерии их оценки. Выявлены основные сложности, которые необходимо было учесть при разработке метода выделения в речевом файле участков, состоящих из шума.
Графический способ был протестирован на базе чистых от шума речевых сигналов, микшированных с шумом различной мощности, и сравнен с традиционными алгоритмами детектирования шума: алгоритмом, использующим контраст энтропии и алгоритмом, построенным на базе оценки MULSE.
Исследование показало возможность применения графического способа на практике. Разработанный метод по качеству работы не уступает алгоритмам на базе оценке энтропии и оценке MULSE, в некоторых случаях (уровень ОСШ 10-25) показывая лучшие результаты. Графический способ обнаружения участков шума речевого сигнала показал хорошие результаты даже в условиях низкого уровня ОСШ (<1), когда алгоритм на базе MULSE стал неприменим.
Таким образом, графический способ обнаружения участков шума достаточно точен, а также устойчив к относительно низкому уровню ОСШ. При этом среднее время работы метода составило всего 0.307 с., что делает возможным использование алгоритма на практике.



1. Будько М.Б. Алгоритм определения речевой активности и генератор комфортного шума высокого быстродействия // Научно-технический вестник информационных технологий, механики и оптики. 2006. №32 С.37-43.
2. J. Sohn, W. Sung A Voice Activity Detector Employing Soft Decision Based Noise Spectrum Adaption // IEEE International Conference on Acoustics Speech and Signal Processing. 1998. Vol. 1. Pp. 365-368.
3. L.R. Rabiner, M.R Sambur An algorithm for determining the endpoints of Isolated Utterances // The Bell System Technical Journal. 1975. Pp. 298¬315.
4. J. Shen, J. Hung, L. Lee Robust entropy based endpoint detection for speech recognition in noisy environments // International Conference on Spoken Language Processing. 1998.
5. K. Li, N. S. Swamy, M. O. Ahmad An improved voice activity detection using higher order statistics // IEEE Trans. Speech Audio Process. 2005. Pp. 965-974.
6. W. H. Shin Speech/non-speech classification using multiple features for robust endpoint detection // ICASSP. 2000.
7. G. D. Wuand, C. T. Lin Word boundary detection with mel scale frequency bank in noisy environment // IEEE Trans. Speechand Audio Processing. 2000.
8. M. H. Moattar, M. M. Homayounpour A simple but efficient real-time voice activity detection algorithm // Eusipco. 2009. Pp. 2549-2553.
9. Nitin, N. Lokhande, Navnath, S. Nehe, Pratap, S. Vikhe Voice Activity Detection Algorithm for Speech Recognition Applications // IJCA Proceedings on International Conference in Computational Intelligence. 2011.Vol. 6. Pp. 5-7.
10. Отношение сигнал/шум // Википедия. [2017—2017]. Дата обновления:
28.02.2017. URL: http://ru.wikipedia.org/?oldid=83971946(дата
обращения: 06.06.2017)
11. M. Farsinejad, M. Analoui A new robust voice activity detection method based on genetic algorithm // Australasian Telecommunication Networks and Applications Conference. 2008. Pp. 80-84.
12. А. Радзишевский Звук: немного теории // Upgrade - новый уровень ваших компьютеров. М., 2015.
13. Айчифер Э.С., Джервис Б.У. Цифровая обработка сигналов: практический подход. М.: Издательский дом «Вильямс», 2004. 992 с.
14. Mikko Myllymaki, Tuomas Virtanen Voice activity detection in the presence of breathing noise using neural network and hidden Markov model // Department of Signal Processing, Tampere University of Technology.
15. Zaur Nasibov Decision fusion of voice activity detectors // School of computing, University of Eastern Finland. Finland, 2012.
16. Yanna Ma, Akinori Nishihara Efficient voice activity detection algorithm using long-term spectral flatness measure // EURASIP Journal on Audio, Speech, and Music Processing. 2013.
17. В.Е. Гай, В.А. Утробин Методика выделения в звуковом сигнале участков речевой активности // Известия ВУЗов. Поволжский регион. Технические науки. 2011. №4 С.85-94.
18. R. Venkatesha Prasad, Abhijeet Sangwan, H.S. Jamadagni, Chiranth M.C, Rahul Sah, Vishal Gaurav Comparison of Voice Activity Detection Algorithms for VoIP // IEEE International Symposium on Computers and Communications. 2002.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ