ОПРЕДЕЛЕНИЯ, ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 3
ВВЕДЕНИЕ 3
1. ИССЛЕДОВАНИЕ СРЕДСТВ РАЗРАБОТКИ ДЛЯ РЕШЕНИЯ ЗАДАЧ
ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ 6
1.1. РАЗРАБОТКА ПРИЛОЖЕНИЙ И АЛГОРИТМОВ ДЛЯ ЦИФРОВОЙ ОБРАБОТКИ
СИГНАЛОВ 6
1.2. ИНСТРУМЕНТАРИЙ ДЛЯ ОБРАБОТКИ СИГНАЛОВ 7
2. КЛАССИФИКАЦИЯ ШУМОВ 7
3. ФОРМИРОВАНИЕ ТРАНСПОРТНОГО ШУМА 8
3.1. ОПРЕДЕЛЕНИЕ ЭКВИВАЛЕНТНОГО УРОВНЯ ЗВУКА 8
3.2. АНАЛИЗ ШУМОВОЙ ХАРАКТЕРИСТИКИ ТРАНСПОРТНОГО ПОТОКА 9
4. МЕТОДЫ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА 11
4.1. ОБОСНОВАНИЕ МОДЕЛИ ОБРАЗОВАНИЯ РЕЧИ 11
4.2. СПЕКТРАЛЬНЫЙ АНАЛИЗ РЕЧЕВОГО СИГНАЛА 12
5. ФИЛЬТРАЦИЯ СИГНАЛА ОТ ШУМОВ С ИСПОЛЬЗОВАНИЕМ
ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ 15
6. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА РЕЧЕВЫХ СИГНАЛОВ С ПОМОЩЬЮ MATLAB 15
6.1. АЛГОРИТМ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ 16
6.2. ИСПОЛЬЗОВАНИЕ MEL-ШКАЛЫ ЧАСТОТ 17
6.3. РЕЗУЛЬТАТ РЕАЛИЗАЦИИ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ18
ЗАКЛЮЧЕНИЕ 19
ПРИЛОЖЕНИЕ А. МОДЕЛЬ ТРАНСПОРТНОГО ШУМА 22
ПРИЛОЖЕНИЕ Б. ПОДАВЛЕНИЕ ШУМА ВОДЫ ИЗ РЕЧЕВОГО СИГНАЛА23
ПРИЛОЖЕНИЕ В. ПОДАВЛЕНИЕ ПРОИЗВОДСТВЕННОГО ШУМА ИЗ
РЕЧЕВОГО СИГНАЛА 26
ПРИЛОЖЕНИЕ Г. ПОДАВЛЕНИЕ ТРАНСПОРТНОГО ШУМА ИЗ РЕЧЕВОГО СИГНАЛА
Цифровая обработка сигналов базируется на математике 17 - 18 веков и сейчас является важным инструментом в различных областях науки и техники. Одной из самых востребованных областей цифровой обработки звука является шумоподавление.
Шумом называется нежелательный сигнал, который возникает при передаче или измерении другого, чистого сигнала. Из-за некачественной передачи информации может увеличиваться шум в сигнале.
Аддитивным является шум, который можно представить следующим уравнением x(t) = s(t) + w(t), где x(t) - зашумленный сигнал, s(t) - чистый сигнал, w(t) - сигнал шума, который не зависит от чистого сигнала. Шипение в микрофоне, гул электросетей являются примерами аддитивного шума.
Данная работа направлена на выработку методологии и исследование возможности устранения различных специфических видов шумов из аудиозаписи человеческой речи с использованием методов моделирования акустических аддитивных шумовых и преобразующих помеховых воздействий.
Объектом исследования является речевой сигнал, который подвергается влиянию акустических помех. В данной работе рассматривается транспортный шум, производственный шум и шум воды.
Предмет исследования - методы фильтрации речевых сигналов.
Методами исследования являются теоретические и экспериментальные методы исследования.
До сих пор ЦОС обычно выполнялась при помощи аналоговых устройств. Развитие другой точки зрения на ЦОС в дальнейшем было ускорено открытием в 1965 г. эффективных алгоритмов для вычислений преобразований Фурье. На данный момент для обработки сигналов применяют как старые, методы Ньютона и Гаусса, так и новые методы - цифровые ЭВМ и метод интегральных схем.
Адаптация методов из области обработки изображений под задачи аудио на данный момент является активно развивающейся областью.
Соответствующие алгоритмы нечасто встречаются в коммерческих программах. Исследование их работы - это важная и интересная задача.
Новизна данной работы заключается в альтернативном методе устранения шума программными средствами, а не аналоговыми устройствами. В связи с этим, получение новых научных результатов и методов в этой области является новой и актуальной задачей.
Шум всегда добавляется к речевым сигналам, которые передаются по каналам связи. Наличие шума с высокой интенсивностью может исказить результаты ЦОС. К примеру, если анализировать зашумленные записи преступлений или восстанавливать архивные аудиозаписи, то целью работы является лучшая фильтрация сигнала от шума. Значит актуальным направлением исследований является разработка методов устранения шума из сигнала.
Области применения цифровой обработки сигналов постоянно расширяются. Например, распознавание человеческой речи. Понятность человеческой речи играет важную роль в коммуникации, что одновременно является и мерой комфорта, и мерой понимания. Улучшение разборчивости речевого сигнала, уменьшая шумы, и компенсируя искажения, является основной задачей технологии шумоподавления, которая в настоящее время доступна через различные программные и аппаратные продукты.
Звукозаписывающие аппараты применяются особенно в области безопасности и правопорядка. Иногда аудиозапись может быть единственным доказательством угрозы безопасности или преступления, поэтому она становится ключевым элементом при анализе или последующем судебном разбирательстве. В таких случаях важно качество записи, речь должна быть ясной и понятной, чтобы информацию можно было легко распознать. Кроме того, разборчивость аудио доказательств является обязательным условием для судебного разбирательства, в противном случае они могут быть исключены из рассмотрения.
В ходе выполнения работы проведен предварительный анализ шумов. В качестве исследований выбраны транспортный шум, производственный шум и шум воды. В данной работе проанализирована и реализована модель транспортного шума в специализированном пакете прикладных программ Matlab.
Сегодняшний этап развития ЦОС связан с ЭВМ. В настоящее время с помощью голоса можно управлять компьютером и в дальнейшем общаться с компьютером интеллектуально при решении множества задач.
Фильтрация речевого сигнала состоит из трех частей: распознавание речи, понимание речи, синтез речи. Чтобы понимать речь нужно освоить фонетику, грамматику языка, а также правила семантической интерпретации.
Различные участки речевого тракта считаются источниками звука во время речеобразования. Необходимы три вида источника звука для речеобразования: голосовой источник, турбулентный и импульсный шумы [12]. В [12—14] указаны методы для представления согласных звуков.
Необходимо получить выходной сигнал как периодическую функцию с частотой и амплитудой с помощью фильтрации гармонических составляющих для определения параметров сигнала [13]. Данный метод актуален для вокализованного речевого сигнала.
Таким образом, разработка математических моделей, которые определяют сегменты речи, необходимые для речеобразования, является актуальным научным направлением в области математического моделирования речевых сигналов.
Целью данной выпускной квалификационной работы являлась выработка методологии и исследование возможности устранения различных специфических видов шумов из аудиозаписи человеческой речи с использованием методов моделирования акустических аддитивных шумовых и преобразующих помеховых воздействий.
В результате исследования были решены следующие задачи:
• Проведен предварительный анализ шумов, в качестве исследований выбраны транспортный шум, производственный шум и шум воды.
• Проанализирована и реализована модель транспортного шума в специализированном пакете прикладных программ Matlab (Приложение 1)
• Исследованы фильтры Калмана, преобразования Фурье, вейвлет- преобразования для выделения шумов.
• Разработана система шумоподавления, сочетающая в себе множество качественных и новых подходов для очистки аудиосигналов от шумов.
• Проведены тесты, подтверждающие высокую эффективность полученных алгоритмов.
• Построены оригинальные адаптивные методы для поиска шума, меняющегося во времени, благодаря которых повышается степень очистки от стационарных помех.
• Разработан и реализован алгоритм предварительной обработки речевых сигналов в среде MATLAB.
• Реализован метод устранения различных специфических видов шумов из аудиозаписи человеческой речи (Приложения 2-4).
Проведен сравнительный анализ научных источников и литературы, то есть использованы также теоретические методы исследования.
Важно было провести предварительный анализ шумов и их классификацию, чтобы понять основы технологии шумоподавления и успешно использовать его методы на практике для выбранных видов шумов.
Объектом исследования выступали транспортный шум, производственный шум и шум воды. Выбранные виды шумов были применены для тестирования построенных алгоритмов.
Цели исследований и выработки методологий достигнуты, поставленные задачи выполнены.
Основные результаты представлены в Приложениях.
В настоящее время ощущается недостаток научных данных для методов устранения шума программными средствами, поэтому получение новых научных результатов в области ЦОС очень важно.
Предложенная методика может эффективно использоваться для устранения других видов шумов. Использование новых методов очистки речевого сигнала при помощи вейвлет-анализа обработки речевых сигналов существенно повышает их точность и снижение искажений при дальнейшей обработке. C использованием вейвлет-преобразования достигается более глубокое подавление шума при сохранении структуры сигнала.
Автор выражает глубокую благодарность научному руководителю, Егорчеву Антону Александровичу, за постановку задачи и постоянное руководство работой, рецензенту Алехину Александру Павловичу за полезные советы и критические замечания, а также членам аттестационной комиссии, руководству университета и преподавателям.