РАЗРАБОТКА АЛГОРИТМА СЖАТИЯ ЗВУКОВЫХ СИГНАЛОВ НА ОСНОВЕ МЕТОДОВ СУБПОЛОСНОГО АНАЛИЗА
|
ВВЕДЕНИЕ 3
1 АЛГОРИТМЫ И МЕТОДЫ СЖАТИЯ РЕЧЕВЫХ СИГНАЛОВ 5
1.1 Фильтрация на основе КИХ-фильтров 7
1.2 Субполосное преобразование на основе использования банков КИХ-
фильтров 13
2 ИССЛЕДОВАНИЕ СУБПОЛОСНОГО АЛГОРИТМА СЖАТИЯ
ЗВУКОВЫХ СИГНАЛОВ 18
2.1 Расчёт вектора субполосного преобразования отрезка речево-го сигнала
на основе КИХ-фильтров 18
2.2 Субполосное преобразование со сжатием 22
3 АНАЛИЗ РЕЗУЛЬТАТОВ РАБОТЫ АЛГОРИТМОВ СЖАТИЯ
ЗВУКОВЫХ СИГНАЛОВ 27
3.1 Частотный анализ восстановленных звуковых сигналов 27
3.2 Оценка погрешности восстановления, коэффициента сжатия и качества
воспроизведения сигналов 35
4 ЭКОНОМИЧЕСКАЯ ОЦЕНКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ 39
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 47
ПРИЛОЖЕНИЯ
1 АЛГОРИТМЫ И МЕТОДЫ СЖАТИЯ РЕЧЕВЫХ СИГНАЛОВ 5
1.1 Фильтрация на основе КИХ-фильтров 7
1.2 Субполосное преобразование на основе использования банков КИХ-
фильтров 13
2 ИССЛЕДОВАНИЕ СУБПОЛОСНОГО АЛГОРИТМА СЖАТИЯ
ЗВУКОВЫХ СИГНАЛОВ 18
2.1 Расчёт вектора субполосного преобразования отрезка речево-го сигнала
на основе КИХ-фильтров 18
2.2 Субполосное преобразование со сжатием 22
3 АНАЛИЗ РЕЗУЛЬТАТОВ РАБОТЫ АЛГОРИТМОВ СЖАТИЯ
ЗВУКОВЫХ СИГНАЛОВ 27
3.1 Частотный анализ восстановленных звуковых сигналов 27
3.2 Оценка погрешности восстановления, коэффициента сжатия и качества
воспроизведения сигналов 35
4 ЭКОНОМИЧЕСКАЯ ОЦЕНКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ 39
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 47
ПРИЛОЖЕНИЯ
В последние годы можно наблюдать взрывной рост в использовании сети
Интернет и мобильных телефонов, а сближение двух этих технологий открывает широкий диапазон новых возможностей на уже процветающем рынке мультимедиа. Важной составляющей мультимедийного трафика является аудиоинформация [9]. Таким образом, актуальной является задача сжатия (кодирование) звуковых сигналов.
Сжатие - одна из задач, решаемых в отрасли телекоммуникаций [8].
Необходимость сжатия присутствует как в коммуникациях, так и в самой
информатике. Оказывается, немыслимым реализовывать переносы на высоких
скоростях через сеть компьютеров без использования какой-то тип сжатия, которое позволяло бы уменьшить время передачи.
То же самое происходит с устройствами хранения, которые, несмотря на
то, что их объем постоянно увеличивается, позволяют гораздо более эффективно использовать вышеупомянутую технику.
При передаче сигналов различных типов, необходимо оптимизировать
характеристики сигнала с целью трансляции большего количества информации.
Обычно это осуществляется посредством какого-либо метода сжатия, который
обеспечивал бы минимум ошибок при восстановлении.
Согласно общей теореме передачи информации [8] всегда возможно передавать информацию на скорости меньшей, чем способность канала с относительно маленькой ошибкой, даже в присутствии шума.
Понятие пропускной способности канала также, как и размер информации и кодификации изучаются в теории информации.
Средства передачи сигналов, которые используются ежедневно: электромагнитные волны, проводные металлические линии передачи и оптоволокна.
Место, которое занимает кодифицированная информация (данные, цифровой сигнал, и т.д.) без сжатия – частное (отношение) между частотой отсчетов и разрешением. Следовательно, чем больше количество использованных
бит, тем больше будет размер файла. Сжатие используется для того, чтобы передавать то же количество исходной информации, меньшим количеством бит
[6].
Сжатие аудиосигналов (АС) может быть осуществлено как без потерь
(архивация), так и с потерями, причем к последнему случаю относится субполосное преобразование.
Цель данной работы является разработка алгоритма сжатия звуковых сигналов с использованием метода субполосного преобразования для уменьшения
объема данных, сохраняемых на внешних носителях информации.
Для достижения поставленной цели были определены следующие задачи:
1. Исследование методов сжатия звукового сигнала на основе субполосного кодирования;
2. Разработка алгоритмов сжатия речевого сигнала с использованием
субполосного преобразования на основе КИХ-фильтрации;
3. Экономическая оценка результатов исследования.
Интернет и мобильных телефонов, а сближение двух этих технологий открывает широкий диапазон новых возможностей на уже процветающем рынке мультимедиа. Важной составляющей мультимедийного трафика является аудиоинформация [9]. Таким образом, актуальной является задача сжатия (кодирование) звуковых сигналов.
Сжатие - одна из задач, решаемых в отрасли телекоммуникаций [8].
Необходимость сжатия присутствует как в коммуникациях, так и в самой
информатике. Оказывается, немыслимым реализовывать переносы на высоких
скоростях через сеть компьютеров без использования какой-то тип сжатия, которое позволяло бы уменьшить время передачи.
То же самое происходит с устройствами хранения, которые, несмотря на
то, что их объем постоянно увеличивается, позволяют гораздо более эффективно использовать вышеупомянутую технику.
При передаче сигналов различных типов, необходимо оптимизировать
характеристики сигнала с целью трансляции большего количества информации.
Обычно это осуществляется посредством какого-либо метода сжатия, который
обеспечивал бы минимум ошибок при восстановлении.
Согласно общей теореме передачи информации [8] всегда возможно передавать информацию на скорости меньшей, чем способность канала с относительно маленькой ошибкой, даже в присутствии шума.
Понятие пропускной способности канала также, как и размер информации и кодификации изучаются в теории информации.
Средства передачи сигналов, которые используются ежедневно: электромагнитные волны, проводные металлические линии передачи и оптоволокна.
Место, которое занимает кодифицированная информация (данные, цифровой сигнал, и т.д.) без сжатия – частное (отношение) между частотой отсчетов и разрешением. Следовательно, чем больше количество использованных
бит, тем больше будет размер файла. Сжатие используется для того, чтобы передавать то же количество исходной информации, меньшим количеством бит
[6].
Сжатие аудиосигналов (АС) может быть осуществлено как без потерь
(архивация), так и с потерями, причем к последнему случаю относится субполосное преобразование.
Цель данной работы является разработка алгоритма сжатия звуковых сигналов с использованием метода субполосного преобразования для уменьшения
объема данных, сохраняемых на внешних носителях информации.
Для достижения поставленной цели были определены следующие задачи:
1. Исследование методов сжатия звукового сигнала на основе субполосного кодирования;
2. Разработка алгоритмов сжатия речевого сигнала с использованием
субполосного преобразования на основе КИХ-фильтрации;
3. Экономическая оценка результатов исследования.
Всегда возможно передавать информацию на скорости меньшей, чем способность канала с относительно маленькой ошибкой, даже в присутствии шума.
Этого добиваются посредством кодирования информации, которая поставляет
единообразный формат для различных типов сигналов.
Одним из способов эффективного кодирования речевых сигналов является субполосное кодирование (субполосное преобразование). Он классифицируется в кодификаторы формы волны (кодирование формы сигнала), которые пытаются произвести сигнал как можно ближе к оригиналу. Основной интерес в
применении к цифровой телефонии.
Практическое применение этого метода сжатия позволит ускорить процесс обмена информацией (речь) в обществе, а также уменьшить объем памяти,
необходимой для хранения речевых данных.
При выполнении данной выпускной квалификационной работы было исследовано сжатие звуковых сигналов субполосным анализом, основанным на
использовании КИХ-филтров. Недостатком такого подхода является наличие
эффекта элайзинга, то есть наложения частот, и как следствие, ухудшение качества воспроизводимой речи.
Структура работы состоит из введения с актуальностью выбранной темы,
указаны цель и задачи исследования; четырех глав, каждая из которых последовательно отражает логический анализ нормативного, практического и научного
материала. Первая глава посвящена общим сведениям о алгоритмах и методах
сжатия звуковых сигналов. Вторая глава посвящена исследованию выбранного
субполосного метода сжатия звуковых сигналов, пишется алгоритмы и приведены результаты работы алгоритмов. Третья глава посвящена анализу результатов работы алгоритмов сжатия звуковых сигналов. В четвёртой главе дается
экономическая оценка результатов исследования (продолжительность вательских работ составила 53 дней, сметы расходов на исследование – 87045
рублей).
В практической части работы выполнили сжатие речевого сигнала с учетом два аспекта децимации выходных последовательностей КИХ-фильтров:
- В первом случае рассматривается сжатие сигнала с одинаковым количеством частотных интервалов R при децимации. Качество воспроизведения сигнала сохраняется. Получили коэффициент сжатия приблизителен 1. Можно и
сказать, что сжатие не происходит.
- Во втором случае рассматривается сжатие сигнала с различным количеством частотных интервалов R при децимации (учитывается коэффициент децимации). Погрешность восстановления увеличивается почти в 2 раза, чем в
первом случае. Коэффициент сжатия достигает значения свыше 1,5. Качество
воспроизведения сигнала теряется при сжатии. Сигналы восстановляются воспринимаемыми после их сжатия, но с терпимыми ошибками.
Листинги программы для сжатия звуковых сигналов, написаны в
MATLAB, есть в приложениях и все шаги выполнения работы в пояснительной
записке.
При выполнении работы проходили исследование методов сжатия звукового сигнала на основе субполосного кодирования, выполнили разработку алгоритмов сжатия речевого сигнала с использованием субполосного преобразования на основе КИХ-фильтрации, и дали экономическую оценку результатов
исследования. Таким образом можно сделать вывод, что цели выпускной квалификационной работы достигнуты и все поставленные задачи выполнены.
Этого добиваются посредством кодирования информации, которая поставляет
единообразный формат для различных типов сигналов.
Одним из способов эффективного кодирования речевых сигналов является субполосное кодирование (субполосное преобразование). Он классифицируется в кодификаторы формы волны (кодирование формы сигнала), которые пытаются произвести сигнал как можно ближе к оригиналу. Основной интерес в
применении к цифровой телефонии.
Практическое применение этого метода сжатия позволит ускорить процесс обмена информацией (речь) в обществе, а также уменьшить объем памяти,
необходимой для хранения речевых данных.
При выполнении данной выпускной квалификационной работы было исследовано сжатие звуковых сигналов субполосным анализом, основанным на
использовании КИХ-филтров. Недостатком такого подхода является наличие
эффекта элайзинга, то есть наложения частот, и как следствие, ухудшение качества воспроизводимой речи.
Структура работы состоит из введения с актуальностью выбранной темы,
указаны цель и задачи исследования; четырех глав, каждая из которых последовательно отражает логический анализ нормативного, практического и научного
материала. Первая глава посвящена общим сведениям о алгоритмах и методах
сжатия звуковых сигналов. Вторая глава посвящена исследованию выбранного
субполосного метода сжатия звуковых сигналов, пишется алгоритмы и приведены результаты работы алгоритмов. Третья глава посвящена анализу результатов работы алгоритмов сжатия звуковых сигналов. В четвёртой главе дается
экономическая оценка результатов исследования (продолжительность вательских работ составила 53 дней, сметы расходов на исследование – 87045
рублей).
В практической части работы выполнили сжатие речевого сигнала с учетом два аспекта децимации выходных последовательностей КИХ-фильтров:
- В первом случае рассматривается сжатие сигнала с одинаковым количеством частотных интервалов R при децимации. Качество воспроизведения сигнала сохраняется. Получили коэффициент сжатия приблизителен 1. Можно и
сказать, что сжатие не происходит.
- Во втором случае рассматривается сжатие сигнала с различным количеством частотных интервалов R при децимации (учитывается коэффициент децимации). Погрешность восстановления увеличивается почти в 2 раза, чем в
первом случае. Коэффициент сжатия достигает значения свыше 1,5. Качество
воспроизведения сигнала теряется при сжатии. Сигналы восстановляются воспринимаемыми после их сжатия, но с терпимыми ошибками.
Листинги программы для сжатия звуковых сигналов, написаны в
MATLAB, есть в приложениях и все шаги выполнения работы в пояснительной
записке.
При выполнении работы проходили исследование методов сжатия звукового сигнала на основе субполосного кодирования, выполнили разработку алгоритмов сжатия речевого сигнала с использованием субполосного преобразования на основе КИХ-фильтрации, и дали экономическую оценку результатов
исследования. Таким образом можно сделать вывод, что цели выпускной квалификационной работы достигнуты и все поставленные задачи выполнены.



