Тип работы:
Предмет:
Язык работы:


Применение преобразования Huang-Hilbert в задаче распознавания дикторов

Работа №77767

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы27
Год сдачи2016
Стоимость4300 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
22
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
ПОСТАНОВКА ЗАДАЧИ 5
ИЗВЛЕЧЕНИЕ ПРИЗНАКОВ 6
Empirical Mode Decomposition 6
Спектральный анализ Гильберта 12
ДИСКРИМИНАНТНАЯ ФУНКЦИЯ 14
K-means 14
Decision Tree 15
РЕАЛИЗАЦИЯ 17
ЭКСПЕРИМЕНТЫ 18
ВЫВОДЫ 21
ЗАКЛЮЧЕНИЕ 22
СПИСОК ЛИТЕРАТУРЫ 23
ПРИЛОЖЕНИЕ

Голос - уникальный идентификатор личности, один из немногих фактор, по которому мы можем узнать человека. Каждый человек имеет индивидуальные голосовые характеристики, которые определяются особенностями строения его голосовых органов. Когда мы разговариваем с друзьями, мы с легкостью можем определить, кто из них сейчас говорит, но для вычислительной техники эта задача является не тривиальной. Различный темп, громкость голоса, эмоции человека, или его состояние, все это меняет характеристики, что иногда даже самому человеку сложно определить говорящего.
Задача распознавания диктора возникла много лет назад и с каждым годом ее актуальность растет. Появляются все более интересные и новые способы решения данной задачи и области ее применения.
Задача распознавания диктора существует уже более 40 лет и является актуальной в настоящее время. Производиться множество исследований данной области и за последние годы наблюдается улучшение качества распознавания диктора, но задача все еще остается не решенной. Разрабатываются все новые походы и алгоритмы решения, дорабатываются и улучшаются уже существующие.
Распознавание личности по голосу находит применение во многих сферах:
• Безопасность
• Телематика
• Банковские технологии
• Электронная коммерция
• Криминалистика и судебная экспертиза
В основе задачи распознавания диктора лежит анализ сигнала, с помощью которого выявляются основные характеристики диктора. Наиболее распространёнными методами анализа сигнала являются, преобразование Фурье, вейвлет-преобразование и преобразование Хуанг-Гильберта(HHT).
Преобразования Фурье раскладывает сигнал на гармонические составляющие.
Гармонические базисные функции разложения не способны отображать перепады сигналов с бесконечной крутизной типа прямоугольных импульсов, т.к. для этого требуется бесконечно большое число членов ряда. Преобразование Фурье отображает глобальные сведения о частотах исследуемого сигнала и не дает представления о локальных свойствах сигнала при быстрых временных изменениях его спектрального состава. Оно не имеет возможности анализировать частотные характеристики сигнала в произвольные моменты времени.
Вейвлет-преобразование является обобщением спектрального анализа. В основе которого, лежит преобразование Фурье. В отличие от Фурье, вейвлет- преобразование применимо к нелинейным сигналам и достаточно локализовано как по частоте, так и по времени. Базисные функции могут определяться не единственным способом.
Цель HHT (Hilbert-Huang Transform) [2] продемонстрировать альтернативный способ представления спектрального анализа для описания частотно-временных- энергетических данных временных рядов. Кроме того, метод пытается описать нестационарные данные локально. Вместо Фурье или вейвлетов, преобразование Гильберта было использовано для того, чтобы вычислить мгновенные частоты и амплитуды и описать сигнал более локально. Для HHT не нужно выбирать базисные функции, что облегчает метод разложения.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной курсовой работы проводились исследования по решению задачи идентификации диктора с помощью преобразования Хуанга-Гильберта. Были достигнуты следующие цели:
1) Изучение литературы по обработке речевых сигналов и распознаванию дикторов. Рассмотрение существующих подходов и векторов признаков, используемых для идентификации говорящего.
2) Изучение преобразования Хуанга-Гильберта. Рассмотрение вариаций остановки алгоритма.
3) Реализация алгоритма на языке Python. Для реализации была использована версия Python 2.7 и ряд других библиотек для работы со звуков (scipy), машинным обучением (scikit-learn). Так же была использована библиотека PyHHT для реализации преобразования Хуанга-Гильберта.
4) Проведение экспериментов для исследования достоверности и скорости работы алгоритма. Были рассмотрены различные параметры алгоритма, для которых будет исследована достоверность и скорость работы.
5) Также рассмотрены и изучены такие методы классификации, как K-means и Decision Tree
В результате был произведен полный обзор предметной области и реализованы методы разложения сигнала на внутренние моды и спектральный анализ Гильберта. Данный метод не дает высоких результатов и требует дальнейшей исследовательской работы.
Задача распознавания диктора является актуальной задачей, и разработка данного алгоритма является неплохим решением данной задачи



1. Huang Xuedong. Spoken language processing: a guide to theory, algorithm, and system development. 2001
2. Zuocai Wang. Hilbert Transform applications in signal analysis and non-parametric identification of linear and nonlinear systems. 2011
3. Bradley Lee Barnhart. The Hilbert-Huang Transform: theory,
applications, developme
http://scikit-learn. org/stable/modules/tree.html
http://scikit-learn.org/stable/modules/clustering.html


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ