Тема: Модуль голосовой идентификации диктора
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ЗАДАЧИ 5
1 Анализ системы 6
1.1 Анализ технического задания 6
1.2 Средства разработки 8
1.3 Методы выделения признаков речевого сигнала 11
1.3.1 Преобразование Фурье 11
1.3.2 Вейвлет-преобразование 14
1.3.3 Преобразование Гильберта-Хуанга 20
1.3.4 Выводы 27
2 Проектирование модуля голосовой идентификации диктора 28
2.1 Структурная схема 28
2.2 Алгоритм работы модуля 30
2.3 Методы классификации речевого сигнала 32
2.3.1 Dynamic Time Warping 33
2.3.2 Hidden Markov Model 35
2.3.3 Vector Quantization 36
2.3.4 Support Vector Machine 38
2.3.5 Gaussian Mixture Model 40
2.3.6 Нейронная сеть 43
3 Программная реализация 53
3.1 Описание работы программы 53
3.2 Создание речевой базы для тестирования 58
3.3 Оценка качества работы модуля идентификации 60
3.4 Вывод 62
ЗАКЛЮЧЕНИЕ 63
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 64
ПРИЛОЖЕНИЕ А 66
📖 Введение
Несмотря на уникальность голоса человека, ни одна из СГИД, как и любая другая биометрическая система, не может гарантировать 100% надёжность идентификации. Основными источниками ошибок в СГИД являются: окружение (шум, реверберация и т.д.); особенности речи (длительность, тональность, уровень голосового усилия и т.д.); канал связи (искажения микрофона и канала передачи, погрешности кодирования аудио сигнала и т.д.) [2].
В общем случае идентификация личности по голосу требует решения большого числа разнородных задач, основными из которых являются следующие:
- выделение вокализованных участков аудио сигнала путём отбрасывания пауз и участков, содержащих различного рода помехи;
- разделение речи дикторов (задача диаризации);
- выделение характерных признаков голоса диктора.
Применение технологии идентификации и верификации диктора
позволяет:
• осуществить тексто- и языконезависимую идентификацию диктора;
• выделить из общего объёма данных звуковые файлы, содержащие речь интересующего диктора;
• подтвердить принадлежность звуковых данных тому или иному диктору;
• снизить риск пропуска файла с речью диктора из-за перегруженности операторов;
• обработать большое количество речевой информации и подготовить данные для дальнейшей обработки оператором
ЗАДАЧИ
• Разработать метод выделения признаков речевого сигнала,позволяющий проводить идентификацию дикторов;
• проанализировать существующие подходы и выбрать алгоритм классификации пользователей по их голосовым характеристикам;
• разработать модуль голосовой идентификации диктора на рабочей среде MATLAB, в дальнейшем подключаемого к системе распознавания речи, с целью повышения качества распознавания;
• внедрить дополнительный этапа классификации диктора в систему распознавания речи — повышение качества распознавания речи за счёт выбора оптимального классификатора, обученного на речевом материале, с схожими с диктором голосовыми характеристиками;
• определить качество распознавания модуля идентификации диктора.



