Тема: Модуль голосовой идентификации диктора
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Анализ системы 7
1.1 Анализ технического задания 7
1.2 Методы выделения признаков речевого сигнала 9
1.2.1 Преобразование Фурье 9
1.2.2 Вейвлет-преобразование 12
1.2.3 Преобразование Гильберта-Хуанга 19
1.2.4 Вывод 20
1.3 Средства разработки 22
2 Проектирование модуля голосовой идентификации диктора 25
2.1 Структурная схема 25
2.2 Алгоритм работы модуля 27
2.3 Методов классификации речевого сигнала 29
2.3.1 Динамическая трансформация шкалы времени 29
2.3.2 Скрытая Марковская модель 29
2.3.3 Вектор квантования 30
2.3.4 Нейронная сеть 30
2.3.5 Вывод 40
3 Программная реализация 41
3.2 Оценка качества работы модуля идентификации 46
3.3 Вывод 47
Заключение 48
Список используемых источников 49
Приложение А 51
📖 Введение
Несмотря на уникальность голоса человека, ни одна из СГИД, как и любая другая биометрическая система, не может гарантировать 100% надёжность идентификации. Основными источниками ошибок в СГИД являются: окружение (шум, реверберация и т.д.); особенности речи (длительность, тональность, уровень голосового усилия и т.д.); канал связи (искажения микрофона и канала передачи, погрешности кодирования аудио сигнала и т.д.) [2].
В общем случае идентификация личности по голосу требует решения большого числа разнородных задач, основными из которых являются следующие:
- выделение вокализованных участков аудио сигнала путём отбрасывания пауз и участков, содержащих различного рода помехи;
- разделение речи дикторов (задача диаризации);
- выделение характерных признаков голоса диктора.
Применение технологии идентификации и верификации диктора
позволяет:
• осуществить тексто- и языконезависимую идентификацию диктора;
• выделить из общего объёма данных звуковые файлы, содержащие речь интересующего диктора;
• подтвердить принадлежность звуковых данных тому или иному диктору;
• снизить риск пропуска файла с речью диктора из-за перегруженности операторов;
• обработать большое количество речевой информации и подготовить данные для дальнейшей обработки оператором[14].



