Тема: Разработка сервиса для генерации русской речи с применением нейросетевых технологий
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Описание предметной области 8
1.2. Обзор методов реализации синтеза речи 9
1.2.1. Конкатенативный подход 9
1.2.2. Параметрический подход 10
1.3. Обзор аналогов 12
2. ПРОЕКТИРОВАНИЕ 14
2.1. Требования к проектируемому сервису 14
2.2. Диаграмма вариантов использования 15
2.3. Топологии нейронных сетей 15
2.3.1. Модель-синтезатор 17
2.3.2. Модель-вокодер 19
2.4. Архитектура сервиса 20
3. РЕАЛИЗАЦИЯ 22
3.1. Программные средства реализации 22
3.2. Реализация нейронных сетей 23
3.2.1. Обучающий набор данных 23
3.2.2. Обучение базовых нейронных сетей 27
3.2.3. Обучение конечных искусственных сетей 28
3.3. Реализация микросервисов 30
4. ТЕСТИРОВАНИЕ 33
4.1. Тестирование нейронных сетей 33
4.2. Тестирование сервиса генерации речи 34
ЗАКЛЮЧЕНИЕ 36
ЛИТЕРАТУРА 37
📖 Введение
В современном мире набирают популярность все возможные голосовые помощники. Они осуществляют запись на прием ко врачу, обслуживают нас в гос. учреждениях. Они же помогают людям с ограниченными возможностями пользоваться услугами, которые раньше были для них недоступны.
Однако, все эти голосовые ассистенты невозможны без технологии генерации речи. Во время разработки помощника невозможно записать все возможные фразы, которые он будет произносить (имена, адреса, стоимость услуг). Сервисы синтеза речи стали неотъемлемой частью подобных решений и бурно развиваются в последнее время. Более того, они стали почти безальтернативным вариантом в вопросе взаимодействия с пользователем.
Таким образом, становится актуальной задача разработки системы способной генерировать качественный и человечный голос.
Постановка задачи
Целью выпускной квалификационной работы является разработка сервиса для генерации русской речи с применением нейросетевых технологий. Для достижения поставленной цели необходимо решить следующие задачи:
1) описать предметную область и разобрать аналоги;
2) спроектировать архитектуру сервиса, основанную на микросервисах;
3) спроектировать топологии для нейронных сетей и определить метрики для их оценки;
4) разработать микросервисы сервиса генерации русской речи;
5) разработать и протестировать искусственные нейронные сети;
6) протестировать сервис генерации русской речи.
Структура и содержание работы
Работа состоит из введения, трех глав, заключения и списка литературы. Объем работы составляет 39 страниц, объем списка литературы – 37 источников.
В первой главе содержится разбор предметной области, обзор методов, применяемых для реализации системы синтеза речи, а также рассматриваются аналогичные решения на рынке.
Вторая глава посвящена определению функциональных и нефункциональных требований, разработке топологии нейронной сети, а также проектированию сервиса генерации русской речи.
В третьей главе содержатся подробности и особенности обучения нейронных сетей и реализации сервиса.
Четвертая глава описывает процесс оценки искусственных нейронных сетей, а также сервиса генерации русской речи.
В заключении подводятся итоги полученных в процессе работы результатов, описываются планы для будущих улучшений сервиса.
✅ Заключение
1. Описана предметная область и рассмотрены аналоги.
2. Спроектирована архитектура сервиса, основанная на микросервисах.
3. Спроектированы топологии для нейронных сетей и определены метрики для их оценки.
4. Разработаны микросервисы сервиса генерации русской речи.
5. Разработаны и протестированы искусственные нейронные сети.
6. Протестирован сервис генерации русской речи.
Разработанная в данной работе система в настоящий момент интегрирована во внутренний контур компании ООО фирма «Интерсвязь». В будущем планируется продолжать разработку и оптимизировать скорость работы сервиса генерации речи. Также планируется расширить функционал системы возможностью управления ударным словом.
В рамках работы были опубликованы следующие статьи.
1. Kuzmin A.D., Ivanov S.A. Transfer Learning for the Russian Language Speech Synthesis. // 2021 International Conference on Quality Management, Transport and Information Security, Information Technologies (IT&QM&IS), 2021. – 507–510 pp.
Также в рамках данной работы были проведены выступления на следующих мероприятиях.
2. Пятая конференция «IT.IS» для специалистов IT-компаний, 29 октября 2021, диплом спикера.



