Тема: РАЗРАБОТКА ПРОГРАММНОГО СРЕДСТВА СИНТЕЗА РЕЧИ ДЛЯ ТАТАРСКОГО ЯЗЫКА
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. Теоретический обзор технологий синтеза речи 4
1.1 История развития синтеза речи 4
1.2 Классификация подходов к построению системы синтеза речи 5
2. Архитектура системы нейросетевого синтеза речи 12
2.1 Подготовка обучающих данных 12
2.2 Построение нейросетевых моделей речи 23
3. Программная реализация системы синтеза речи 28
3.1 Программные средства для формирования обучающих данных 28
3.3 Оценка качества системы синтеза татарской речи 30
ЗАКЛЮЧЕНИЕ 33
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
📖 Введение
Исследования в области речевых технологий подпитываются растущей значимостью новых приложений. К ним относятся услуги поиска информации по телефону, публичные объявления в таких местах, как вокзалы, автобусы, метрополитен, инструменты для чтения электронных писем, факсов, веб¬страниц, голосовой вывод в системах автоматического перевода, специальное оборудование для людей с физическими недостатками. При помощи электронных словарей и переводчиков, имеющих синтезатор речи, становится возможным изучение иностранных языков с постановкой правильного произношения.
Уровень развития речевых технологий сильно различается между языками. Например, в России несмотря на наличие 7 языков на которых говорят более миллиона людей, качество программных средств в области речевых технологий примерно сравнимое с мировыми аналогами сопоставимо только для русского языка. Слабый уровень развития информационных технологий в языках способствует их вытеснению ведущими мировыми языками.
Цель синтеза речи - автоматическое формирование речевого сигнала по печатному тексту. Много подходов и алгоритмов предложено в этой области. В первых системах синтеза речи упор делался на разборчивость речи, а теперь внимание уделяется на естественность звучания.
Разработанная автором система синтеза татарской речи производит синтез произвольного текста без специальной предварительной разметки. Система является востребованной, если получателем информации является человек.
Подтверждением актуальности проведенных исследований является большое количество докладов на тему синтеза речи на международных научных конференциях, и высокая потребность рынка в программных средствах.
Целью диссертационной работы является создание программных средств синтеза естественной татарской речи на основе нейронных сетей глубокого обучения.
Для достижения поставленной цели в диссертационной работе необходимо решить следующие задачи:
1. Разработать программные средства синтеза татарской речи на основе нейронных сетей глубокого обучения.
2. Провести экспериментальные исследования и оценку качества синтезируемой речи.
Новизна:
- разработан алгоритм представления структуры татарских слов;
- разработан алгоритм фонетической разметки татарских текстов;
- формирование описания лингвистических и акустических характеристик татарского языка;
✅ Заключение
Результаты экспериментов показали, что двунаправленные рекуррентные сети, основанные на LSTM, дают лучший результат естественности звучания татарского языка по сравнению с другими популярными архитектурами нейронных сетей в области синтеза речи. Синтезируемая речь приближена к естественной, механический голос присущий вокодерным системам синтеза речи минимален. При решении задач получены следующие практические результаты:
1) Разработан алгоритм представления структуры татарских слов.
2) Разработан алгоритм фонетической разметки татарских текстов.
3) Сформировано описание лингвистических и акустических характеристик татарского языка.
4) Разработаны программные средства синтеза татарской речи, основанной на нейронных сетях глубокого обучения. Программные средства реализованы модульно, что дает возможность распределения процесса разработки в будущем и упрощает тестирование.



