Тип работы:
Предмет:
Язык работы:


Адаптация произносительного словаря для автоматического распознавания разных типов речи

Работа №129568

Тип работы

Магистерская диссертация

Предмет

лингвистика

Объем работы69
Год сдачи2021
Стоимость5400 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
14
Не подходит работа?

Узнай цену на написание


Введение 4
Глава 1. Автоматическое распознавание речи и автоматическая обработка транскрипций 6
1.1. Задачи автоматического распознавания речи 6
1.2. Краткая историческая справка 7
1.3. Устройство системы АРР 8
1.4. Произносительный словарь 14
1.5. Автоматическое создание транскрипций 17
1.5.1. Системы, работающие по правилам 18
1.5.2. Машинное обучение 19
1.5.3. Оценка автоматически созданного словаря 20
1.6. Обзор существующих систем АРР 21
1.7. Выводы по главе 1 22
Глава 2. Фонетические особенности русской спонтанной речи 24
2.1. Фонетическая система русского языка 24
2.2. Междикторская и внутридикторская вариативность 26
2.3. Фонетические особенности русской разговорной речи 27
2.4. Особенности реализации окончаний прилагательных 30
2.6. Выводы по главе 2 31
Глава 3. Автоматическое создание произносительного словаря 32
3.1. Материал исследования 32
3.2. Инструменты для автоматического создания транскрипций 34
3.2.1. Взвешенные конечные преобразователи 35
3.2.2. Двунаправленные сети с долгой краткосрочной памятью 36
3.3. Инструменты для автоматического распознавания речи 38
3.4. Использованное оборудование 38
3.5. Автоматическое создание транскрипций 39
3.5.1. Автоматическое создание идеальных транскрипций 39
3.5.2. Автоматическое создание реальных транскрипций 42
3.6. Анализ необходимого объёма данных для обучения системы G2P 46
3.7. Использование произносительных вариантов для морфем 47
3.8. Выводы по главе 3 50
Заключение 52
Список литературы 54
Приложение. Варианты произносительных словарей для распознавания окончаний прилагательных 63

Данная работа посвящена вопросам адаптации и оптимизации произносительных словарей для систем автоматического распознавания (АРР) русской речи применительно к разным её типам. Известно, что на речь человека влияет множество факторов, и это в немалой степени касается её фонетической стороны. В зависимости от речевой ситуации одни и те же лексические единицы могут реализовываться в различных формах; более того, зачастую эти формы значительно отличаются от вариантов, предложенных в орфоэпических словарях.
Системы автоматического распознавания речи чаще всего пользуются именно такими орфоэпическими транскрипциями, что не может не отражаться на качестве распознавания. Поиск транскрипций, которые бы наилучшим для системы АРР образом отражали реальное произношение, является актуальным и на сегодняшний день [Adda-Decker, Lamel, 2018; Lukes и др., 2018], и не в меньшей степени он является актуальным для русского языка, который характеризуется разного рода фонетическими процессами: изменение гласных вследствие коартикуляционных процессов, их редукция в безударном положении, ассимилятивные изменения согласных и др.
Объектом данного исследования является автоматическое распознавание речи; предметом — методы адаптации произносительных словарей и зависимость качества распознавания от использования тех или иных словарных транскрипций.
Целью исследования является поиск способов оптимизации существующих словарей или создания новых таким образом, чтобы результирующий словарь обеспечил улучшение качества автоматического распознавания.
Для достижения данной цели были выполнены следующие задачи:
1. Обзор литературы, описывающей существующие методы и подходы к распознаванию речи, а также созданию и модификации транскрипций;
2. Обзор литературы, описывающей особенности русского языка, отражение которых в произносительном словаре могло бы повысить качество распознавания;
3. Предложение способов создания или модификации произносительного словаря;
4. Проведение экспериментов по автоматическому созданию транскрипций и автоматическому распознаванию речи;
5. Подведение итогов экспериментального исследования и оценка предложенных методов.
Результаты данного исследования могут помочь в создании новых систем АРР, адаптированных под разные типы речи, а также в создании систем автоматического выравнивания.
Работа состоит из введения, трёх глав и заключения. В первой главе освещены устройство систем распознавания речи, особенности создания словарей для задач АРР, методы автоматического создания транскрипций. Во второй главе рассмотрены фонетические характеристики и особенности русской разговорной речи, имеющие значение для поставленной задачи. В третьей главе описаны материал и методика исследования, освещены поставленные эксперименты и приведены их результаты.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе было проведено исследование методов адаптации произносительного словаря для автоматического распознавания разных типов речи. В ходе исследования были сделаны следующие выводы:
1. Для автоматического создания транскрипций можно применять методы машинного обучения. Обучающим материалом в данном случае могут стать как аннотации размеченных вручную фонетических корпусов, так и результаты работы транскрипторов, основанных на правилах; в каждом случае результирующая система будет отражать транскрипционные конвенции, использованные при создании обучающего материала. Для качественной работы такой системы необходим материал в объёме тысяч словоупотреблений.
2. Возможно также применять методы машинного обучения для генерации реальных транскрипций на основе идеальных или орфографии. Так же, как и в предыдущем случае, значительную роль играет фактор объёма доступного обучающего материала. Вероятно, в данном случае минимальный объём обучающих данных несколько выше, чем в предыдущем.
3. Созданные таким образом транскрипции можно использовать для задач автоматического распознавания речи, однако от качества модели будет зависеть и качество распознавания. Наилучшие результаты показали словари, созданные на основе реальной фонемной транскрипции из корпуса CORPRES, причём генерация транскрипции могла происходить как из орфографической записи, так и из орфоэпической фонемной транскрипции. Наихудшие же результаты показали словари, основанные на реальной фонетической транскрипции из корпуса INTAS. Это возможно объяснить как недостатком обучающего материала ввиду маленького объёма корпуса INTAS, так и повышенным фактором неопределённости системы в силу большей точности транскрипции.
4. Изменение вариантов произношения отдельных морфем в словарях может влиять на качество распознавания речи; поиск таких вариантов представляет собой перспективное направление исследований. Показано, что для наилучшего качества распознавания окончаний форм прилагательных необходимы словари, содержащие различные варианты транскрипций, как орфоэпических, так и отражающих реальные произносительные варианты.
Полученные выводы могут служить основой для дальнейших исследований по созданию различных вариантов систем создания автоматической транскрипции для русского языка, что потенциально имеет приложения не только в области автоматического распознавания речи, но также синтеза и выравнивания (т. е. автоматической расстановки границ); последняя задача является важной для проведения многих исследований акустических особенностей языков.


1. Андросова С. В. и др. Реализация фонетических единиц в информационной структуре высказывания // 2006.
2. Апушкина И. Е. Качество гласных и восприятие словесного ударения в спонтанной речи // Вестник Санкт-Петербургского Университета Язык И Литература. 2011. № 4.
3. Болотова О. Б. Гласные в спонтанной речи и при чтении связного текста (экспериментально-фонетическое исследование на материале русского языка) // 2005.
4. Бондарко Л. В. и др. Стили произношения и типы произнесения // Вопросы Языкознания. 1974. Т. 2. С. 64—70.
5. Бондарко Л. В. Звуковой строй современного русского языка. : Просвещение, 1977.
6. Васильева Л. А., Тананайко С. О. Морфонологические факторы и редукция безударных гласных в нормативной русской речи // Филологические Науки Вопросы Теории И Практики. 2009. № 1. С. 32—36.
7. Васильева Л. А., Тананайко С. О. Специфика реализации заударных звуковых последовательностей в слитной речи // Филологические Науки Вопросы Теории И Практики. 2010. № 2. С. 31—33.
8. Венцов А. В. и др. Корпус русских спонтанных текстов: структура и единицы // Корпусная лингвистика-2013. , 2013. С. 223—230.
9. Горлова А. А., Слепокурова Н. А. Редукция предударных компонентов словоформ в спонтанной речи // Шестой междисциплинарный семинар «Анализ разговорной русской речи» (АР3-2012). , 2012. С. 15—20.
10. Евдокимова В. В., Скрелин П. А., Чукаева Т. В. Автоматический адаптивный фонетический транскриптор для русского языка // Анализ разговорной русской речи (АР3-2017). , 2017. С. 32—39.
11. Ерофеева Е. В. Вероятностные структуры идиомов: социолингвистический аспект. Пермь: Издательство Пермского университета, 2005. 320 с.
12. Кипяткова И. С., Карпов А. А. Модуль фонематического транскрибирования для системы распознавания разговорной русской речи // 2008.
13. Кипяткова И. С., Карпов А. А. Аналитический обзор систем распознавания русской речи с большим словарем // Труды СПИИРАН. 2010. № 12. С. 7—20.
14. Кипяткова И. С., Карпов А. А. Методология оценивания работы систем автоматического распознавания речи // Известия Высших Учебных Заведений Приборостроение. 2012. Т. 55. № 11. С. 38—43.
15. Кипяткова И. С., Карпов А. А. Разновидности глубоких искусственных нейронных сетей для систем распознавания речи // Труды СПИИРАН. 2016. Т. 6. № 49. С. 80—103.
...


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ