РАЗРАБОТКА МОДЕЛИ ГОЛОСОВОГО УПРАВЛЕНИЯ АВТОМОБИЛЕМ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА
|
ВВЕДЕНИЕ 3
ГЛАВА 1 РАСПОЗНАВАНИЕ РЕЧИ И ЕГО ПРИМЕНЕНИЕ В МОДЕЛЯХ
ГОЛОСОВОГО УПРАВЛЕНИЯ 6
1.1 Классификация систем распознавания речи 8
1.2 Методы и алгоритмы распознавания речи 9
1.3 Голосовое управление автомобилем: значение, возможности,
применение 26
ГЛАВА 2 ТЕОРЕТИЧЕСКИЙ ОБЗОР ВОЗМОЖНОСТИ РЕАЛИЗАЦИИ
СИСТЕМЫ ГОЛОСОВОГО УПРАВЛЕНИЯ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА 29
2.1 Основы субполосного анализа речевых сигналов 30
2.1.1 Селекция пауз между звуками речи 33
2.1.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона 35
2.2 Голосовое управление в существующих системах 42
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ 45
3.1 Субполосный метод сегментации (1) 45
3.2 Субполосный метод сегментации (2) 47
3.3 Особенность локальных минимумов распределения кратковременной
энергии речевого сигнала 48
ГЛАВА 4 РЕАЛИЗАЦИЯ МОДЕЛИ ГОЛОСОВОГО УПРАВЛЕНИЯ АВТОМОБИЛЕМ 49
ЗАКЛЮЧЕНИЕ 71
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 73
ПРИЛОЖЕНИЕ А
ГЛАВА 1 РАСПОЗНАВАНИЕ РЕЧИ И ЕГО ПРИМЕНЕНИЕ В МОДЕЛЯХ
ГОЛОСОВОГО УПРАВЛЕНИЯ 6
1.1 Классификация систем распознавания речи 8
1.2 Методы и алгоритмы распознавания речи 9
1.3 Голосовое управление автомобилем: значение, возможности,
применение 26
ГЛАВА 2 ТЕОРЕТИЧЕСКИЙ ОБЗОР ВОЗМОЖНОСТИ РЕАЛИЗАЦИИ
СИСТЕМЫ ГОЛОСОВОГО УПРАВЛЕНИЯ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА 29
2.1 Основы субполосного анализа речевых сигналов 30
2.1.1 Селекция пауз между звуками речи 33
2.1.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона 35
2.2 Голосовое управление в существующих системах 42
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ 45
3.1 Субполосный метод сегментации (1) 45
3.2 Субполосный метод сегментации (2) 47
3.3 Особенность локальных минимумов распределения кратковременной
энергии речевого сигнала 48
ГЛАВА 4 РЕАЛИЗАЦИЯ МОДЕЛИ ГОЛОСОВОГО УПРАВЛЕНИЯ АВТОМОБИЛЕМ 49
ЗАКЛЮЧЕНИЕ 71
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 73
ПРИЛОЖЕНИЕ А
Практически каждый день появляются новые возможности чтобы улучшить жизнь человека и внедрить в нее новые технологии и системы, что делает ее более удобной и комфортной. Распознавание голосовых команд является актуальным вопросом при разработке многих передовых технологий. Важным направлением автоматизированных систем, является создание систем голосового управления. Такие системы находят применение в: пунктах пропуска, в системе умный дом, в голосовом управлении мобильным телефоном, в повседневной жизни людей с ограниченными возможностями и т.д. Так, данное направление применяется даже в космонавтике, для управления механизмами в невесомости, когда космонавт находится в безопорном положении. К недостаткам существующих систем можно отнести высокую стоимость реализации голосового управления и недостаточно высокую степень распознавания голосовых команд. Автомобиль в современном обществе уже не роскошь и присутствует практически в каждой семье, а зачастую и не в одном экземпляре. Автомобили, управляемые вручную пытаются усовершенствовать, внедряя «умную» электронику, для упрощения управления до подачи голосовых команд. Однако, несмотря на то, что современная наука достигла очень высокого уровня, все еще довольно редко в повседневной жизни можно встретить транспортное средство, оснащенное системой распознавания голоса и управления с его помощью бортовыми командами. Ведущие автоконцерны мира, такие как Mercedes, BMW, Ford, стремятся к повышению комфорта и безопасности водителя, для этого используется качественная система управления бортовой электроникой при помощи голосовых команд («включи радио, включи следующую станцию, позвонить, номер»). Однако существующие системы распознавания голоса в автомобилях не всегда соответствуют желаемому водителем качеству. В существующих системах голосового управления зачастую пренебрегают индивидуальными особенностями речи человека, поэтому, предлагается использовать метод, учитывающий распределение долей энергии речевого сигнала по частотным интервалам, и использовать эту особенность для верной идентификации сказанной фразы.
Целью данной научно-исследовательской работы является разработка системы голосового управления автомобилем на основе субполосного анализа и оценка ее работоспособности.
Основными задачами работы являются:
а) анализ существующих способов распознавания речи
б) анализ голосового управления автомобилем в существующих системах
в) реализация модели голосового управления в системе Matlab
г) проведение оценки эффективности разработанного метода
Объект исследования — распознавание речи.
Предметом исследования является речевой сигнал.
Методами исследования, использующимися при выполнении научно-исследовательской работы, являются:
1) анализ учебно-методической литературы, учебных пособий, электронных ресурсов;
2) изучение принципов составления и вычислительных алгоритмов;
3) проведение вычислительного эксперимента в соответствии с темой магистерской диссертации, представляющее собой компьютерное моделирование в программной среде MatLab.
Данная исследовательская работа состоит из двух основных частей: теоретической и практической.
В теоретической части научно-исследовательской работы описывается система голосового управления автомобилем, ее принципы и существующие разработки от ведущих мировых компаний, анализируются существующие методы распознавания речи, на которых может быть основано голосовое управление автомобилем, рассматриваются основы субполосного анализа на котором и основан предлагаемый метод,
В практической части ведется разработка модели голосового управления автомобилем на основе субполосного анализа, оцениваются полученные результаты и принимается решение о качестве работы данного метода.
Целью данной научно-исследовательской работы является разработка системы голосового управления автомобилем на основе субполосного анализа и оценка ее работоспособности.
Основными задачами работы являются:
а) анализ существующих способов распознавания речи
б) анализ голосового управления автомобилем в существующих системах
в) реализация модели голосового управления в системе Matlab
г) проведение оценки эффективности разработанного метода
Объект исследования — распознавание речи.
Предметом исследования является речевой сигнал.
Методами исследования, использующимися при выполнении научно-исследовательской работы, являются:
1) анализ учебно-методической литературы, учебных пособий, электронных ресурсов;
2) изучение принципов составления и вычислительных алгоритмов;
3) проведение вычислительного эксперимента в соответствии с темой магистерской диссертации, представляющее собой компьютерное моделирование в программной среде MatLab.
Данная исследовательская работа состоит из двух основных частей: теоретической и практической.
В теоретической части научно-исследовательской работы описывается система голосового управления автомобилем, ее принципы и существующие разработки от ведущих мировых компаний, анализируются существующие методы распознавания речи, на которых может быть основано голосовое управление автомобилем, рассматриваются основы субполосного анализа на котором и основан предлагаемый метод,
В практической части ведется разработка модели голосового управления автомобилем на основе субполосного анализа, оцениваются полученные результаты и принимается решение о качестве работы данного метода.
В результате магистерской диссертации была реализована модель голосового управления автомобилем, включающая в себя управление: звонками мобильного телефона, выбором треков в магнитоле, навигацию. Были решены поставленные в магистерской диссертации задачи.
Был проведен анализ литературных источников, который показал, что в настоящее время существуют различные методы и алгоритмы распознавания речи, однако, все они не лишены недостатков.
Так же в работе была осуществлена реализация модели голосового управления в системе Matlab.
На первом этапе реализации произнесённое слово (позвонитьмузыканавигация) сегментировалось тремя методами сегментации. Затем полученные границы сегментов объединялись, и используя некоторые принципы, происходило сокращение лишних границ. Далее для каждого из полученных сегментов вычислялась корреляция с каждым из эталонных звуков или сочетанием звуков и принималось решение о том какой именно звук был произнесен. В итоге, слово из словаря наиболее похожее на слово, полученное эмпирически, принималось как произнесенное диктором.
На втором этапе происходила такая же процедура для следующих групп слов:
1) Работа, Семья, Друзья, Службы, Не выбрано
2) Грот, Король и Шут, Ленинград
3) Харьковская гора, Центр, Крейда
На третьем этапе происходила аналогичная процедура распознавания для группы слов указанной на рисунке 14.
В результате проделанных экспериментов можно сделать следующий вывод:
Данный метод подходит для распознавания речи диктора в задачах голосового управления диктором и обеспечивает хороший уровень распознавания команд. Однако, данный метод зависим от размера словаря. Расширение базы слов, приводит к уменьшению вероятности правильного распознавания звука и снижению быстродействия системы. Но при этом, точности данного метода достаточно для распознавания слов при изменении диктора.
Был проведен анализ литературных источников, который показал, что в настоящее время существуют различные методы и алгоритмы распознавания речи, однако, все они не лишены недостатков.
Так же в работе была осуществлена реализация модели голосового управления в системе Matlab.
На первом этапе реализации произнесённое слово (позвонитьмузыканавигация) сегментировалось тремя методами сегментации. Затем полученные границы сегментов объединялись, и используя некоторые принципы, происходило сокращение лишних границ. Далее для каждого из полученных сегментов вычислялась корреляция с каждым из эталонных звуков или сочетанием звуков и принималось решение о том какой именно звук был произнесен. В итоге, слово из словаря наиболее похожее на слово, полученное эмпирически, принималось как произнесенное диктором.
На втором этапе происходила такая же процедура для следующих групп слов:
1) Работа, Семья, Друзья, Службы, Не выбрано
2) Грот, Король и Шут, Ленинград
3) Харьковская гора, Центр, Крейда
На третьем этапе происходила аналогичная процедура распознавания для группы слов указанной на рисунке 14.
В результате проделанных экспериментов можно сделать следующий вывод:
Данный метод подходит для распознавания речи диктора в задачах голосового управления диктором и обеспечивает хороший уровень распознавания команд. Однако, данный метод зависим от размера словаря. Расширение базы слов, приводит к уменьшению вероятности правильного распознавания звука и снижению быстродействия системы. Но при этом, точности данного метода достаточно для распознавания слов при изменении диктора.
Подобные работы
- ИССЛЕДОВАНИЕ ПРИЗНАКОВ РЕЧЕВЫХ СИГНАЛОВ ДЛЯ ЗАДАЧ РАСПОЗНАВАНИЯ РЕЧИ
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4270 р. Год сдачи: 2017



