Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА МОДЕЛИ ГОЛОСОВОГО УПРАВЛЕНИЯ АВТОМОБИЛЕМ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА

Работа №73852

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы96
Год сдачи2017
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
334
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
ГЛАВА 1 РАСПОЗНАВАНИЕ РЕЧИ И ЕГО ПРИМЕНЕНИЕ В МОДЕЛЯХ
ГОЛОСОВОГО УПРАВЛЕНИЯ 6
1.1 Классификация систем распознавания речи 8
1.2 Методы и алгоритмы распознавания речи 9
1.3 Голосовое управление автомобилем: значение, возможности,
применение 26
ГЛАВА 2 ТЕОРЕТИЧЕСКИЙ ОБЗОР ВОЗМОЖНОСТИ РЕАЛИЗАЦИИ
СИСТЕМЫ ГОЛОСОВОГО УПРАВЛЕНИЯ НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА 29
2.1 Основы субполосного анализа речевых сигналов 30
2.1.1 Селекция пауз между звуками речи 33
2.1.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона 35
2.2 Голосовое управление в существующих системах 42
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ 45
3.1 Субполосный метод сегментации (1) 45
3.2 Субполосный метод сегментации (2) 47
3.3 Особенность локальных минимумов распределения кратковременной
энергии речевого сигнала 48
ГЛАВА 4 РЕАЛИЗАЦИЯ МОДЕЛИ ГОЛОСОВОГО УПРАВЛЕНИЯ АВТОМОБИЛЕМ 49
ЗАКЛЮЧЕНИЕ 71
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 73
ПРИЛОЖЕНИЕ А


Практически каждый день появляются новые возможности чтобы улучшить жизнь человека и внедрить в нее новые технологии и системы, что делает ее более удобной и комфортной. Распознавание голосовых команд является актуальным вопросом при разработке многих передовых технологий. Важным направлением автоматизированных систем, является создание систем голосового управления. Такие системы находят применение в: пунктах пропуска, в системе умный дом, в голосовом управлении мобильным телефоном, в повседневной жизни людей с ограниченными возможностями и т.д. Так, данное направление применяется даже в космонавтике, для управления механизмами в невесомости, когда космонавт находится в безопорном положении. К недостаткам существующих систем можно отнести высокую стоимость реализации голосового управления и недостаточно высокую степень распознавания голосовых команд. Автомобиль в современном обществе уже не роскошь и присутствует практически в каждой семье, а зачастую и не в одном экземпляре. Автомобили, управляемые вручную пытаются усовершенствовать, внедряя «умную» электронику, для упрощения управления до подачи голосовых команд. Однако, несмотря на то, что современная наука достигла очень высокого уровня, все еще довольно редко в повседневной жизни можно встретить транспортное средство, оснащенное системой распознавания голоса и управления с его помощью бортовыми командами. Ведущие автоконцерны мира, такие как Mercedes, BMW, Ford, стремятся к повышению комфорта и безопасности водителя, для этого используется качественная система управления бортовой электроникой при помощи голосовых команд («включи радио, включи следующую станцию, позвонить, номер»). Однако существующие системы распознавания голоса в автомобилях не всегда соответствуют желаемому водителем качеству. В существующих системах голосового управления зачастую пренебрегают индивидуальными особенностями речи человека, поэтому, предлагается использовать метод, учитывающий распределение долей энергии речевого сигнала по частотным интервалам, и использовать эту особенность для верной идентификации сказанной фразы.
Целью данной научно-исследовательской работы является разработка системы голосового управления автомобилем на основе субполосного анализа и оценка ее работоспособности.
Основными задачами работы являются:
а) анализ существующих способов распознавания речи
б) анализ голосового управления автомобилем в существующих системах
в) реализация модели голосового управления в системе Matlab
г) проведение оценки эффективности разработанного метода
Объект исследования — распознавание речи.
Предметом исследования является речевой сигнал.
Методами исследования, использующимися при выполнении научно-исследовательской работы, являются:
1) анализ учебно-методической литературы, учебных пособий, электронных ресурсов;
2) изучение принципов составления и вычислительных алгоритмов;
3) проведение вычислительного эксперимента в соответствии с темой магистерской диссертации, представляющее собой компьютерное моделирование в программной среде MatLab.
Данная исследовательская работа состоит из двух основных частей: теоретической и практической.
В теоретической части научно-исследовательской работы описывается система голосового управления автомобилем, ее принципы и существующие разработки от ведущих мировых компаний, анализируются существующие методы распознавания речи, на которых может быть основано голосовое управление автомобилем, рассматриваются основы субполосного анализа на котором и основан предлагаемый метод,
В практической части ведется разработка модели голосового управления автомобилем на основе субполосного анализа, оцениваются полученные результаты и принимается решение о качестве работы данного метода.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В результате магистерской диссертации была реализована модель голосового управления автомобилем, включающая в себя управление: звонками мобильного телефона, выбором треков в магнитоле, навигацию. Были решены поставленные в магистерской диссертации задачи.
Был проведен анализ литературных источников, который показал, что в настоящее время существуют различные методы и алгоритмы распознавания речи, однако, все они не лишены недостатков.
Так же в работе была осуществлена реализация модели голосового управления в системе Matlab.
На первом этапе реализации произнесённое слово (позвонитьмузыканавигация) сегментировалось тремя методами сегментации. Затем полученные границы сегментов объединялись, и используя некоторые принципы, происходило сокращение лишних границ. Далее для каждого из полученных сегментов вычислялась корреляция с каждым из эталонных звуков или сочетанием звуков и принималось решение о том какой именно звук был произнесен. В итоге, слово из словаря наиболее похожее на слово, полученное эмпирически, принималось как произнесенное диктором.
На втором этапе происходила такая же процедура для следующих групп слов:
1) Работа, Семья, Друзья, Службы, Не выбрано
2) Грот, Король и Шут, Ленинград
3) Харьковская гора, Центр, Крейда
На третьем этапе происходила аналогичная процедура распознавания для группы слов указанной на рисунке 14.
В результате проделанных экспериментов можно сделать следующий вывод:
Данный метод подходит для распознавания речи диктора в задачах голосового управления диктором и обеспечивает хороший уровень распознавания команд. Однако, данный метод зависим от размера словаря. Расширение базы слов, приводит к уменьшению вероятности правильного распознавания звука и снижению быстродействия системы. Но при этом, точности данного метода достаточно для распознавания слов при изменении диктора.



1. Аграновский, А.В. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов [Текст]/ А.В. Аграновский, Д.А. Леднов - М.: Радио и связь, 2004. - 164 с.
2. Винцюк, Т.К., Анализ, распознавание и интерпретация речевых сигналов [Текст]/ Т.К. Винцюк - Киев: Наук.думка, 1987. - 264с.
3. Голд, Б. Цифровая обработка сигналов [Текст] / Б. Голд, Ч. Рейдер. - М.: Сов. Радио, 1973. - 368 с.
4. Сорокин В.Н., Цыплихин А.И. Сегментация и распознавание гласных. // Информационные процессы, т. 4 , № 2, с. 202-220, 2004 г.
5. Жиляков, Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным [моногр.]/Е.Г. Жиляков. - Белгород: Изд-во БелГУ, 2007. - 160 с.
6. Жиляков, Е.Г. Методы обработки речевых данных в информационно - телекоммуникационных системах на основе частотных представлений [Текст]/ Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко. - Белгород: Изд-во БелГУ, 2007. - 136 с.
7. Жиляков, Е.Г. Сегментация речевых сигналов на основе анализа распределения энергии по частотным интервалам [Текст] / Е.Г. Жиляков, Е.И. Прохоренко, А.В. Болдышев, А.А. Фирсова, М.В. Фатова // Научные ведомости Белгородского государственного университета. Серия: История. Политология. Экономика. Информатика, Том 18 - 2011. - №7-1 (102). - С. 187¬196
8. Кипяткова, И.С. Автоматическая обработка разговорной русской речи: монография / И.С. Кипяткова, А.Л. Ронжин, А.А. Карпов. СПИИРАН. - СПб.: ГУАП, 2013. - 314 с.
9. Куприянов, М.С. Цифровая обработка сигналов: процессоры, алгоритмы, средства проектирования [Текст] / М.С. Куприянов. - СПб.: Политехника, 1999. - 592 с.
10. Лайонс, Р. Цифровая обработка сигналов / Лайонс Р; - 2-е изд. ; Пер. с англ. - М.: ООО "Бином-Пресс", 2006 - 656 с.: ил.
11. Марпл-мл, С.Л. Цифровой спектральный анализ и его приложения / Марпл-мл. С.Л.; Пер. с англ. -М.: Мир, 1990.
12. Михайлов В.Г., Златоусов Л.В. Измерение параметров речи [текст]/ В.Г. Михайлов, Л.В. Златоусова; Под.ред. М.А. Сапожникова. - Москва: Радио и связь, 1987. - 168с.: ил.
13. Рабинер Л. Р., Шафер Р.В. Цифровая обработка речевых сигналов = В1дйа1ргосе551пдо15реесЙ51дпа15[текст]/ Л.Р. Рабинер, Р.В. Шафер.;Пер. с англ.М.В. Назарова, Ю.Н. Прохорова; Под ред. М.В.Назарова, Ю.Н. Прохорова. - Москва: Радио и связь, 1981. - 496с.:ил.
15. Сергиенко А.Б. Цифровая обработка сигналов: учебное пособие. — 3-е изд.— М.: БХВ-Петербург, 2011. — 768 с.
16. Солонина, А.И. Основы цифровой обработки сигналов [Текст]/ А.И. Солонина, Д.А. Улахович, С.М. Арбузов, Е.Б.Соловьева. - СПб.: БХВ- Петербург, 2005. - 768с.: ил.
17. Ю.Лабунец В. Г. Алгебраическая теория сигналов и систем. Красноярск: Изд-во Краснояр. ун-та, 1984.
18. Цемелъ Г. И. Опознавание речевых сигналов. М., Наука, 1971.
19. Шелепов В.Ю. Новые алгоритмы сегментации речевого сигнала и распознавания некоторых классов фонем / В.Ю. Шелепов, А.В. Ниценко // Искусственный интеллект. - 2007. - № 1. - С. 213-224.
20. Шелепов В.Ю. Новые алгоритмы распознавания фонем и их классов, поиск слова по его смешанной транскрипции при распознавании слов большого словаря / В.Ю. Шелепов, А.В. Ниценко,
А.В. Жук // Искусственный интеллект. - 2007. - № 2. - С. 139-147.
21. Шелепов В.Ю. О распознавании фонем с помощью анализа речевого сигнала в частотной и временной областях. Приложение к распознаванию синтаксически связных фраз / В.Ю. Шелепов, А.В. Ниценко, А.В. Жук, Д.С. Азаренко // Речевые технологии. - 2008.- № 2. - С. 43-52
22. Жиляков Е.Г., Фирсова А.А.. Сегментация речевых сигналов на основе субполосного анализа // Вестник НТУ "ХПИ", № 39 (1012). - 2013г. - С.73-81 .
23. Фирсова А.А. Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов / Фирсова А.А.//Автореферат диссертации на соискание ученой степени кандидата технических наук. 17 мая 2013 г. - Белгород. - С.15-19.
24. Музычук Д.С. Сегментация, шумоподавление и фонетический анализ в задаче распознавания речи [Текст] / Музычук Д.С., Медведев М.С. // Молодой ученый. - 2013. - №6. - С. 86-96.
25. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование. //Успехи физических наук, т. 171, №5 с. 465-500, 2001 г.
26. Ермоленко Т.Н. Алгоритмы сегментации с применением быстрого вейвлет- преобразования / Т.Н. Ермоленко, В.И. Шевчук // Статьи, принятые к публикации на сайте международной конференции Диалог’2003.
27. Шелухин О.И. Цифровая обработка и передача речи [Текст]. / Лукьянцев Н.Ф..- М.: Радио и связь, 2000.- 454 с.
28. Жиляков, Е.Г. Вариационные методы частотного анализа звуковых сигналов [Текст]. / Белов С.П., Прохоренко Е.И. // Труды учебных заведений связи. СПб, 2006. -№ 174.-С.163-170.
29. Жиляков Е.Г. Бабаринов С.Л. Чадюк П.В. Исследование сервиса компании Google Inc. по распознаванию русской речи / Жиляков Е.Г. Бабаринов С.Л. Чадюк П.В // Научные ведомости Белгородского государственного университета. Серия: История. Политология. Экономика. Информатика № 15-1 (158)/ - том 27. - 2013
30. Жиляков Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным на основе частотных представлений. - Белгород: Изд-во БелГУ, 2007. - с. 160
31. Цыплихин А.И. Системный анализ, управление и обработка информации,- 2006.
32. Фирсова А.А. О различиях распределения энергии звуков русской речи и шума / А.В. Болдышев, А.А. Фирсова // Материалы 12-ой Международной конференции и выставки "Цифровая обработка сигналов и ее применение. -"DSPA'2010". - Москва. - 2010. - С. 204-207.
33. Сорокин В.К. Синтез речи. М. : Наука, 1992. С. 392
34. Цыплихин А.И. Анализ и автоматическая сегментация речевого сигнала: дис. канд. тех. наук / ИХ ШИ РАН. - М., 2006. - 149 с.
35. А. С. Колоколов. Обработка сигнала в частотной области при распознавании речи.- 2006. - с. 13-18
36. Конев А. А. Параметрическое описание сегментов речевого сигнала / В. И. Голубев, А. А. Конев // Научная сессия ТУСУР - 2005: Материалы Всероссийской научно-технической конференции студентов, аспирантов и молодых специалистов - Томск: Издательство ТУСУРа, 2005. - С. 113- 116.
37. Кочаров Д.А. Автоматическая интерпретация звуков речи // Диссертационная работа.- СПбГУ 2008
38. Утробин В.А., Гай В.Е. Алгоритм выделения вокализованных участков речевого сигнала // Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 6 (1). С. 175-179
39. Мясникова Е.Н. Объективное распознавание звуков речи Л.: «Энергия», 1967. - 150 с.
40. Черник, Н. Н. Сегментация спонтанной речи в языках различных типов / Н. Н. Черник // Вестник Белорусского государственного экономического университета. - 2009. - N 4. - С. 101-107.
41. Ли У. А. Методы автоматического распознавания речи. М., Мир, 1983.
42. Огнев И.В., Огнев А.И., Парамонов П.А., Классификация речевых
образов на основе анализа распределений их локальных экстремумов //131труды XXI международной научно-технической
конференции"Информационные средства и технологии". - М.: МЭИ, 2013 - с. 53-57.
43. Винцюк Т.К., Анализ, распознавание и интерпретация речевых сигналов, — Киев: Наукова думка, 1987. - 264 стр.
44. Бондаренко Л. В., Вербицкая Л. А., Гордина М. В., Основы общей фонетики. - М.: Академия, 2004. - 160 с.
45. Шарий Т.В., О проблеме параметризации речевого сигнала в современных системах распознавания речи // В1сник Донецького Нацюнального Университету, 2008, вып. 2, стр. 536-541
46. Маркел Дж. Д., Грэй А. Х., Линейное предсказание речи. - М.: Связь, 1980. - 308 с.
47. Загоруйко Н. Г., Методы распознавания и их применение. - М.: Советское радио, 1972. - 208 с.
48. Агашин О.С., Корелин О.Н., Методы цифровой обработки речевого сигнала в задаче распознавания изолированных слов с применением сигнальных процессоров // Труды Нижегородского государственного технического университета им. Р.Е. Алексеева № 4, 2012, с. 32-44
49. . Ронжин А.Л., Ли И. В. Автоматическое распознавание русской речи //Вестник Российской академии наук, 2007, том 77, № 2, с. 133-138.
50. Огнев И. В., Парамонов П.А. Исследование способов представления числа для реализации арифметических операций в ассоциативной среде с командным управлением // Информационные средства и технологии: труды Международной научно-технической конференции (19 - 21 октября 2010 г.): в 3 т. - М.: МЭИ, 2010. - 1 т. - с. 54-60.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ