Тип работы:
Предмет:
Язык работы:


Разработка алгоритмического обеспечения идентификации личности по голосу для санкционирования доступа к информации

Работа №172387

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы86
Год сдачи2017
Стоимость4290 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
1
Не подходит работа?

Узнай цену на написание


Введение 5
Глава 1. Обзор существующих моделей авто- распознавания голоса 7
1.1 Структура систем распознавания дикторов 7
1.2 Dynamic Time Warping 12
1.3 Hidden Markov Model 14
1.4 Vector Quantization 18
1.5 Support Vector Machine 20
1.6 Gaussian Mixture Model 23
1.7 Выводы 27
Глава 2. Компьютерное моделирование модели идентификации личности по
голосу 30
2.1 Предварительная обработка 30
2.2 Признаки речевого сигнала 35
2.3 Определение алгоритма инициализации и оценки параметров модели 46
2.4 Определение числа компонентов модели гауссовых смесей 50
2.5 Тестирование модели личности по голосу 50
2.6 Выводы 51
Глава 3. Результаты компьютерного моделирования модели идентификации личности по голосу 53
3.1 Схема работы модели идентификации личности по голосу 53
3.2 Листинг программы 57
3.3 Результат работы программы 57
3.4 Расчет затрат на программно - аппаратную часть 62
3.5 Выводы 66
Глава 4. Безопасность жизнедеятельности 67
4.1 Общие требования 67
4.2 Неблагоприятные факторы и средства защиты от них 67
4.3 Выводы 70
Заключение 71
Список используемой литературы 72
Приложение А 75


Речь - неотъемлемый элемент человеческой деятельности, который позволяет человеку познавать окружающий мир, передавать свои знания и опыт другим людям. Устная речь - это высказывания в звуковой форме, которые становятся возможными благодаря голосовому аппарату человека.
Любой человек имеет свои особенные голосовые характеристики, определяющиеся индивидуальным строением его голосовых органов. В процессе общения человек способен на подсознательном уровне различать голоса любых людей, но тем не менее, эта задача для вычислительной техники является нетривиальной.
Известно, что задача распознавания личности по голосу была поставлена более 40 лет назад, но до сих пор продолжаются исследования в данной области. За последние годы качество распознавания речевой информации значительно возросло, однако главная проблема автоматического распознавания диктора в любой среде до сих пор далека от идеального решения. Поэтому актуальны не только исследования уже существующих алгоритмов, но и поиск новых решений в данной области.
Задачей распознавания личности по голосу является выделение, классифицирование и реагирование на речь человека из входного звукового потока. При этом обычно выделяется две подзадачи: идентификация и верификация.
Кроме этого, система распознавания может быть разделена на текстозависимую и текстонезависимую. При текстозависимом распознавании используются как фиксированные фразы, так и фразы, которые были сгенерированы системой и были предложены пользователю. Текстонезависимые системы нужны для обработки произвольной речи.
В данной работе рассматривается задача автоматической идентификации диктора и реализуется алгоритм, который решает задачу текстонезависимой идентификации.
Распознавание личности по голосу может найти применение во многих сферах: криминалистика и судебная экспертиза, безопасность, банковские технологии, электронная коммерция.
Речь представляет собой сложный сигнал, который образуется в результате преобразований, происходящих на разных уровнях: семантическом, языковом, артикуляционном (уровень голосового аппарата человека) и акустическом (уровень физических свойств звука). Различия в этих преобразованиях приводят к различиям в свойствах речевого сигнала. При решении задачи распознавания диктора по голосу данные отличия могут использоваться с целью выделения индивидуальных характеристик голоса человека.
Целью данной работы является разработка программного средства идентификации личности по голосу. Для достижения указанной цели в работе решаются следующие задачи:
— Исследуются существующие методы решения задачи идентификации личности по голосу, способы оценки их качества, а также существующие проблемы и ограничения;
— Реализовывается один из лучших алгоритмов идентификации личности по голосу;
— Разрабатывается обучающая и тестовая выборки, позволяющие наиболее полно оценить все преимущества и недостатки реализованного алгоритма.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной работы проводились исследования существующих методов решения задачи автоматической идентификации диктора по голосу.
В работе был проведен полный обзор предметной области. Реализовался один из лучших алгоритмов, который можно использовать для решения поставленной задачи, основанный на применении модели гауссовых смесей. Данная модель считается передовой в виду того, что компоненты гауссовых смесей могут моделировать особенности голоса, индивидуальные для каждого человека, это позволяет отличать голоса людей с высочайшей точностью.
Было установлено, что использование алгоритма K-means++ для инициализации начальных параметров модели приводит к существенному увеличению скорости обучения и повышению точности идентификации. Помимо проверки точности идентификации проводилась оценка времени обучения модели гауссовых смесей. На полной выборке, при использовании кластеризации K-means для инициализации начальных параметров модели при числе компонентов модели, равном 5, время обучения равнялось 7 минутам 35 секундам. При использовании K-means++ время обучения равнялось 5 минутам 3 секундам, это говорит о преимуществе использованного алгоритма. Для тестирования программы были составлены шаблоны пользователей, которые состояли из голосов 20 человек.
В результате тестирования было определено оптимальное число компонент модели гауссовых смесей для решения поставленной задачи, оно равняется 5. При данном числе компонент система идентификации показывает точность распознавания, равную 95%, что говорит о применимости модели гауссовых смесей для решения задачи автоматической идентификации диктора по голосу.



1. Кузнецов В. Автоматический синтез речи / В. Кузнецов, А. Отт. - Таллинн: Валгус, 1989. - 56 с.;
2. Рабинер Л.Р. Цифровая обработка речевых сигналов / Л.Р. Рабинер, Р.В. Шафер. - М: Радио и связь, 1981. - 78 с.;
3. Михайлов А.А. Основные биометрические системы / А.А. Михайлов, А.А. Колосков, Ю.И. Дронов // Алгоритм безопасности. 2016. - 110 с.;
4. Рабинер Л. Теория применения цифровой обработки сигналов / Л. Рабинер, Б. Гоулд. - М: Мир, 1978. - 26 с.;
5. Каганов А.Ш. Соотношение перцептивных признаков и формативных частот гласных в речевом потоке. Сборник трудов. XIII сессия российского акустического общества / А. Ш. Каганов, В.Г. Михайлов. - М: 2000. - 98 с.;
6. Литюк В.И. Методы расчета и проектирование цифровых многопроцессорных устройств обработки радиосигналов. Методическое пособие № 2231 часть 3 / В. И. Литюк. - Таганрог: 1995. - 33 с.;
7. Рамишвили Г.С. Речевой сигнал и индивидуальность голоса / Г.С. Рамишвили. - Тбилиси: 1976. - 53 с.;
8. Сорокин В.Н. Верификация диктора по спектрально-временным параметрам речевого сигнала / В. Н. Сорокин, А. И. Цыплихин // Информационные процессы. 2010. - 21 с.;
9. Линдсей П. Переработка информации у человека / П. Линдсей, Д. Нордман. - М: Мир, 1974. -. 44 с.;
10. Татарченко Н. В. Биометрическая идентификация в интегрированных системах безопасности / Н. В. Татарченко, С. В. Тимошенко // Специальная техника. 2002. - 32 с.;
11. Фаин В. С. Распознавание образов и машинное понимание естественного языка / В. С. Фаин. - М: Наука, 1987. - 100 с.;
12. Оппенгейн А.В. Цифровая обработка сигналов / А. В. Оппенгейн, Р. В. Шафер. - М: Радио и связь, 1979. - 68 с.;
13. Татарченко И. В. Концепция интеграции унифицированных систем безопасности / И. В. Татарченко, Д. С. Соловьев // Системы безопасности. 1973. - 34 с.;
14. Макхоул Дж. Векторное квантование при кодировании речи / Дж. Макхоул // — ТИИЭР, 1985. - 22 с.;
15. Фланаган Дж. Анализ, синтез и восприятие речи / Дж. Фланаган. - М: Связь, 1968. - 44 с.;
16. Комарцова Л.Г. Нейрокомпьютеры. Учебное пособие для вузов / Л. Г. Комарцова, А. В. Максимов. - М: МГТУ им. Н.Э.Баумана, 2002. - 140 с.;
17. Абрамов А. М. Системы управления доступом / А. М. Абрамов, О. Ю. Никулин, А. И. Петрушин. - М: Оберег-РБ, 1998. - 88 с.;
18. Маркел Дж. Д. Линейное предсказание речи / Дж. Д. Маркел, А. Х. Грэй. - М: Радио и связь, 1980. - 75 с.;
19. Кузин М.В. Идентификация по голосу. Скрытые возможности / М. В. Кузин // Information Security. 2006. - 55 с.;
20. Попов Э. В. Общение с ЭВМ на естественном языке / Э. В. Попов. - М: Наука, 1982. - 99 с.;
21. Флорен М. В. Организация управления доступом / М. В. Флорен // Защита информации «Конфидент». 1995. - 56 с.;
22. Садыхов Р.Х. Модели гауссовых смесей для верификации диктора по произвольной речи / Р. Х. Садыхов, В. В. Ракуш // Доклады БГУИР. 2003. - 33 с.;
23. Chow D. Speaker Identification Based on Perceptual Log Area Ratio and Gaussian Mixture Models / D. Chow, H. Waleed, A. Robust. - Auckland, New Zealand: 2002. - 65 с.;
24. Горелик А. Л. Методы распознавания / А. Л. Горелик, В. А. Скрипкин. - М: Высшая школа, 1989. - 87 с.;
25. Кинтцель Т. Руководство программиста по работе со звуком / Т. Кинтцель. - М: 2000. - 90 с.;
26. Зиндер Л.Р. Общая фонетика / Л. Р. Зиндер. - М: Высшая школа, 1979. - 140 с.;
27. Furui S. Digital Speech Processing, Synthesis and Recognition / S. Furui. - New York: 1989. - 44 с.;
28. Childers D. G. The Cepstrum: A Guide to Processing / D. G. Childers, D. P. Skinner, R. C. Kemerait // Proceedings of the IEEE Vol. 65. 1977. - 45 с.;
29. Прохоров Ю. В. Вероятность и математическая статистика / Ю. В. Прохоров. - М: Большая Российская Энциклопедия, 1999. - 100 с.;
30. Константайн Л. Разработка программного обеспечения / Л. Константайн, Л. Локвуд. - СПб: Питер, 2004. - 56с.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ