Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА МЕТОДИКИ ГОЛОСОВОГО ОТПЕЧАТКА ДЛЯ ЗАДАЧ АУТЕНТИФИКАЦИИ

Работа №32528

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы64
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
465
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 Техническое задание 8
1.1 Назначение разработки и область применения 8
2 Теоретические сведения 9
2.1 Понятия безопасности систем 9
2.2 Речь 10
2.3 Виды систем распознавания диктора 11
3 Методы и средства идентификации и верификации личности по голосу 12
3.1 Алгоритм распознавания дикторов 12
3.2 Понятие мела 13
3.3 Спектр 14
3.4 Кепстр 16
3.5 Извлечение признаков 16
3.5.1 Мел-частотные кепстральные коэффициенты 17
3.5.2 Линейные предсказательные кепстральные коэффициенты 18
3.6 Выбор классификатора признаков 19
3.6.1 Скрытые Марковские модели 20
3.6.2 Алгоритм динамической трансформации временной шкалы 22
3.6.3 Модель гауссовых смесей 24
3.6.4 Метод векторного квантования 25
3.6.5 Метод опорных векторов 27
Выводы 29
4 Разработка системы распознавания личности по голосу 30
4.1 Язык программирования MATLAB 30
2
4.2 Модули и библиотеки
4.3 Описание работы системы 32
4.4 Интерфейс системы 33
4.5 Тестирование системы 38
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 41
ПРИЛОЖЕНИЕ 43


Контроль и защита от несанкционированного доступа не только к самим информационным ресурсам, но и к объектам их расположения всегда актуальна, вне зависимости от уровня конфиденциальности и важности хранимых данных. Рынок программного обеспечения располагает богатым перечнем средств, позволяющих организовать систему разграничения прав доступа, имеющих различную степень точности и стойкости, а также соответственно разный уровень стоимости. Можно уверенно говорить о том, что почти все программные продукты до каких-то то пор влекли за собой потребность в дополнительном внедрении некоторых персонифицирующих технических средств идентификации: удостоверений в виде карт (в том числе бесконтактных), брелоков, меток, ключей и т. п., что само собой приводило к значительным дополнительным материальным затратам, зачастую превышающим стоимость самого программного обеспечения. В дополнение к этому, любые технические средства, в каком бы форм-факторе они не были реализованы, могли быть утеряны или попросту выходить из строя, что опять-таки влекло дополнительные траты для их перевыпуск и введения в обычный режим эксплуатации. Но самым большим минусом с точки зрения обеспечения безопасности можно считать всегда присутствующие высокий риск и вероятность хищения злоумышленником материального технического средства распознавания личности и беспрепятственное проникновение, к примеру, на территорию предприятия и/или получение доступа к секретным данным. Одним из вариантов решения всех этих проблем призвана стать биометрическая идентификация, а именно распознавания человека на основе его уникальных индивидуальных характеристик. Ведь в отличие от привычных идентификаторов, они ни при каких условиях не могут быть утеряны их истинным владельцем.
Биометрия базируется на многочисленных способах анализа физиологических критериев, которые при правильном подходе к точности при сборе и
обработке данных, никоим образом не могут быть сфальсифицированы, так как являются атрибутами принадлежащими и связанными только с одной личностью и ни сама личность, никто-либо другой не могут их изменить или сымитировать. Когда эти факты были приняты в особое внимание и технологии позволили получать эти данные и корректно оперировать ими, возникло два основных направления их применения в мировом масштабе, это автори- зация/идентификация/аутентификация в целях разграничения/ограничения прав доступа, а также для проведения расследований и связанных с ними розыскных мероприятий.
Возможности медицинской техники, а также инструментальной диагно - стики продвинулись на такой уровень, что если раньше список ограничивался двумя-тремя основными параметрами, на достоверности которых, как в отдельности, так и в их сочетании основывался весь анализ, который также мог давать не слишком однозначно интерпретируемые результаты, то сейчас можно привести достаточно длинный список способов получения более глубоких физиологических данных биометрической идентификации. Самые известные и всем знакомые: дактилоскопия и распознавание лиц, почти у каждого сейчас телефон с возможностью сканирования лица или отпечатка пальца; ДНК-тесты; сетчатка глаза, голос, запах, продолжать можно почти бесконечно; само собой, чем более трудоемкий и дорогостоящий в получении тот или иной параметр, тем более он достоверен. Например, распознавание личности по ДНК выполняется с максимальной точностью, но не везде оно уместно и естественно в целях, которые будут рассматриваться в рамках данной работы, выглядело бы неадекватно, как минимум поскольку оно требует больших затрат на оборудование, трудоемко, а также требует контроля со стороны высококвалифицированных специалистов. Каждый из приведенных методов имеет свои преимущества и свои недостатки, свой уровень достоверности, уникальности, стойкости и безотказности.
Одной из характеристик, не предъявляющих большого числа требований
для достаточно точного получения данных и не налагающих особые условия
5
при анализе является голос и речь. Потенциал применения довольно высок, вероятность ошибок ввиду неконтролируемых факторов (внешние шумы, изменения в голосе диктора из-за заболеваний дыхательной системы и т.д.) не исключена, но находится не на слишком критичном уровне, из специального оборудования в минимальном случае необходимо наличие только высокочувствительного направленного микрофона, а уровень сигнал/шум записи может быть скорректирован. Если говорить о массовом использовании, то так как такие системы нетребовательны, могут быть внедрены почти в любые смартфоны.
Как было указано выше голос вполне можно рассматривать как уникальную, довольно проблематично подделываемую характеристику, его довольно сложно выдать за чужой, не имея определенных навыков или не имея специализированного оборудования, позволяющего это сделать. Отдельно взятые индивидуумы с легкостью искусно пародируют голоса, но эта способность требует, как врожденного таланта и определенных способностей, так и длительных тренировок, поэтому не так сильно распространена и в целом редко встречается. Но для защиты особо ценных материалов всегда стоит это учитывать и в особых случаях такую малую вероятность все же тоже не стоит упускать из виду, собственно, как раз на такой случай, как было указано чуть выше, достаточно введения проверки сразу по нескольким биометрическим характеристикам.
Однако не стоит забывать, что если кто-то пытается что-то защитить и для этого разрабатывает инструментальные, технические средства, программные средства, и т.д. и т.п. то те, на кого эти меры направлены тоже не стоят на месте, а двигаются вперед, находя все новые лазейки и слабые места в защите, и используя их в своих корыстных целях, тем самым стимулируя первых к созданию все новых и более совершенных систем. Число случаев киберпреступлений с развитием средств защиты никоим образом не сокращается. Злоумышленники легко взламывают пароли, проникают в здания с ограниченным доступом, преодолевая различные системы защиты. Так же стоит отме-
6
тить, что даже большие структуры хотят внедрять систему идентификации по голосу. Сбербанк в частности, и другие банки уже давно успешно оперируют с созданием и пополнением баз данных голосов своих пользователей, собираемых при звонках и разговорах с представителями техподдержки, ввиду чего сейчас постепенно переходит от привычных карт к системе идентификации по голосу и внешности. Расчет состоит в том, что такая система со временем сменит нынешнюю, считаясь более удобной и надежной. В том числе на данном основании было принято решение, что так как разработка программного продукта идентификации личности по голосу весьма актуальна, было бы интересно рассмотреть методы, с помощью которых она может осуществляться, а также провести определенное статистическое наблюдение, насколько тот или иной метод даст точные результаты, к примеру, в зависимости от пола или возраста диктора.
Целью данной работы является создание программной реализации идентификации человека по голосу.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Все цели и задачи поставленные на стадии согласования и оформления технического задания данной бакалаврской работы были достигнуты, результаты, полученные в ходе выполнения наблюдений, анализа и вычислительных операций по разработке системы идентификации диктора по голосу демонстрируют достаточно хороший уровень исполнения и достаточно высокую точность.
• Была изучена теоретическая часть и рассмотрены все проблемы, а также большинство существующих решений в пределах данной предметной области.
• Был произведен обзор и сравнительный анализ методов и средств для обнаружения и извлечения значимых признаков в поступающих на вход сигналах, а также акустических моделей, которые могут быть построены на базе полученных данных. Выбраны наиболее подходящие из них.
• Относительно поставленной задачи были подобраны наиболее подходящие средства разработки программного продукта, в данном случае были освоены и использованы функционал и возможности инструментов языка MATLAB, а также дополнительные подключаемые к нему библиотеки и модули.
Как итог всего вышеперечисленного, спроектирован программный модуль и его пользовательский интерфейс.



1. Bilmes, Jeff A. A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov
Models // Berkley, CA: International Computer Science Institute. - 1998. - С. 7
13.
2. Kinnunen, T. An overview of text-independent speaker recognition:
From features to supervectors / Tomi Kinnunen, Haizhou Li. - University of Joensuu, Joensuu, Finland, 2010. - 39 с.
3. Афанасьев, А.А. Аутентификация. Теория и практика
обеспечения безопасного доступа к информационным ресурсам: Учебное
пособие для вузов / Л. Т. Веденьев, А. А. Воронцов - Москва: Горячая линия
- Телеком, - 2009. - 550 c.
4. Заковряшин, А.С. Применение распределений мел-частотных
кепстральных коэффициентов для голосовой идентификации личности // П.В. Малинин, А. А. Лепендин - Барнаул: Изв. АГУ. - 5/2007. - С. 156-160.
5. Матвеев, Ю. Н. Технологии биометрической идентификации личности по голосу и другим модальностям / Ю. Н. Матвеев - Москва: Вестн. МГТУ им. Н. Э. Баумана. Сер. Приборостроение. Специальный выпуск. Биометрические технологии. 2012. № 3(3). С. 46—61.
6. Матвеев, Ю.Н. Исследование информативности признаков речи для систем автоматической идентификации дикторов / Ю. Н. Матвеев - Томск: Изв. Вузов. Приборостроение. - 2013. - Т. 56,- № 2. - С. 47-51.
7. Первушин, Е. Обзор основных методов распознавания дикторов
// Е. Первушин. - Омск : ОмГУ. - 2011. - № 24. - С. 41-54.
8. Садыхов, Р. Х. Модели гауссовых смесей для верификации диктора по произвольной речи / Р. Х. Садыхов, В. В. Ракуш // - Минск: доклады БГУИР. - 2003. - № 4. - С. 95-103.
9. Сорокин, В.Н. Верификация диктора по спектрально-временным
параметрам речевого сигнала / В. Н. Сорокин, А. И. Цыплихин. - Москва:
Институт проблем передачи информации. - 2012. - Т. 10. - № 2. - С. 87104.
10. СТО 4.2-07-2014 Система менеджмента качества. Общие требования к построению, изложению и оформлению документов учебной деятельности. - Введ. 30.12.2013. - Красноярск: СФУ, 2014. - 60 с.
11. http://academictorrents.com/details/ 34e2b78745138186976cbc27939b1b34d18bd5b3
12. http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html
13. https://ww2.mathworks.cn/matlabcentral/fileexchange/18785-gaussian- mixture-model


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ