Тема: РАЗРАБОТКА МЕТОДИКИ ГОЛОСОВОГО ОТПЕЧАТКА ДЛЯ ЗАДАЧ АУТЕНТИФИКАЦИИ
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Техническое задание 8
1.1 Назначение разработки и область применения 8
2 Теоретические сведения 9
2.1 Понятия безопасности систем 9
2.2 Речь 10
2.3 Виды систем распознавания диктора 11
3 Методы и средства идентификации и верификации личности по голосу 12
3.1 Алгоритм распознавания дикторов 12
3.2 Понятие мела 13
3.3 Спектр 14
3.4 Кепстр 16
3.5 Извлечение признаков 16
3.5.1 Мел-частотные кепстральные коэффициенты 17
3.5.2 Линейные предсказательные кепстральные коэффициенты 18
3.6 Выбор классификатора признаков 19
3.6.1 Скрытые Марковские модели 20
3.6.2 Алгоритм динамической трансформации временной шкалы 22
3.6.3 Модель гауссовых смесей 24
3.6.4 Метод векторного квантования 25
3.6.5 Метод опорных векторов 27
Выводы 29
4 Разработка системы распознавания личности по голосу 30
4.1 Язык программирования MATLAB 30
2
4.2 Модули и библиотеки
4.3 Описание работы системы 32
4.4 Интерфейс системы 33
4.5 Тестирование системы 38
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 41
ПРИЛОЖЕНИЕ 43
📖 Введение
Биометрия базируется на многочисленных способах анализа физиологических критериев, которые при правильном подходе к точности при сборе и
обработке данных, никоим образом не могут быть сфальсифицированы, так как являются атрибутами принадлежащими и связанными только с одной личностью и ни сама личность, никто-либо другой не могут их изменить или сымитировать. Когда эти факты были приняты в особое внимание и технологии позволили получать эти данные и корректно оперировать ими, возникло два основных направления их применения в мировом масштабе, это автори- зация/идентификация/аутентификация в целях разграничения/ограничения прав доступа, а также для проведения расследований и связанных с ними розыскных мероприятий.
Возможности медицинской техники, а также инструментальной диагно - стики продвинулись на такой уровень, что если раньше список ограничивался двумя-тремя основными параметрами, на достоверности которых, как в отдельности, так и в их сочетании основывался весь анализ, который также мог давать не слишком однозначно интерпретируемые результаты, то сейчас можно привести достаточно длинный список способов получения более глубоких физиологических данных биометрической идентификации. Самые известные и всем знакомые: дактилоскопия и распознавание лиц, почти у каждого сейчас телефон с возможностью сканирования лица или отпечатка пальца; ДНК-тесты; сетчатка глаза, голос, запах, продолжать можно почти бесконечно; само собой, чем более трудоемкий и дорогостоящий в получении тот или иной параметр, тем более он достоверен. Например, распознавание личности по ДНК выполняется с максимальной точностью, но не везде оно уместно и естественно в целях, которые будут рассматриваться в рамках данной работы, выглядело бы неадекватно, как минимум поскольку оно требует больших затрат на оборудование, трудоемко, а также требует контроля со стороны высококвалифицированных специалистов. Каждый из приведенных методов имеет свои преимущества и свои недостатки, свой уровень достоверности, уникальности, стойкости и безотказности.
Одной из характеристик, не предъявляющих большого числа требований
для достаточно точного получения данных и не налагающих особые условия
5
при анализе является голос и речь. Потенциал применения довольно высок, вероятность ошибок ввиду неконтролируемых факторов (внешние шумы, изменения в голосе диктора из-за заболеваний дыхательной системы и т.д.) не исключена, но находится не на слишком критичном уровне, из специального оборудования в минимальном случае необходимо наличие только высокочувствительного направленного микрофона, а уровень сигнал/шум записи может быть скорректирован. Если говорить о массовом использовании, то так как такие системы нетребовательны, могут быть внедрены почти в любые смартфоны.
Как было указано выше голос вполне можно рассматривать как уникальную, довольно проблематично подделываемую характеристику, его довольно сложно выдать за чужой, не имея определенных навыков или не имея специализированного оборудования, позволяющего это сделать. Отдельно взятые индивидуумы с легкостью искусно пародируют голоса, но эта способность требует, как врожденного таланта и определенных способностей, так и длительных тренировок, поэтому не так сильно распространена и в целом редко встречается. Но для защиты особо ценных материалов всегда стоит это учитывать и в особых случаях такую малую вероятность все же тоже не стоит упускать из виду, собственно, как раз на такой случай, как было указано чуть выше, достаточно введения проверки сразу по нескольким биометрическим характеристикам.
Однако не стоит забывать, что если кто-то пытается что-то защитить и для этого разрабатывает инструментальные, технические средства, программные средства, и т.д. и т.п. то те, на кого эти меры направлены тоже не стоят на месте, а двигаются вперед, находя все новые лазейки и слабые места в защите, и используя их в своих корыстных целях, тем самым стимулируя первых к созданию все новых и более совершенных систем. Число случаев киберпреступлений с развитием средств защиты никоим образом не сокращается. Злоумышленники легко взламывают пароли, проникают в здания с ограниченным доступом, преодолевая различные системы защиты. Так же стоит отме-
6
тить, что даже большие структуры хотят внедрять систему идентификации по голосу. Сбербанк в частности, и другие банки уже давно успешно оперируют с созданием и пополнением баз данных голосов своих пользователей, собираемых при звонках и разговорах с представителями техподдержки, ввиду чего сейчас постепенно переходит от привычных карт к системе идентификации по голосу и внешности. Расчет состоит в том, что такая система со временем сменит нынешнюю, считаясь более удобной и надежной. В том числе на данном основании было принято решение, что так как разработка программного продукта идентификации личности по голосу весьма актуальна, было бы интересно рассмотреть методы, с помощью которых она может осуществляться, а также провести определенное статистическое наблюдение, насколько тот или иной метод даст точные результаты, к примеру, в зависимости от пола или возраста диктора.
Целью данной работы является создание программной реализации идентификации человека по голосу.
✅ Заключение
• Была изучена теоретическая часть и рассмотрены все проблемы, а также большинство существующих решений в пределах данной предметной области.
• Был произведен обзор и сравнительный анализ методов и средств для обнаружения и извлечения значимых признаков в поступающих на вход сигналах, а также акустических моделей, которые могут быть построены на базе полученных данных. Выбраны наиболее подходящие из них.
• Относительно поставленной задачи были подобраны наиболее подходящие средства разработки программного продукта, в данном случае были освоены и использованы функционал и возможности инструментов языка MATLAB, а также дополнительные подключаемые к нему библиотеки и модули.
Как итог всего вышеперечисленного, спроектирован программный модуль и его пользовательский интерфейс.



