АУТЕНТИФИКАЦИЯ ПОЛЬЗОВАТЕЛЯ С ПОМОЩЬЮ СИСТЕМЫ РАСПОЗНАВАНИЯ ГОЛОСА
|
Введение 2
Глава 1. Алгоритм распознавания голоса 5
1.1. Использование DTW алгоритма в распознавании речи 6
1.2. Архитектура системы 8
1.3. Преобразование Фурье 11
1.4. Понятие мела 15
1.5. Мел-частотные кепстральные коэффициенты 16
Глава 2. Интерфейс системы 21
2.1. Работа Администратора с базой данных пользователей 21
2.2. Работа пользователя с компонентой 22
Глава 3. Разработка системы аутентификации пользователя по голосу .... 26
3.1. Функциональная схема программного средства 26
3.2. Информационная схема программного средства 27
3.3. Язык программирования и среда разработки 28
Глава 4. Вычисление коэффициентов ложного принятия и ложного отказа при эксплуатации системы 29
Заключение 33
Список использованной литературы 34
Приложение
Глава 1. Алгоритм распознавания голоса 5
1.1. Использование DTW алгоритма в распознавании речи 6
1.2. Архитектура системы 8
1.3. Преобразование Фурье 11
1.4. Понятие мела 15
1.5. Мел-частотные кепстральные коэффициенты 16
Глава 2. Интерфейс системы 21
2.1. Работа Администратора с базой данных пользователей 21
2.2. Работа пользователя с компонентой 22
Глава 3. Разработка системы аутентификации пользователя по голосу .... 26
3.1. Функциональная схема программного средства 26
3.2. Информационная схема программного средства 27
3.3. Язык программирования и среда разработки 28
Глава 4. Вычисление коэффициентов ложного принятия и ложного отказа при эксплуатации системы 29
Заключение 33
Список использованной литературы 34
Приложение
В наше время всеобщей компьютеризации и информатизации особую важность и значимость приобретают задачи защиты информации и разграничения доступа к управлению информационных систем и к их ресурсам, защиты от несанкционированного доступа.
Данные задачи решаются системами управления доступом и защиты информации, выполняющими аутентификацию на основе определенной уникальной информации, которая характеризует конкретного пользователя [6]. В зависимости от её типа методы аутентификации классифицируют на следующие группы:
1. Парольные методы - используют уникальное знание (пароль, пин- код);
2. Атрибутные - используют уникальный предмет (ключ, смарт- карта, токен);
3. Биометрические - используют уникальную характеристику самого пользователя (статическая - отпечатки пальца, снимок сетчатки глаза, динамическая (поведенческая) - например, аутентификация по голосу).
Речь - существенный элемент человеческой деятельности, позволяющий человеку познавать окружающий мир, передавать свои знания и опыт другим людям. Устная составляющая речи проявляется в виде высказываний в звуковой форме, которые возможны благодаря голосовому аппарату человека.
Каждый человек имеет индивидуальные голосовые характеристики, которые определяются особенностями строения его голосовых органов. В процессе общения люди способны на подсознательном уровне различать голоса других людей, однако для вычислительной техники данная задача является нетривиальной.
Парольные и атрибутные методы идентификации и аутентификации, традиционно используемые в системах управления доступом и защитой информации, имеют ряд существенных недостатков [4]. Главный из них - неоднозначность идентификации пользователя и возможность обмана системы защиты, например, путем кражи или имитации атрибута, или взлома пароля пользователя. Действительно, в последнее время участились случаи массовых взломов аккаунтов путём кражи соответствующих ключевых данных. Поэтому стремительно развиваются и предлагаются новые идеи по управлению доступом.
Методы аутентификации по биометрическим параметрам личности, ввиду неотъемлемости биометрических характеристик от конкретного человека, способны обеспечить повышенную, по сравнению с другими способами проверки соответствия, точность [6]. Соответственно актуальной является задача создания гибридной системы управления доступом, сочетающей в себе как уникальные знания, так и уникальную (биометрическую) характеристику субъекта, а именно его голосовые характеристики.
Существующие программные реализации подобных методов характеризуются недостаточной достоверностью аутентификации. Поэтому, в настоящее время актуальна задача разработки новых методов, алгоритмов и их программно-аппаратных реализаций, повышающих эффективность систем идентификации и аутентификации.
Существуют следующие проблемы и ограничения задачи распознавания личности по голосу, которые следует учитывать при построении решения[8]:
• Эмоциональное состояние диктора
• Сложная акустическая обстановка (шумы и помехи)
• Разные каналы связи при обучении и распознавании
• Естественные изменения голоса
Распознавание личности по голосу находит применение во многих сферах:
• Криминалистика и судебная экспертиза
• Безопасность
• Банковские технологии
• Электронная коммерция
Речь представляет собой сложный сигнал, образующийся в результате преобразований, происходящих на нескольких различных уровнях: семантическом, языковом, артикуляционном и акустическом (уровне физических свойств звука). Различия в этих преобразованиях влекут за собой различия в свойствах речевого сигнала. При решении задачи распознавания диктора по голосу все эти различия могут быть использованы для того чтобы выделить индивидуальные характеристики голоса каждого человека.
Цель данной работы - создание приложения, которое может использоваться как подсистема в корпоративных информационных системах для обеспечения сложного алгоритма авторизации и аутентификации пользователей на основании генерации случайной парольной фразы, записи речи пользователя, распознавания сказанной фразы и определения наличия голоса говорящего в базе данных. Исследование особенностей аутентификации по биометрическим параметрам личности, а именно по голосу в конкретной задаче аутентификации пользователя с помощью распознавания голоса.
Для достижения цели магистерской диссертации поставлены следующие задачи:
1. Исследовать существующие методы решения задачи аутентификации личности по голосу, способы оценки их качества, а также существующие проблемы и ограничения.
2. Реализовать один из лучших алгоритмов аутентификации личности по голосу.
3. Провести экспериментальное исследование разработанного алгоритма. Эта задача подразумевает также создание обучающей и тестовой выборки, позволяющей наиболее полно оценить все преимущества и недостатки реализованного алгоритма.
Данные задачи решаются системами управления доступом и защиты информации, выполняющими аутентификацию на основе определенной уникальной информации, которая характеризует конкретного пользователя [6]. В зависимости от её типа методы аутентификации классифицируют на следующие группы:
1. Парольные методы - используют уникальное знание (пароль, пин- код);
2. Атрибутные - используют уникальный предмет (ключ, смарт- карта, токен);
3. Биометрические - используют уникальную характеристику самого пользователя (статическая - отпечатки пальца, снимок сетчатки глаза, динамическая (поведенческая) - например, аутентификация по голосу).
Речь - существенный элемент человеческой деятельности, позволяющий человеку познавать окружающий мир, передавать свои знания и опыт другим людям. Устная составляющая речи проявляется в виде высказываний в звуковой форме, которые возможны благодаря голосовому аппарату человека.
Каждый человек имеет индивидуальные голосовые характеристики, которые определяются особенностями строения его голосовых органов. В процессе общения люди способны на подсознательном уровне различать голоса других людей, однако для вычислительной техники данная задача является нетривиальной.
Парольные и атрибутные методы идентификации и аутентификации, традиционно используемые в системах управления доступом и защитой информации, имеют ряд существенных недостатков [4]. Главный из них - неоднозначность идентификации пользователя и возможность обмана системы защиты, например, путем кражи или имитации атрибута, или взлома пароля пользователя. Действительно, в последнее время участились случаи массовых взломов аккаунтов путём кражи соответствующих ключевых данных. Поэтому стремительно развиваются и предлагаются новые идеи по управлению доступом.
Методы аутентификации по биометрическим параметрам личности, ввиду неотъемлемости биометрических характеристик от конкретного человека, способны обеспечить повышенную, по сравнению с другими способами проверки соответствия, точность [6]. Соответственно актуальной является задача создания гибридной системы управления доступом, сочетающей в себе как уникальные знания, так и уникальную (биометрическую) характеристику субъекта, а именно его голосовые характеристики.
Существующие программные реализации подобных методов характеризуются недостаточной достоверностью аутентификации. Поэтому, в настоящее время актуальна задача разработки новых методов, алгоритмов и их программно-аппаратных реализаций, повышающих эффективность систем идентификации и аутентификации.
Существуют следующие проблемы и ограничения задачи распознавания личности по голосу, которые следует учитывать при построении решения[8]:
• Эмоциональное состояние диктора
• Сложная акустическая обстановка (шумы и помехи)
• Разные каналы связи при обучении и распознавании
• Естественные изменения голоса
Распознавание личности по голосу находит применение во многих сферах:
• Криминалистика и судебная экспертиза
• Безопасность
• Банковские технологии
• Электронная коммерция
Речь представляет собой сложный сигнал, образующийся в результате преобразований, происходящих на нескольких различных уровнях: семантическом, языковом, артикуляционном и акустическом (уровне физических свойств звука). Различия в этих преобразованиях влекут за собой различия в свойствах речевого сигнала. При решении задачи распознавания диктора по голосу все эти различия могут быть использованы для того чтобы выделить индивидуальные характеристики голоса каждого человека.
Цель данной работы - создание приложения, которое может использоваться как подсистема в корпоративных информационных системах для обеспечения сложного алгоритма авторизации и аутентификации пользователей на основании генерации случайной парольной фразы, записи речи пользователя, распознавания сказанной фразы и определения наличия голоса говорящего в базе данных. Исследование особенностей аутентификации по биометрическим параметрам личности, а именно по голосу в конкретной задаче аутентификации пользователя с помощью распознавания голоса.
Для достижения цели магистерской диссертации поставлены следующие задачи:
1. Исследовать существующие методы решения задачи аутентификации личности по голосу, способы оценки их качества, а также существующие проблемы и ограничения.
2. Реализовать один из лучших алгоритмов аутентификации личности по голосу.
3. Провести экспериментальное исследование разработанного алгоритма. Эта задача подразумевает также создание обучающей и тестовой выборки, позволяющей наиболее полно оценить все преимущества и недостатки реализованного алгоритма.
В процессе выполнения магистерской диссертации была разработана система аутентификации пользователей по голосу, которое может использоваться как подсистема в корпоративных информационных системах для обеспечения сложного алгоритма авторизации и аутентификации пользователей на основании генерации случайной парольной фразы, записи речи пользователя, распознавания сказанной фразы и определения наличия голоса говорящего в базе данных. Исследовались особенности аутентификации по биометрическим параметрам личности, а именно по голосу в конкретной задаче аутентификации пользователя с помощью распознавания голоса.
В ходе выполнения работы был изучен большой теоретический материал по физике голоса, по математическому аппарату решения задач распознавания, изучен язык C#, а также его библиотеки.
Результатом работы является функционирующее приложение для обработки и распознавания речи для аутентификации пользователей какой- либо информационной системы. Система имеет понятный и удобный для пользователя интерфейс, позволяющий использовать приложение без предварительного затратного обучения пользователей.
Данное приложение имеет гибкую структуру и понятную программную часть для ее последующего внедрения в различные крупные информационные системы, например, архивы и корпоративные порталы.
В ходе выполнения работы был изучен большой теоретический материал по физике голоса, по математическому аппарату решения задач распознавания, изучен язык C#, а также его библиотеки.
Результатом работы является функционирующее приложение для обработки и распознавания речи для аутентификации пользователей какой- либо информационной системы. Система имеет понятный и удобный для пользователя интерфейс, позволяющий использовать приложение без предварительного затратного обучения пользователей.
Данное приложение имеет гибкую структуру и понятную программную часть для ее последующего внедрения в различные крупные информационные системы, например, архивы и корпоративные порталы.



