Перечень сокращений 4
ВВЕДЕНИЕ 5
ГЛАВА 1. ИССЛЕДОВАНИЕ РЫНКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ
РАСПОЗНАВАНИЯ РЕЧИ И АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Обзор существующих методов обработки и анализа речевого сигнала 9
1.2. Анализ рынка программного обеспечения для голосовой
биометрии 11
1.3. Исследование предметной области (распознавание речи) 15
1.4. анализ информационных потребностей пользователя 18
1.5. выводы по первой главе 23
Вывод по первой главе 25
ГЛАВА 2. ПРОЕКТИРОВАНИЕ ПРОГРАММНОГО ПРИЛОЖЕНИЯ ДЛЯ ГОЛОСОВОГО ДОСТУПА 26
2.1. требования, предъявляемые системе 26
2.2. сравнение существующих по на мировом рынке 27
2.3. требования к разрабатываемому программному обеспечению 28
2.4. общий алгоритм работы программного модуля голосовой идентификации пользователя 29
2.5. алгоритм работы встроенного программного модуля определения голосовой активности 32
2.6. алгоритм сопоставления временных отрезков массивов данных 41
2.7. выбор платформы проектирования и его обоснование 47
2.8. проектирование базы данных 51
2.9. иерархия форм и интерфейс программы 57
Вывод по второй главе 58
ГЛАВА 3. РЕКОМЕНДАЦИИ ПО ЭКСПЛУАТАЦИИ И ТЕСТИРОВАНИЕ
ПРОГРАММНОГО ПРИЛОЖЕНИЯ 59
3.1. рекомендации по использованию программного приложения.. 61
3.2. тестирование и отладка программного модуля 66
3.2.1. Особенности тестирования программных продуктов 66
3.2.2. Различные подходы к тестированию 67
3.3. Способы тестирования и виды тестов 68
3.4. Подготовка к тестированию 70
3.4.1. Тестирование главной формы 70
3.4.2. Тестирование главной классов 70
3.4.3. Тестирование дополнительных программных модулей 70
3.5. Результаты тестирования 71
3.6. Экономический эффект 73
3.6.1. Расчет затрат на разработку программного модуля 73
3.6.1. Определение стоимости программного модуля 74
Вывод по третий главе 76
ЗАКЛЮЧЕНИЕ 77
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 79
Системы биометрической идентификации человека основаны на принципе распознавания и сравнения уникальных характеристик человеческого организма: отпечатков пальцев, рисунка сетчатки глаза или индивидуальных особенностей голоса. Голосовая идентификация - это одна из наименее ресурсоемких технологий ограничения доступа. Голосовая идентификация является одной из ветвей развития технологии обработки речи и применяется при создании различных систем охраны и разграничения доступа.
Идентификация голоса - технология автоматического сравнения неизвестного голоса с фонотекой известных голосов, предназначенная для использования в системах разграничения и управления доступом.
Всем известны технологии идентификации человека по отпечаткам пальцев или по радужной оболочке глаза. Однако потенциал еще одного, казалось бы, лежащего на поверхности метода до сих пор недооценивался.
В Университете Северной Каролины совершенствуется технология, анализирующая голос с высокой точностью и позволяющая использовать его для распознавания личности. При этом сам механизм речи основан на том, что в гортани на определенных частотах вибрируют голосовые складки, содержащие голосовые связки и мышцы. В результате воспроизводится уникальный звук, присущий только данному индивидууму.
Ученым фактически остается довести до ума наработки в области компьютерного распознавания голоса и сличения его характеристик с уже имеющимися образцами. Дело в том, что современное оборудование, выполняющее такие задачи, тратит на распознавание очень много времени для того, чтобы получить широкое признание. Чтобы сократить время идентификации до мгновений без увеличения ошибок, исследователи вносят изменения в уже существующие компьютерные модели. Фактически речь идет об эволюционном развитии программного обеспечения для речевой аутентификации. Все это приблизит момент начала использования технологии, которая со временем, возможно, начнет восприниматься как практичный и надежный инструмент.
В настоящее время - век мобильной электроники и высоких требований к защите информации, речевая аутентификация может иметь множество применений. Потенциальные пользователи этой технологии - это госструктуры, финансовые и медицинские учреждения, а также телекоммуникационная отрасль. Сфера ее применения - от пресечения мошенничеств, в случае кражи удостоверений личности до защиты данных».
Распознавание речи является задачей классификации образов акустических характеристик речевых сигналов. В системах распознавания речи выделяются два основных блока:
• блок акустического анализа, предназначенный для выделения информативных акустических характеристик речевого сигнала и формирования акустического образа, и набора характеристик;
• блок классификации путем сравнения с обученными акустическими моделями - эталонами.
DTW метод, является наиболее подходящим методом, для анализа нестационарных сигналов, позволяющий получать многокомпонентный частотно-временной образ сигнала. Поэтому для речевых сигналов, являющихся нестационарными, DTW обеспечивает более точное представление, чем методы анализа, предполагающие стационарность сигнала.
Обработка биометрических данных, в первую очередь, восстребована для решения ряда важнейших задач с точки зрения обеспечения высокой безопасности и повышения качества обслуживания. Биометрические системы используют для идентификации набор неотъемлемых характеристик человека, что является предпочтительным с точки зрения защиты от краж, копирования или потери идентификационных признаков. Биометрические технологии в данный момент внедряются в системы контроля и управления доступом в качестве основных или вспомогательных средств идентификации, внедряются в качетстве вспомогательных идентификационных технологий в сферу обслуживания (в том числе, при обслуживании важных лиц) и в системы правоохранительных органов.
Голос - такая же неотъемлемая черта каждого человека, как и его лицо или отпечатки пальцев. Широкое распространение средств связи открывают большие возможности для применения данного идентификатора; кроме того, распознавание по голосу весьма удобно для пользователей и требует от них минимум усилий.
Целью выпускной работы является: повышение эффективности систем контроля и разграничения доступа с использованием метода идентификации пользователя по его голосовым характеристикам.
Задачи:
• исследование рынка распознавания речи для СКД;
• сравнительный анализ существующих программных решений;
• анализ требований к ПП для голосового доступа;
• выбор средств и среды разработки программного продукта;
• разработка схем алгоритмов работы программного продукта;
• разработка программного приложения для распознавания речи с использованием языка программирования C++;
• отладка и тестирование программного модуля;
• разработка руководства пользователя;
• экономическое обоснование разработки и внедрения программного продукта.
В приложение 1 приведен фрагмент исходного кода программного модуля.
В результате выполнения выпускной квалификационной работы был разработан программный модуль голосовой идентификации пользователя, удовлетворяющий всем требованиям утвержденного технического задания. Программный модуль выполняет следующие основные функции: оцифровка аналогового голосового сигнала; запись эталонных акустических данных; дискретное преобразование Фурье для акустических массивов данных; спектральный анализ голоса; выделение голоса из зашумлённой речи; определение динамического порога чувствительности; обработка и фильтрация голоса; построение матрицы тождественности для двух массивов; выравнивание и сравнение двух массивов данных по времени; идентификация пользователя.
При выполнении выпускной работы была исследована предметная область. Так же, при разработке программного модуля была изучена архитектура программного обеспечения систем SPIRIT Corp., GridTec и других. Исходный код программного модуля голосовой идентификации пользователя написан на языке программирования C++. В качестве среды разработки программного модуля использовалась среда Microsoft Visual C++ 2008 Express Edition.
При отладке и тестировании программного модуля использовались следующие методы и средства:
• встроенный отладчик среды разработки среда Microsoft Visual C++;
• вывод отладочных сообщений или их запись в файл;
• специальные отладочные модули, для тестирования функций голосового анализа при различных шумовых средах, выделения оптимального адаптивного порога, сегментирования голосовых массивов и поиска кротчайшего пути;
• тесты, для оценки быстродействия функций обработки кадров.
Результаты испытаний показали, что программный модуль удовлетворяет всем требованиям технического задания.
Таким образом, программный модуль голосовой идентификации пользователя полностью реализован и соответствует требованиям технического задания и выполняет все заданные функции.