ВВЕДЕНИЕ 7
1 Анализ литературных источников 9
1.1 Техническое зрение и его задачи 9
1.2 Уровни и методы технического зрения 10
2 Алгоритмы технического зрения 11
2.1 Процессы обработки и анализа изображений 13
2.2 Сегментация 17
2.2.1 Методы пороговой сегментации 21
2.2.2 Глобальная пороговая обработка 22
2.2.3 Локальная пороговая обработка 24
3 Распознавание объекта изображения 26
3.1 Метод Speeded Up Robust Features (SURF) 27
3.2 Метод Histogram of Oriented Gradients (HOG) 30
3.3 Метод опорных векторов 34
4 Разработка программы распознавания 37
4.1 Исходные данные 37
4.2 Выбор среды разработки и структуры программы 39
4.3 Реализация алгоритма сегментации 41
4.4 Реализация метода SURF 43
4.5 Реализация метода HOG 46
4.5.1 Обучение классификатора 46
4.5.2 HOG-функция 53
4.6 Программа распознавания 56
5 Анализ полученных результатов 58
ЗАКЛЮЧЕНИЕ 62
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 64
ПРИЛОЖЕНИЕ А. Листинг функции сегментации 68
ПРИЛОЖЕНИЕ Б. Листинг функции SURF-метода 69
ПРИЛОЖЕНИЕ В. Листинг функции HOG-метода 72
ПРИЛОЖЕНИЕ Г. Листинг программы распознавания объекта 73
В настоящее время благодаря развитию информационных технологий работа с изображениями прочно вошла во все сферы человеческой жизни, начиная с банального получения и обработки изображения фотоаппаратом и заканчивая высокоточной системой технического зрения для роботизированных манипуляторов, применяемых на производстве.
Основной задачей любой системы технического зрения является процесс получения полезной информации с изображения путем распознавания отдельных его элементов. В большинстве случаев такая информация является определяющей для координирования действий робота или роботизированного комплекса при выполнении поставленной задачи, что является причиной высоких требований, предъявляемых к функциональности и производительности систем такого рода.
Одной из наиболее сложных задач в техническом зрении является задача распознавания. Во-первых, такая задача требует тщательного изучения условий и требований работы системы, а также возможностей, входящих в ее состав технических и программных средств, так как разработка программы ведется под конкретную систему. Во-вторых, универсальных алгоритмов распознавания нет, поэтому при изменении целевой задачи системы или ее модернизации потребуется совершенствование или перестройка и программы поиска объекта.
В данной работе исследуются популярные программные решения по работе с изображениями в системах технического зрения. А также рассмотрены вопросы, связанные с решением задачи распознавания квадрокоптера с помощью тепловизионной камеры. Рассматриваются процессы работы с изображениями, а также сегментация, как эффективный инструмент выделения необходимой информации об объекте.
Основной целью работы является разработка программы распознавания квадрокоптера на тепловизионном изображении и исследование существующих алгоритмов, подходящих для реализации этой задачи. Таким образом, объектом
исследований является система технического зрения. Предметом исследования - интеллектуальные системы технического зрения для распознавания техногенных объектов.
Основные задачи:
1) анализ литературных источников, исследование основных требований к программам распознавания систем технического зрения;
2) изучение процессов обработки и анализа изображений;
3) исследование популярных алгоритмов распознавания, подходящих для решения поставленной задачи;
4) анализ начальных условий, требований и используемых технических средств в решении задачи распознавания;
5) разработка программы с использованием рассмотренных алгоритмов, предназначенную для обнаружения и идентификации квадрокоптера на тепловизионном изображении;
6) анализ результатов работы программы, выбор оптимального алгоритма для дальнейшего внедрения разработанного программного обеспечения.
В магистерской диссертации освещены основные принципы и особенности разработки систем идентификации объекта в составе систем технического зрения. Рассмотрены основные принципы и методы обработки и анализа изображений.
Проведен анализ требований к системам технического зрения. Изучены технические условия решения задачи распознавания техногенных объектов на тепловизионном изображении. Исследованы популярные алгоритмы распознавания, подходящие для решения данной задачи.
Разработана программа, в которой реализованы методы HOG, SURF и алгоритм сегментации, основной целью которой является распознавание квадрокоптера на тепловизионном изображении. По результатам работы программы удалось выбрать оптимальное решение поставленной задачи: алгоритм HOG показал наилучшие результаты в задаче идентификации объекта. Метод SURF не подходит для решения текущей задачи, так как зависит от текстуры и ориентации объекта в пространстве. Алгоритм сегментации, который не является полноценным методом идентификации в текущей задаче, показал отличные результаты по обнаружению подсвеченного тепловизором объекта. Его можно использовать в качестве дополнительного инструмента обнаружения в случае построения двухступенчатой системы идентификации или интеллектуальной системы для помощи в принятии решений о необходимости уточнения класса объекта. Также даны рекомендации по выбору технических средств для улучшения эффективности распознавания.
Для разработки программы использовался пакет моделирования MATLAB, обладающего большим набором инструментов для проектирования компьютерных систем.
Рассмотренные и реализованные в работе алгоритмы, а также программное обеспечение с рядом дополнений могут применяться для решения практических задач распознавания различного рода объектов как естественного, так и техногенного происхождения. Следует отметить, что работа 62
алгоритмов ограничивалась техническими возможностями исходной системы, что сказывается на предельно возможной дальности распознавания объекта и необходимостью предобработки видеоизображений. Таким образом при проектировании системы распознавания следует учитывать как программные, так и технические возможности системы технического зрения и, по возможности, выбрать оптимальное решение.