Аннотация
ВВЕДЕНИЕ 6
1 Основные направления исследований в области технического зрения 8
1.1 История возникновения компьютерного зрения 8
1.2 Предметные области, связанные с распознаванием изображений 10
1.2.1 Задачи машинного зрения 11
1.3 Компьютерное зрение сегодня 13
2 Исследование технологий распознавания изображений 15
2.1 Особенности реализации систем технического зрения 15
2.2 Среда программирования MATLAB и расширение Computer Vision System
Toolbox 16
2.3 Реализации алгоритмов технического зрения 18
2.3.2 Классификация цифр с помощью функции HOG 30
2.3.3 Распознавание и отслеживание лиц с помощью метода KLT 37
2.4 Вывод 42
ЗАКЛЮЧЕНИЕ 44
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 45
Основную часть информации человек получает через зрительный орган, далее весьма эффективно обрабатывает информацию при помощи анализирующего аппарата, другими словами, мозгом, и интерпретирует визуальную информацию. Поэтому следует такой вопрос как, а можно ли создать подобную способность для машины. Ведь за счет того, что на данный момент сложность решаемых вопросов возрастает, то автоматическая обработка и анализ визуальной информации становится с каждым днем все более актуальной задачей.
Термин «компьютерное зрение» имеет множество связанных областей: машинное зрение, распознавание зрительных образов, анализ изображений и т. д. [1]. Однако, смысл, скрывающийся за всеми этими определениями, один - это попытка научить компьютер видеть мир глазами человека, воспринимать его как человек и выполнять в связи с этим различные действия так же, как делал бы это человек, тем самым подменяя или полностью исключая последнего. Необходимость в этом возникает в ситуациях, связанных с риском для жизни, и бывает обусловлена особенностями человека как живого организма, которому свойственно быстро утомляться, пропускать через себя ограниченный объем информации, а также обрабатывать данные с относительно низкой скоростью [2]. Процесс компьютерного зрения представляет собой сложную технологическую цепочку, включающую получение цифрового изображения, обработку изображения с целью выделения значимой информации на изображении и анализ этого предобработанного изображения для решения определенной задачи. Конечно, идеальным представляется создание универсальной самообучающейся системы, которая бы «росла» и «зрела» так же, как это с рождения происходит с любым человеком. Руководствуясь столь высокими целями, разработчики в области компьютерного зрения сегодня решают непростые задачи. Можно сказать, что область компьютерного зрения имеет недолгую по меркам фундаментальных наук, но очень бурную историю зарождения и развития [3].
Актуальность работы обуславливается тем, что автоматическая обработка и анализ визуальной информации становятся все более актуальными вопросами за счет возрастания сложности решаемых научно-технических задач. Технологии машинного зрения используются в весьма востребованных областях науки и техники, таких как автоматизация технологических процессов, повышение производительности труда, повышение качества выпускаемых изделий, контроль производственного оборудования, интеллектуальные робототехнические комплексы, системы управления движущимися аппаратами, биомедицинские исследования и множество других.
Целью работы является изучение расширения Computer Vision System Toolbox в программе Matlab и исследование алгоритмов точечного подбора, классификации цифр с помощью метода многоклассового классификатора, распознавания-слежения за объектом.
Практическая значимость работы состоит в том, что по ее итогам сформулированы рекомендации о возможности и особенностях применения исследуемых технологий распознавания изображений в решении задач машинного зрения. Подробно описан код на языке Matlab, который позволяет разобраться в тонкостях программирования алгоритмов с использованием библиотек Computer Vision System Toolbox,
Работа была посвящена изучению современнных технологий при создании алгоритмов машинного зрения. Был проведен обзор по теме техническое зрение в ходе которого определили особенности реализации алгоритмов. Было установлено, что такие понятия, как «компьютерное зрение», «обработка изображений», «анализ изображений», «зрение робота» и «машинное зрение» применяются в тесно связанных предметных областях, что говорит об идентичности основных технических приемов, которые используются и разрабатываются.
Был проведен обзор относительно нового расширения Computer Vision System Toolbox в среде разработки Matlab. На базе существующих примеров из документации к среде разработки были реализованы методы распознавания статического изображения с помощью точечного подбора и многоклассового классификатора. Выбранные методы базируются на использовании процедур Speeded-Up Robust Features (SURF), HOG (от англ. Histograms of Oriented Gradients гистограмма направленных градиентов). Для отслеживания обнаруженных объектов на изображениях был реализован алгоритм Kanade-Lucas-Tomasi feature tracker (KLT).
Были проведен сравнительный анализ работы алгоритмов при различных начальных данных и выявлены особенности их практического использования, сформулированы рекомендации к применению.