Введение 3
Цель 5
Глава 1. Контурный анализ 6
1.1 Бинаризация изображения 6
1.2 Получение контуров 7
1.3 Получение свойств контуров 8
1.3.1 Пример работы программы 13
Глава 2. Проверка достоверности подхода 15
2.1 Исследование первое 15
2.2 Исследование второе 16
2.3 Вывод 18
2.4 Программная реализация 18
Глава 3. Классификация изображений 22
3.1 Кластерный анализ 23
3.1.1 Кластеризация методом k-means 24
3.2 Кластеризация контуров 25
3.2.1 Программная реализация 26
3.3 Нейронные сети 32
3.3.1 Персептрон 33
3.3.2 Классификация изображений нейронной сетью 35
3.4 Существующие решения 38
Заключение 40
Список литературы 41
Каждый день в мире делается огромное количество новых фотоснимков. Люди фотографируют ландшафтные пейзажи, городские достопримечательности, лица друзей, природные памятники и многое другое. Значительная часть этих снимков попадает в интернет, однако алгоритмы поиска по графическим изображениям до сих пор не достигли желаемого уровня. Для ускорения поиска можно приписывать каждому изображению набор отличительных признаков, например, присутствие на картинке характерных объектов: домов, водоёмов, деревьев, людей. Также можно различать изображения по наличию крупных или мелких деталей, присутствию перспективы, контрастных границ однородных цветовых полей, характерных текстур и других свойств. В представленной работе исследуется возможность отнести растровое изображение к заданному типу при помощи анализа свойств контуров, которые можно выделить на растровом изображении, приведя его к бинарному виду.
Решение текущей задачи важно, для компьютерного зрения, о чём говорится во многих работах, например, в [1], [2], [4], данная наука появилась относительно недавно и очень быстро развивается, растёт спрос на специалистов в данной области. Множество методов уже применяется на практике, например - камеры на дорогах фиксирующие превышение скорости, сканеры штрих кодов, кодирование адресов сайтов в QR - коды и многие другие [1], [2].
Проводимое исследование будет полезно в задачах распознавания и компьютерного зрения, результаты исследования так же можно использовать как предобработку перед сегментацией какого-либо объекта, а также для поиска тематических изображений в интернете.
Задача данного исследования: научится распознавать и различать друг от друга изображения водной поверхности, лесных массивов, городской местности, фотографии горных массивов и полей.
Подобные задачи, как правило решают сверточными [6-10] нейронными сетями, такой способ требует больших вычислений, для качественных изображений обучение такой сети занимает достаточное количество времени [6, 8-10], т.к. сеть принимает на вход изображение попиксельно, а если изображений порядка 2 тысяч, то время работы сети может длится очень долго. Также для нейронной сети требуется, чтобы вход в сеть был одинаковый для всех примеров [6, 9-10], это означает, что если изображения в выборке разных размеров, то их необходимо сжимать, растягивать, и обрезать, что тоже занимает много времени. Поэтому было решено рассмотреть данную задачу с помощью анализа свойств контуров и использовать классические нейронные сети типа персептрон в качестве классификатора. Таким подходом так же решали задачу распознавания объектов [8-10], в качестве входных данных подавались, как и в свёрточную сеть изображения попиксельно, что не сильно ускорило работу, и ухудшало точность распознавания. В данной работе предлагается посмотреть на другой способ классификации изображений, когда изображение задаётся не всеми его пикселями, а лишь всеми контурами изображения с их свойствами.
Распознавание изображений, с помощью анализа свойств контуров, показало хорошие результаты. Максимальная точность, которую получилось достичь 67%. В сравнении с существующими решениями данной задачи, подход показал себя неплохо, если учесть то, что метод работает только с изображениями в бинарном виде. Если же сравнивать с методами, которые учитывают цвет изображения, то алгоритм предложенный в текущей работе проигрывает существующим.
Плюсы подхода:
1) Высокая скорость обучения - это обусловлено тем, что каждое изображение характеризуется малым числом параметров.
2) Нет привязки к цвету фотоснимка или к аппарату его снимающего, т.к. алгоритм проводит бинаризацию.
3) Низкая требовательность к памяти хранения данных, из-за того, что метод работает только с изображениями в бинарном виде, тогда каждый пиксель изображения может быть лишь двух вариантов цветов.
Минусы подхода:
1) Полученная точность на 14% ниже точности, предлагаемой существующими решениями.
2) Сложность выбора свойств контуров для распознавания - вытекает из того, что фотографии могут быть полученными различными способами, с различных ракурсов. И для того, чтобы подобрать нужное свойство, необходимо досконально изучить как можно больше вариантов съёмок.
1. Введение в контурный анализ; приложения к обработке изображений и сигналов / Под редакцией Я.А. Фурмана. М.: Физматлит, 2003. 592 с.
2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. 1072 с.
3. Гернет M. M., Ратобыльский В. Ф. Определение моментов инерции. M.: Машиностроение, 1969. 274 с.
4. В.Т. Фисенко, Т.Ю. Фисенко, Компьютерная обработка и распознавание изображений: учеб. пособие. СПб: СПбГУ ИТМО, 2008. 192 с.
5. Барсегян А.А. Анализ данных и процессов: учебное пособие СПБ.: БХВ- Петербург, 2009. 512 с.
6. Немков Р.М. Метод синтеза параметров математической модели сверточной нейронной сети с расширенным обучающим множеством // Современные проблемы науки и образования, 2015. № 1-2.
7. Федоренко Ю.С. Технология распознавания образов с использованием свёрточной нейронной сети // Молодежный научно-технический вестник, 2013. № 12.
8. Друки А.А., Милешин М.А. Алгоритмы распознавания рукописных подписей на основе нейронных сетей // Фундаментальные исследования, 2014. № 11-9. С. 1906-1910.
9. Павлов Н.Н., Степанов А.П. Распознавание образов на основе сверточной сети для операционной системы андроид // Аммосов-2014 Сборник материалов всероссийской научно-практической конференции, проводимой в рамках Форума научной молодежи федеральных. университетов Северо-Восточный федеральный университет им. М.К. Аммосова / Под ред. Н.В. Малышевой. Киров: МЦНИП, 2014. С. 1089-1093.
10. Соладтова О.П. Применение сверточной нейронной сети для распознавания рукописных цифр // Компьютерная оптика, 2010. №2.
11. Calinski R. B., Harabasz J. A dendrite method for cluster analysis // Communications in Statistics. 1974. Vol. 3, No 1. P. 1-27.
12. Лепский А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций. Таганрог: ТТИ ЮФУ, 2009. 155 с.