ВВЕДЕНИЕ 5
1. АНАЛИЗ СОСТОЯНИЯ ВОПРОСА 7
2. РАЗРАБОТКА АЛГОРИТМА ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА
ИЗОБРАЖЕНИИ НА ОСНОВЕ АНАЛИЗА ИХ ФОРМЫ 10
2.1 Описание алгоритма 10
2.2 Математическая модель алгоритма 12
3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ ПРЕДЛОЖЕННЫХ РЕШЕНИЙ 27
3.1 Программная реализация алгоритма 27
3.2 Тестирование алгоритма 28
ЗАКЛЮЧЕНИЕ 32
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 36
Аннотация. Введение.
В ходе исследований был разработан алгоритм локализации объектов на изображении на основе анализа их формы. Алгоритм включает в себя подготовку изображения к анализу. Сюда входит преобразование цветовой модели из цветовой модели RGB в Gray, что позволяет снизить размерность признакового пространства и увеличить скорость работы предложенного алгоритма. Далее следует применение фильтра Гаусса, необходимое для сглаживания цифровых шумов на изображении. Для выделения границ 5
объектов в алгоритме предусмотрено расчет градиента каждой группы пикселей изображения. Направление градиента квантируется по 45 градусов. Затем, с учетом наиболее часто встречаемого направления вектора градиента осуществляется подавление пикселей, определенных как границы объектов. Путем выполнения двойной пороговой фильтрации осуществляется подавление границ с низкой величиной градиента и усиление границ со средними и высокими значениям величин градиента.
Также алгоритм осуществляет замыкание незамкнутых контуров за счет использовании операций морфологического преобразования (дилатации и эрозии). Затем осуществляется упрощение замкнутых контуров, путем снижения количества опорных точек с применение алгоритма Рамера- Дугласа-Пекера. На заключительном этапе работы алгоритма оценивается форма замкнутых упрощенных контуров объектов. Осуществляется поиск тех контуров, которые удовлетворяют заданным критериям отбора.
Целью работы является разработка алгоритма локализация объектов на изображении на основе анализа их формы.
В ходе выполнение исследований представленных в данной бакалаврской работе были сделаны следующие выводы:
1. Обзор научных литературных источников по теме исследования показал, что современные системы компьютерного зрения используются в различных областях науки и техники (анализ медицинских изображений, создание беспилотных транспортных средств, в составе графических редакторов изображений, считывание QR и штрих-кодов и т.д.) при решении задач локализации объектов на изображении.
2. Обзор научных источников показал, что большинство современных алгоритмов применяемых на практике, основано на использовании таких технологий машинного обучения, как сверточные нейронные сети, деревья решений, индуктивные алгоритмы построения классификаторов (такие как метод Виолы-Джонса). Однако для применения технологий машинного обучения при решении задачи локализации объектов на изображении требуется накапливание большой коллекции изображений, на которых алгоритмы будут обучаться. Это не всегда возможно реализовать на практике, поэтому актуальной задачей остается развитие алгоритмов компьютерного зрения основанных на классическом анализе решаемой задачи (без использования машинного обучения).
3. В ходе исследований был разработан алгоритм локализации объектов на изображении на основе анализа их формы. Алгоритм включает в себя подготовку изображения к анализу. Сюда входит преобразование цветовой модели из цветовой модели RGB в Gray, что позволяет снизить размерность признакового пространства и увеличить скорость работы предложенного алгоритма. Далее следует применение фильтра Гаусса, необходимое для сглаживания цифровых шумов на изображении, вносимых алгоритмами сжатия изображения (например, JPEG) и сенсорами (матрицей веб-камеры).
Для выделения границ объектов в алгоритме предусмотрено последовательное выполнение следующих шагов. Сначала осуществляет поиск для каждого пикселя изображения величины и направления градиента. Направление градиента квантируется по 45 градусов. Затем, с учетом наиболее часто встречаемого направления вектора градиента осуществляется подавление пикселей, определенных как границы объектов. Путем выполнения двойной пороговой фильтрации осуществляется подавление границ с низкой величиной градиента и усиление границ со средними и высокими значениям величин градиента.
Также алгоритм осуществляет замыкание незамкнутых контуров за счет использовании операций морфологического преобразования (дилатации и эрозии). Затем осуществляется упрощение замкнутых контуров, путем снижения количества опорных точек с применение алгоритма Рамера- Дугласа-Пекера. На заключительном этапе работы алгоритма оценивается форма замкнутых упрощенных контуров объектов. Осуществляется поиск тех контуров, которые удовлетворяют заданным критериям отбора.
4. На языке программирования Python разработана программная реализация предложенного алгоритма, которая была протестирована на различных изображениях (см. главу 3)
Основные результаты работы были доложены на V Международной научно-практической конференции (школы-семинара) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук»