Введение 3
Постановка задачи 5
Обзор литературы 7
1 Дифференциальный метод оптического потока 8
1.1 Схема решения задачи 8
1.2 Расчет разностной схемы 9
1.3 Решение системы линейных алгебраических уравнений 12
1.4 Сходимость метода последовательной верхней релаксации 15
2 Реализация метода и проверка результатов 17
2.1 Алгоритм программы 17
2.2 Пирамиды изображений 17
2.3 Подсчет смешанных производных и производных второго по рядка 19
2.4 Расчет поля скоростей 19
2.5 Пополнение значений оптического потока 20
2.6 Тестовые задачи 21
2.7 Построение входных изображений 24
2.8 Полученные результаты на тестовых задачах 27
Заключение 32
Литература 33
С быстрым ростом развития информационных технологий появилась необходимость в автоматическом и мгновенном определении, какие действия происходят на последовательности кадров. Таким образом, с помощью данной последовательности необходимо воссоздать запечатленное на них пространство и изменения, происходящие с ним с течением времени. С данной задачей и связано появление такого понятия как оптический поток.
На сегодняшний день это словосочетание применимо во многих областях технической разработки, и в большом количестве источников, предоставляющих информацию об оптических потоках, дается свое определение данному понятию. Для полного понимания необходимо привести самое общее определение: оптический поток — это визуальное отображение видимого движения объектов или поверхностей, которое возникает при перемещении объектов или наблюдателя относительно друг друга.
Таким образом, оптический поток может дать важную информацию о пространственных положениях объектов, о характере его движения, о форме рассматриваемого объекта, а также о структуре сцены. Для оптических потоков характерно расширение границ их применений: они используются для создания видео- и фото-спецэффектов, в областях сжатия видео и анализа движения, в компьютерном зрении, в компьютерной томографии и многих других областях. Конечно, большое многообразие алгоритмов, используемых для их получения, является косвенным подтверждением использования оптических потоков в различных областях с распознаванием образов и сигналов.
Оптический поток определяется как «поток» уровней яркости в плоскости изображений. Заметим, что последовательность изображений, упорядоченных во времени, дает возможность оценить зарегистрированное движение или как мгновенную скорость, или как численное смещение.
Градиент изображения является одним из фундаментальных понятий в обработке изображений. Поэтому, в данной работе реализована и построена математическая модель для определения поля скоростей на постоянстве градиента интенсивности, то есть скорость изменения интенсивности постоянна.
Тема данной выпускной работы связана с построением поля скоростей с помощью оптических потоков. Решение полученных уравнений в ходе имеющегося метода, если применить к ним теорию разностных схем, сводится к решению системы линейных уравнений. Линейные системы решаются блочными итерационными методами, и далее показывается сходимость этих методов к единственному решению системы.
Основной целью данной работы является построение поля скоростей для входных изображений с помощью дифференциального метода оптического потока. Существенной целью является реализация данного метода в среде разработки Microsoft Visual Studio на языке С++ с помощью библиотеки OpenCV для проверки метода и анализа полученных результатов.
Работа состоит из двух глав, приложения и списка литературы.
В первой главе приведены главные теоретические положения и основные принципы отыскания оптического потока. Модель, рассматриваемая в рамках представленной работы, расширяет возможности исследования потоков, где плотность интенсивности вдоль траекторий меняется.
Во второй главе рассматриваются общие вопросы компьютерной реализации выбранного метода для решения поставленной задачи. Также приведены результаты обработки с помощью реализованной программы ряда тестовых задач, представляющие собой изображения с различными формами движения.
В заключении подводятся итоги исследования, проведенного в ходе выполнения данной работы, а также формируются окончательные выводы.
На базе проведенных исследований в ходе выполнения выпускной квалификационной работы получены следующие результаты, которые выносятся на защиту:
• Исследована задача построения поля скоростей методом оптического потока на основе предположения о постоянстве градиента интенсивности, построены алгоритм и расчетная схема;
• Реализован данный метод в среде разработки Microsoft Visual Studio на языке С++ с помощью библиотеки OpenCV для проверки метода и анализа полученных результатов;
• Оттестирована программа реализованного метода на примерах с известным полем скоростей.
[1] Fleet D.J., Weiss Y. Optical Flow Estimation. Handbook of Mathematical Models in Computer Vision, 2006, 575 p.
[2] Barron J.L.,Fleet D.J., Beauchemin S. Performance of Optical Flow Techniques. IJCV, 1994, P. 43-77.
[3] Horn B.K.P., Schunck B.G. Determining optical flow. Artificial intelligence, 1981, Vol. 17, P. 185-203.
[4] Форсайт Д.А. Компьютерное зрение. Современный подход: пер. с англ. Понс Жан. - Издательский дом «Вильяме», 2004, 928с.
[5] Humphreys G.W., Bruce V. Visual Cognition: Computational, Experimental, and Neuropsychological Perspectives, 1989, 337p.
[6] Котина Е. Д.. Некоторые вопросы моделирования динамических процессов в радионуклидных исследованиях. ВВМ, 2013, 150с.
[7] Котина Е. Д., Пасечная Г. А. Определение поля скоростей в задачах обработки изображений, Изв. Иркутского гос. ун-та. Cерия: Математика, 2013, том 6, выпуск 3, С. 48-59.
[8] Котина Е. Д. О сходимости блочных итерационных методов. Cерия: Математика, 2012, том 5, выпуск 3, С. 41-55.
[9] Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М. : Наука, 1974, 285 с.
[10] Хорн Б. К. П. Зрение роботов: Пер. с англ. М.: Мир, 1989, 487 c.
[11] Вазов В., Форсайт Дж. Разностные методы решения дифференциальных уравнений в частных производных. М.: С.-Петерб. ун-та, 1963, 487 с.
[12] Burt P.J., Aderlson E.H. The Laplacian Pyramid as a Compact Image Code. IEE Transaction on Communications, 1983, Vol. 31 No. 4, P. 532-540.