Тип работы:
Предмет:
Язык работы:


Локализация объектов на изображении на основе анализа их формы

Работа №111109

Тип работы

Бакалаврская работа

Предмет

математика и информатика

Объем работы44
Год сдачи2021
Стоимость4700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
93
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. АНАЛИЗ СОСТОЯНИЯ ВОПРОСА 7
2. РАЗРАБОТКА АЛГОРИТМА ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА
ИЗОБРАЖЕНИИ НА ОСНОВЕ АНАЛИЗА ИХ ФОРМЫ 10
2.1 Описание алгоритма 10
2.2 Математическая модель алгоритма 12
3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ ПРЕДЛОЖЕННЫХ РЕШЕНИЙ 27
3.1 Программная реализация алгоритма 27
3.2 Тестирование алгоритма 28
ЗАКЛЮЧЕНИЕ 32
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 36



Аннотация. Введение.
В ходе исследований был разработан алгоритм локализации объектов на изображении на основе анализа их формы. Алгоритм включает в себя подготовку изображения к анализу. Сюда входит преобразование цветовой модели из цветовой модели RGB в Gray, что позволяет снизить размерность признакового пространства и увеличить скорость работы предложенного алгоритма. Далее следует применение фильтра Гаусса, необходимое для сглаживания цифровых шумов на изображении. Для выделения границ 5
объектов в алгоритме предусмотрено расчет градиента каждой группы пикселей изображения. Направление градиента квантируется по 45 градусов. Затем, с учетом наиболее часто встречаемого направления вектора градиента осуществляется подавление пикселей, определенных как границы объектов. Путем выполнения двойной пороговой фильтрации осуществляется подавление границ с низкой величиной градиента и усиление границ со средними и высокими значениям величин градиента.
Также алгоритм осуществляет замыкание незамкнутых контуров за счет использовании операций морфологического преобразования (дилатации и эрозии). Затем осуществляется упрощение замкнутых контуров, путем снижения количества опорных точек с применение алгоритма Рамера- Дугласа-Пекера. На заключительном этапе работы алгоритма оценивается форма замкнутых упрощенных контуров объектов. Осуществляется поиск тех контуров, которые удовлетворяют заданным критериям отбора.
Целью работы является разработка алгоритма локализация объектов на изображении на основе анализа их формы.



Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе выполнение исследований представленных в данной бакалаврской работе были сделаны следующие выводы:
1. Обзор научных литературных источников по теме исследования показал, что современные системы компьютерного зрения используются в различных областях науки и техники (анализ медицинских изображений, создание беспилотных транспортных средств, в составе графических редакторов изображений, считывание QR и штрих-кодов и т.д.) при решении задач локализации объектов на изображении.
2. Обзор научных источников показал, что большинство современных алгоритмов применяемых на практике, основано на использовании таких технологий машинного обучения, как сверточные нейронные сети, деревья решений, индуктивные алгоритмы построения классификаторов (такие как метод Виолы-Джонса). Однако для применения технологий машинного обучения при решении задачи локализации объектов на изображении требуется накапливание большой коллекции изображений, на которых алгоритмы будут обучаться. Это не всегда возможно реализовать на практике, поэтому актуальной задачей остается развитие алгоритмов компьютерного зрения основанных на классическом анализе решаемой задачи (без использования машинного обучения).
3. В ходе исследований был разработан алгоритм локализации объектов на изображении на основе анализа их формы. Алгоритм включает в себя подготовку изображения к анализу. Сюда входит преобразование цветовой модели из цветовой модели RGB в Gray, что позволяет снизить размерность признакового пространства и увеличить скорость работы предложенного алгоритма. Далее следует применение фильтра Гаусса, необходимое для сглаживания цифровых шумов на изображении, вносимых алгоритмами сжатия изображения (например, JPEG) и сенсорами (матрицей веб-камеры).
Для выделения границ объектов в алгоритме предусмотрено последовательное выполнение следующих шагов. Сначала осуществляет поиск для каждого пикселя изображения величины и направления градиента. Направление градиента квантируется по 45 градусов. Затем, с учетом наиболее часто встречаемого направления вектора градиента осуществляется подавление пикселей, определенных как границы объектов. Путем выполнения двойной пороговой фильтрации осуществляется подавление границ с низкой величиной градиента и усиление границ со средними и высокими значениям величин градиента.
Также алгоритм осуществляет замыкание незамкнутых контуров за счет использовании операций морфологического преобразования (дилатации и эрозии). Затем осуществляется упрощение замкнутых контуров, путем снижения количества опорных точек с применение алгоритма Рамера- Дугласа-Пекера. На заключительном этапе работы алгоритма оценивается форма замкнутых упрощенных контуров объектов. Осуществляется поиск тех контуров, которые удовлетворяют заданным критериям отбора.
4. На языке программирования Python разработана программная реализация предложенного алгоритма, которая была протестирована на различных изображениях (см. главу 3)
Основные результаты работы были доложены на V Международной научно-практической конференции (школы-семинара) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук»




1. Hahmann, F. Eye Localization Using the Discriminative Generalized Hough Transform [Text] / Ferdinand Hahmann, Heike Ruppertshofen, Gordon Boer, Ralf Stannarius, Hauke Schramm // Joint DAGM (German Association for Pattern Recognition) and OAGM Symposium, DAGM/OAGM 2012: Pattern Recognition - Joint 34th DAGM and 36th OAGM Symposium, Graz, Austria, August 28-31, 2012. Proceedings - Springer-Verlag Berlin Heidelberg 2012. - pp. 155-164
2. Hamouz, M. Hypotheses-Driven Affine Invariant Localization of Faces in Verification Systems [Text] / M. Hamouz, J. Kittler, J. K. Kamarainen, H. Kalviainen // International Conference on Audio- and Video-Based Biometric Person Authentication, AVBPA 2003: Audio- and Video-Based Biometric Person Authentication - 4th International Conference, AVBPA 2003 Guildford, UK, June 9-11, 2003. Proceedings. - Springer-Verlag Berlin Heidelberg 2003. - pp. 276-284
3. Reilly, V. Geometric Constraints for Human Detection in Aerial Imagery [Text] / Vladimir Reilly, Berkan Solmaz, Mubarak Shah // European Conference on Computer Vision ECCV 2010: Computer Vision - ECCV 2010 - 11th European Conference on Computer Vision, Heraklion, Crete, Greece, September 5-11, 2010, Proceedings, Part VI. - Springer-Verlag Berlin Heidelberg
pp. 252-265
4. Das, D. Object Detection and Localization in Clutter Range Images Using Edge Features [Text] / Dipankar Das, Yoshinori Kobayashi, Yoshinori Kuno // International Symposium on Visual Computing, ISVC 2009: Advances in Visual Computing - 5th International Symposium, ISVC 2009, Las Vegas, NV, USA, November 30-December 2, 2009. Proceedings, Part II. - Springer-Verlag Berlin Heidelberg 2009. pp. 172-183
5. Mader, A. Detection and Localization of Landmarks in the Lower Extremities Using an Automatically Learned Conditional Random Field [Text] / Alexander Oliver Mader, Cristian Lorenz, Martin Bergtholdt, Jens von Berg, Hauke Schramm, Jan Modersitzki, Carsten Meyer // International Workshop on Graphs in Biomedical Image Analysis, International Workshop on Imaging Genetics, International Workshop on Mathematical Foundations of Computational Anatomy, GRAIL 2017, MICGen 2017, MFCA 2017: Graphs in Biomedical Image Analysis, Computational Anatomy and Imaging Genetics - First International Workshop, GRAIL 2017, 6th International Workshop, MFCA 2017, and Third International Workshop, MICGen 2017, Held in Conjunction with MICCAI 2017, Quebec City, QC, Canada, September 10-14, 2017, Proceedings. - Springer International Publishing AG 2017. pp. 64-75
6. Sudowe, P. Efficient Use of Geometric Constraints for Sliding- Window Object Detection in Video [Text] / Patrick Sudowe, Bastian Leibe // International Conference on Computer Vision Systems, ICVS 2011: Computer Vision Systems - 8th International Conference, ICVS 2011, Sophia Antipolis, France, September 20-22, 2011. Proceedings. - Springer-Verlag Berlin Heidelberg
pp. 11-20
7. Pallawala, P. Automated Optic Disc Localization and Contour Detection Using Ellipse Fitting and Wavelet Transform [Text] / P. M. D. S. Pallawala, Wynne Hsu, Mong Li Lee, Kah-Guan Au Eong // European Conference on Computer Vision, ECCV 2004: Computer Vision - ECCV 2004 - 8th European Conference on Computer Vision, Prague, Czech Republic, May 11-14, 2004. Proceedings, Part II. - Springer-Verlag Berlin Heidelberg 2004. pp. 139-151
8. Akram, M. Retinal Images: Optic Disk Localization and Detection [Text] / M. Usman Akram, Aftab Khan, Khalid Iqbal, Wasi Haider Butt // International Conference Image Analysis and Recognition, ICIAR 2010: Image Analysis and Recognition - 7th International Conference, ICIAR 2010, Povoa de Varzin, Portugal, June 21-23, 2010, Proceedings, Part II. - Springer-Verlag Berlin Heidelberg 2010. pp. 40-49
9. Zheng, Q. Text Localization and Recognition in Complex Scenes Using Local Features [Text] / Qi Zheng, Kai Chen, Yi Zhou, Congcong Gu, Haibing Guan // Asian Conference on Computer Vision, ACCV 2010: Computer Vision - ACCV 2010 - 10th Asian Conference on Computer Vision, Queenstown, New Zealand, November 8-12, 2010, Revised Selected Papers, Part III. - SpringerVerlag Berlin Heidelberg 2011. pp. 121-132
10. Abdelrahman, M. Solving Geometric Co-registration Problem of Multi-spectral Remote Sensing Imagery Using SIFT-Based Features toward Precise Change Detection [Text] / Mostafa Abdelrahman, Asem Ali, Shireen Elhabian, Aly A. Farag // International Symposium on Visual Computing, ISVC 2011: Advances in Visual Computing - 7th International Symposium, ISVC 2011, Las Vegas, NV, USA, September 26-28, 2011. Proceedings, Part II. - SpringerVerlag Berlin Heidelberg 2011. pp. 607-616
11. Samei, G. Detection and Registration of Ribs in MRI Using Geometric and Appearance Models [Text] / Golnoosh Samei, Gabor Szekely, Christine Tanner // International Conference on Medical Image Computing and Computer-Assisted Intervention, MICCAI 2014: Medical Image Computing and Computer-Assisted Intervention - MICCAI 2014 - 17th International Conference, Boston, MA, USA, September 14-18, 2014, Proceedings, Part I. - Springer International Publishing Switzerland 2014. pp. 706-713
12. Zhang, J. Geometric Constrained Joint Lane Segmentation and Lane Boundary Detection [Text] / Jie Zhang, Yi Xu, Bingbing Ni, Zhenyu Duan // European Conference on Computer Vision, ECCV 2018: Computer Vision - ECCV 2018 - 15th European Conference, Munich, Germany, September 8-14, 2018, Proceedings, Part I. - Springer Nature Switzerland AG 2018. pp. 502-518
13. Maigrot, C. Tampering Detection and Localization in Images from Social Networks: A CBIR Approach [Text] / Cedric Maigrot, Ewa Kijak, Ronan Sicre, Vincent Claveau // International Conference on Image Analysis and Processing, ICIAP 2017: Image Analysis and Processing - ICIAP 2017 - 19th International Conference, Catania, Italy, September 11-15, 2017, Proceedings, Part I. - Springer International Publishing AG 2017. pp. 750-761
14. Kasar, T. Multi-script and Multi-oriented Text Localization from
Scene Images [Text] / Thotreingam Kasar, Angarai G. Ramakrishnan // International Workshop on Camera-Based Document Analysis and Recognition, CBDAR 2011: Camera-Based Document Analysis and Recognition - 4th International Workshop, CBDAR 2011, Beijing, China, September 22, 2011, Revised Selected Papers. - Springer-Verlag Berlin Heidelberg 2012. pp. 1-14
15. Helmer, S. Multiple Viewpoint Recognition and Localization [Text] / Scott Helmer, David Meger, Marius Muja, James J. Little, David G. Lowe // Asian Conference on Computer Vision, ACCV 2010: Computer Vision - ACCV 2010 - 10th Asian Conference on Computer Vision, Queenstown, New Zealand, November 8-12, 2010, Revised Selected Papers, Part I. - Springer-Verlag Berlin Heidelberg 2011. pp. 464-477
...



Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ