Тип работы:
Предмет:
Язык работы:


Сравнительный анализ дескрипторов особых точек изображений с внедрением алгоритмов под операционной системой «Android»

Работа №74496

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы40
Год сдачи2016
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
200
Не подходит работа?

Узнай цену на написание


Введение 3
Цель 5
Глава 1: Алгоритмы обнаружения особых точек и их дескрипторов 6
1.1 ORB - Oriented FAST and Rotated BRIEF 7
1.2 BRISK - Binary Robust Invariant Scalable Keypoints 9
1.3 AKAZE - Accelerated-KAZE 11
Глава 2: Сравнение изображений 13
2.1 Расстояние между дескрипторами 13
2.2 Алгоритм RANSAC - Random sample consensus 14
2.3 Критерий сходства изображений 15
2.4 Группировка по степени сходства 16
Глава 3: Программная реализация 18
Глава 4: Результаты работы алгоритмов 20
4.1 Тестирование программы 20
4.2 Сравнительный анализ 23
4.1.1 Анализ результатов первой группы 24
4.1.2 Анализ результатов второй группы 26
4.1.3 Анализ результатов третьей группы 27
4.1.4 Контрольное тестирование 28
Выводы 29
Заключение 30
Список литературы 31
Приложение 33

Уже несколько десятилетий ученые из разных стран занимаются разработкой алгоритмов, позволяющих научить компьютер видеть так же, как видит сам человек. Если для людей получать необходимую информацию посредством зрительного канала является чем-то простым и само собой разумеющимся, то обучить компьютер подобным вещам является и по сей не выполнимой задачей. Множество IT корпораций работают над её решением, но это требует большого вложения человеческого труда, финансовых затрат и вычислительных мощностей.
Но существуют методы, которые позволяют, хоть и при использовании в узконаправленных задачах, получить желаемый результат при меньших затратах. Они основаны не на структуре человеческого аппарата анализа и интерпретации изображений, а непосредственно на особенностях самого изображения. Одни из таких методов основаны на нахождении особых точек и их численного описания, на которые люди даже не обращают внимания. Основываясь только на наборе таких данных цифрового изображения можно с достаточно высокой точностью позволить компьютеру работать с визуальными образами подобно человеку. Вопрос эффективности таких алгоритмов ставится наиболее остро при работе на мобильных устройствах - смартфонах, без которых сложно представить образ современного человека .
С помощью мобильных устройств люди делают тысячи фотографий каждый день, нередко они получаются плохого качества и возникает необходимость делать повторные снимки . Со временем это может привести к засорению памяти из-за накопления большого количества похожих фотографий.
В данной работе сравниваются несколько современных методов поиска особых точек и расчета их дескрипторов, по результатам их применения в классификаторе, объединяющего в группы снимки по степени сходства.
Обзор литературы
Разработкой алгоритмов, обнаруживающих особые точки изображений и описывающие определенные их свойства, занимаются достаточно давно. Внедряются новые подходы для решения проблем скорости работы и качества находимых особенностей. Так же проводятся сравнения между методами по различным критериям.
В [1] рассматривается алгоритм ORB (Oriented FAST and Rotated BRIEF), представляющий из себя комбинацию из модифицированных алгоритмов нахождения особых точек с помощью FAST [4] и последующим определением их особенностей в виде бинарной строки по модифицированному методу BRIEF [5]. Данный подход дает, по результатам их тестирования, значительный выигрыш в скорости при сопоставимой или лучшей точности, чем SIFT (Scale Invariant Feature Transform) [8] и SURF (Speeded Up Robust Features) [9] соответственно.
В работе [2] представлен алгоритм BRISK (Binary Robust Invariant Scalable Keypoints), в котором особые точки обнаруживаются с использованием FAST [4] при линейном изменении масштаба начального изображения. Дескрипторы описываются в бинарном виде по улучшенному алгоритму BRIEF [5]. В сравнительных тестах получена сравнимая с SIFT [8] и SURF [9] точность на различном типе изображений, но при этом скорость работы алгоритма, по их результатам, в разы выше.
В [7] представлен алгоритм A-KAZE, в котором поиск особых точек осуществляется при нелинейном масштабировании изображения с использованием схемы FED (Fast Explicit Diffusion) [8]. В качестве бинарного дескриптора применяется M-LDB (Modified-Local Difference Binary). Результаты работы алгоритма, по данным приведенных исследований, превосходят по всем параметрам ORB, BRISK, SIFT и SURF.
Цель
Целью данной работы является проведение сравнительного анализа методов ORB, BRISK, AKAZE, нахождения особых точек изображения и их дескрипторов. Для достижения поставленной цели предполагается разработать прототип приложения под мобильные устройства под ОС “Android”.
Решение данной задачи требует реализации следующих этапов:
1. Рассмотреть методы поиска особых точек и дескрипторов.
2. Применить алгоритмы сопоставления дескрипторов изображений.
3. Разработать критерий сходства изображений по содержанию.
4. Разработать алгоритм распределения по группам коллекции фотографий.
5. Создать программную реализацию для проведения исследований.
6. Провести оценку результатов на различного типа фотографиях и параметрах алгоритма сопоставления дескрипторов.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе был проведен сравнительный анализ методов поиска особых точек и их дескрипторов. Для достижения поставленной задачи была разработана программа для мобильных устройств под ОС “Android”.
Данная программа включает в себя:
1. Реализацию методов ORB, BRISK, AKAZE.
2. Сопоставление дескрипторов изображений.
3. Фильтрация полученных связей дескрипторов.
4. Сравнение изображений, по разработанному критерию сходства.
5. Распределение по группам схожих изображений, на основе разработанного алгоритма классификации.
Были проведены сравнительные тесты работы алгоритмов:
1. При различных параметрах алгоритма сопоставления дескрипторов.
2. На двух степенях сжатия изображений.
3. На трех различных группах фотографий.
В результате выделен наилучший метод поиска особых точек и расчета их дескрипторов, определены оптимальное пороговое значение алгоритма сопоставления и необходимый уровень сжатия исходных изображений.


1. Ethan Rublee, Vincent Rabaud, Kurt Konolige, Gary Bradski: "ORB: an efficient alternative to SIFT or SURF", Computer Vision (ICCV), IEEE International Conference on. IEEE, pp. 2564 - 2571, 2011.
2. Stefan Leutenegger, Margarita Chli, Roland Siegwart: “BRISK: Binary
Robust Invariant Scalable Keypoints”. Computer Vision (ICCV),
pp. 2548 - 2555, 2011.
3. Pablo F. Alcantarilla, Jesus Nuevo, Adrien Bartoli: “Fast Explicit Diffusion for Accelerated Features in Nonlinear Scale Spaces”. In British Machine Vision Conference (BMVC), 2013.
4. Rosten, Edward, Tom Drummond: "Machine learning for high-speed corner detection”, 9th European Conference on Computer Vision (ECCV), pp. 430 - 443, 2006.
5. Michael Calonder, Vincent Lepetit, Christoph Strecha, Pascal Fua, “BRIEF: Binary Robust Independent Elementary Features”, 11th European Conference on Computer Vision (ECCV), pp. 778 - 792, 2010.
6. S. Grewenig, J. Weickert, C. Schroers, A. Bruhn: “Cyclic Schemes for PDE- Based Image Analysis”, In International Journal of Computer Vision, 2013.
7. X. Yang, K. T. Cheng: “LDB: An ultra-fast feature for scalable augmented reality”. In IEEE and ACM Intl. Sym. on Mixed and Augmented Reality (ISMAR), pp. 49 - 57, 2012.
8. Lowe, David G.: “Object recognition from local scale-invariant features”. Proceedings of the International Conference on Computer Vision, pp. 1150 - 1157, 1999.
9. Herbert Bay, Tinne Tuytelaars, Luc Van Gool, "SURF: Speeded Up Robust Features”. Proceedings of the ninth European Conference on Computer Vision , pp. 404 - 417, 2006.
10. Harris, C., Stephens, M.: “A Combined Corner and Edge Detector”. Proceedings of the 4th Alvey Vision Conference, pp. 147 - 151, 1988.
11. J. Weickert, H. Scharr.: “A scheme for coherence-enhancing diffusion filtering with optimized rotation invariance ”, Journal of Visual CommunicaHon and Image Representation, pp. 103-118, 2002.
12. Patent SIFT: https://www.google.com/patents/US6711293
13. Patent SURF: http://www.google.com/patents/US20090238460
14.OpenCV: http://opencv.org
15.JSON, A Java serialization/deserialization library:
https://github.com/google/gson


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ