Тип работы:
Предмет:
Язык работы:


Формирование виртуального видеопотока на основе кадров из смежных по точке съёмки

Работа №76035

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы44
Год сдачи2016
Стоимость4225 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
100
Не подходит работа?

Узнай цену на написание


ЦЕЛИ, ЗАДАЧИ И ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ 5
ПОСТАНОВКА ЗАДАЧИ ДАННОЙ РАБОТЫ 7
ГЛАВА 1. Определение требований и выбор подхода 8
1.1. Исследование существующих решений в данной области и их оценка.
1.2. Формирование требований и установка ограничений 13
1.3. Вывод 15
ГЛАВА 2. Обзор алгоритмов поиска ключевых точек 16
2.1. Алгоритм Speeded-Up Robust Features (SURF) 17
2.2. Алгоритм Oriented FAST and Rotated BRIEF (ORB) 19
2.3. Вывод 21
ГЛАВА 3. Проектирование и разработка прототипа ПО 22
3.1. Индексирование 23
3.2. Сопоставление ключевых точек 26
3.3. Фильтрация плохих пар ключевых точек 27
3.3.1. Перекрёстная проверка 28
3.3.2. Проверка на соотношение 28
3.3.3. Проверка с RANSAC 29
3.4. Синхронизация потоков видео 30
3.5. Синтезирование общего кадра 31
3.6. Полученные результаты 34
ГЛАВА 4. Тестирование прототипа 35
4.1. Проверка на тестовых данных 35
4.2. Анализ результатов профилирования 36
4.3. Вывод 38
ЗАКЛЮЧЕНИЕ 39
СПИСОК ЛИТЕРАТУРЫ И ИСТОЧНИКОВ 40
ПРИЛОЖЕНИЕ. Рекомендуемые статьи из документации OpenCV 43


В последнее время можно отметить огромный скачок в развитии портативных устройств. Так, например, появление цифровых фото и видео камер привело к популяризации сообщества любителей фотографии, а оснащение мобильных телефонов камерами высокого разрешения только подкрепило этот успех.
В то же время устройства хранения данных не стоят на месте и развиваются огромными темпами. Если в 1970-х годах в качестве накопителя активно использовались магнитные дискеты, то в начале 2000-х появились накопители с флеш-памятью, которые по размерам намного меньше, а по техническим характеристикам превосходят дискеты в несколько десятков раз.
Исследователи и инженеры каждый год разрабатывают новые и улучшают свои старые технологии и устройства, а компании-производители делают их доступными для широкой аудитории. Удешевление и доступность устройств видеозаписи привело к тому, что люди всё чаще и чаще стали фиксировать различные моменты из своей жизни. Будь это какой-то концерт любимой группы или какое-нибудь спортивное мероприятие, будь это путешествие на другой континент или же какое-то необычное событие. В современном обществе всё чаще проявляется тенденция на активное использование социальных сетей, упрощающих процесс хранения и обмена информацией, что также подтверждает статистика загрузки видео файлов на крупнейшие видеохостинги [1].
Всё это привело к тому, что каждый день различные устройства в совокупности порождают сотни терабайт, а то и больше, цифровой информации. Разумеется, чтобы обеспечить возможность эффективного просмотра или поиска данных, нужно использовать специальные инструменты. На помощь нам приходят информационный поиск, базы данных, машинное обучение и компьютерное зрение.
С каждым годом системы компьютерного зрения постепенно внедряются в различные области: начиная с промышленности и заканчивая повседневной жизнью. Основными задачами таких систем являются: анализ и обработка изображений или видео, а также слежение за объектами, их поиск и распознавание. Например, уже с 1970 года задача поиска изображений по содержанию является актуальным направлением исследований [2, 3]. Разумеется, задачи такого класса влекут за собой не только сложность разработки методов решения, но и сложность разработки способа оценивания качества конечных решений [3].
Перед человеком возникает вполне очевидная проблема: для усвоения большого количества цифровой информации может потребоваться огромное количество времени. Можно утверждать, что актуальность данной проблемы подтверждается стремительным ростом цифровой информации и необходимостью в быстрой и качественной её обработке. Следовательно, встаёт вопрос, а что, если бы появилась такая система, которая бы позволила пользователю перемещаться среди элементов коллекции видео?
На сегодняшний день для разработки программного обеспечения наиболее популярной библиотекой компьютерного зрения, в которой реализовано огромное количество популярных алгоритмов, является Open Source Computer Vision Library (OpenCV). Эта библиотека с открытым исходным кодом и распространяется под лицензией BSD, что позволяет использовать её в коммерческих проектах. OpenCV включает в себя огромное количество разных инструментов для работы с изображениями и видео, помимо этого она ещё является и кроссплатформенной. Несомненным плюсом является то, что присутствует поддержка графических процессоров.
Далее в данной работе будет рассмотрен один из способов решения проблемы, конечным результатом которого является прототип программного обеспечения, выполненный с использованием библиотеки OpenCV.
ЦЕЛИ, ЗАДАЧИ И ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ
Основной целью данной работы является повышение эффективности восприятия большого количества цифровой информации и сокращения времени на её визуальный анализ.
Для эффективного восприятия цифровой информации предлагается сформировать виртуальный видеопоток, который позволил бы конечному пользователю перемещаться среди коллекции видео в любой момент времени. Это позволит не только просматривать объекты с разных ракурсов, но и сократить общее время на визуальную обработку. Для достижения поставленной цели предлагается решить задачу проектирования и разработки прототипа программы для создания и работы с виртуальным видеопотоком среди некоторой коллекции видео.
Задача разработки прототипа программы должна обязательно включать в себя решение и других задач, таких как:
• Тестирование алгоритмов поиска ключевых точек;
• Разбор метода использования индексной базы коллекции видео;
• Разбор методик фильтрации плохих пар ключевых точек;
• Разбор метода формирования общего кадра на основе кадров с областью пересечения.
Рассмотренная в данной работе система может использоваться как в важных инфраструктурах, так и в развлекательных проектах. Она может стать частью как офлайновых систем, так и онлайновых сервисов, а в частности:
• Социальные сети с поддержкой видео (с поиском по тегам);
• Видеохостинги;
• Системы хранения информации — архивы.
Область применения подобного программного обеспечения очень широкая, начиная с бытовой сферы и заканчивая промышленностью, особенно можно выделить следующие:
• Критические инфраструктуры (для обеспечения безопасности прилегающей территории);
• Аэропорты, железнодорожные станции, порты (для наблюдения за рабочим процессом);
• Популярные места в городах (для обеспечения порядка в общественных местах, либо для обнаружения нарушителей);
• В супермаркетах и гипермаркетах (для борьбы с нечестными покупателями);
• В спорте и киберспорте (для более наглядной визуализации).


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


С одной стороны, нельзя сказать, что поставленная цель была достигнута, поскольку для такого утверждения необходимо не только иметь конечный программный продукт, но он ещё должен пройти проверку временем. С другой стороны, можно твёрдо заявить, что существуют средства и методы, позволяющие достигнуть цели без высоких затрат на приобретение дорогостоящего оборудования и ПО.
В данной работке в качестве основных ключевых моментов можно выделить следующее:
• После изученных публикаций было выбрано два алгоритма, которые создают описание особых точек. Каждый из них был протестирован на скорость поиска и описания ключевых точек;
• Для уменьшения нагрузки при работе программы в реальном времени было решено использовать файлы со специальной структурой. Каждый такой файл содержит информацию о дескрипторах и ключевых точек каждого кадра;
• Методы сопоставления особых точек нередко показывают большое количество плохих пар, поэтому существует необходимость в их фильтрации;
• Для формирования виртуального потока используется синтезирование общих кадров, которые объединены по некоторой области пересечения.
Решение задач при стремлении достигнуть цель, позволило улучшить список требований, обнаружить ряд проблем и, главное, получить бесценный опыт решения столь сложных задач.



1. Статистика видео сервиса Youtube // URL: http://www.statista.com/statistics/259477/hours-of-video-uploaded-to- youtube-every-minute/(дата обращения: 16.03.2016).
2. Rui Y., Huang T. S. Image retrieval: Current techniques, promising directions, and open issues // Journal of Visual Communication and Image Representation. 1999. 10 (1). С. 39-62.
3. Пименов В. Ю. Простые методы поиска изображений по содержанию // Российский семинар по Оценке Методов Информационного Поиска. 2010. С. 69-79.
4. Производство прямых трансляций // Sony URL: http://www.sony.ru/pro/products/solutions-live-production(дата обращения: 13.01.2016).
5. 4K Live Production System at FIFA Confederations Cup 2013 // Sony URL: https://pro.sony.com/bbsccms/assets/files/micro/4kliveproduction/brochures/4 K_Live_Production_FIFA_Confederations_Cup_2013_Brochure.pdf (дата обращения: 17.01.2016).
6. B&H Photo Video Digital Cameras, Photography, Camcorders URL: http://www.bhphotovideo.com(дата обращения: 04.04.2016).
7. WTS Broadcast: Broadcast and Production URL: http://shop.wtsbroadcast.com(дата обращения: 04.04.2016).
8. Video Stitching Software // LensFrame™ URL: http://www.coherentsynchro.com/portfolios/seo-optimization/(дата обращения: 06.01.2016).
9. Джгаркава Г. М., Лавров Д. Н. Использование метода Surf для обнаружения устойчивых признаков изображения при создании сферических панорамных снимков // МСиМ. 2011. №1 (22) С. 96-99.
10. Шапиро Л., Стокман Дж. Компьютерное зрение. - М.: БИНОМ. Лаборатория знаний, 2006. - 752 с.
11. Schaeffer C. A. Comparison of Keypoint Descriptors in the Context of Pedestrian Detection: FREAK vs. SURF vs. BRISK, 2013.
12. ORB: an efficient alternative to SIFT or SURF / Rublee E., Rabaud V., Konolige K., Bradski G. // Proceedings of 13th International Conference on Computer Vision, Barcelona, 2011.
13. Bay H., Ess A., Tuytelaars T., Van Gool L. «SURF: Speeded Up Robust Features», Computer Vision and Image Understanding (CVIU), Vol. 110, No. 3, pp. 346-359, 2008.
14. Chao J., Al-Nuaimi A., Schroth G., Steinbach E. G. (2013), Performance comparison of various feature detector-descriptor combinations for content-based image retrieval with JPEG-encoded query images., in 'MMSP', IEEE, pp. 29-34.
15. David G. Lowe, «Object recognition from local scale-invariant features» // International Conference on Computer Vision, Corfu, Greece (September 1999), pp. 1150-1157.
16. Патент «Object detection using extended surf features» (US 20130272575 A1)
17. Rosten E., Drummond T. Machine learning for high speed corner detection // 9th European Conference on Computer Vision. Vol. 1. 2006. pp. 430-443.
18. Calender M., Lepetit V., Strecha C., Fua P BRIEF: Binary Robust Independent Elementary Features // 11th European Conference on Computer Vision (ECCV), Heraklion, Crete. LNCS Springer, September 2010.
19. Волков А.Г., Семёнов С.В., Севрюков С.Ю. Оценка влияния размера словаря «Мешка визуальных слов» и компрессии кадра на скорость и точность классификации видео // Процессы управления и устойчивость. 2016 (готовится к печати)
20. Дмитриев Д. В., Капранов С. Н. Применение алгоритмов сегментации для классификации изображений [Электронный ресурс] // Современные проблемы науки и образования. 2014. № 6. URL:http://www.science- education.ru/ru/article/view?id=16490(дата обращения: 17.03.2016).
21. Hastie T., Tibshirani R., Freidman J. The elements of statistical learning. Data mining, inference and prediction. 2001. 745 p.
22. Martin A., Fischler and Robert C. Bolles «Random Sample Consensus: A Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography» // Comm. Of the ACM 24: 381-395.
23. O. Chum and J. Matas, Randomized RANSAC with test // 13th British Machine Vision Conference, September 2002.
24. O. Chum and J. Matas, Matching with PROSAC - progressive sample consensus // Proceedings of Conference on Computer Vision and Pattern Recognition (San Diego), vol. 1, 2005, pp. 220-226.
25. R. Szeliski. Image Alignment and Stitching. In N. Paragios, Y. Chen, and O. Faugeras, editors, Handbook of Mathematical Models in Computer Vision, pp. 273-292. 2005.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ