Одними из важнейших перспективных направлений исследований и разработок являются области машинного обучения, распознавания образов, трекинга и компьютерного зрения. Ускоряющиеся темпы развития технологий информационного общества, развитие робототехники, беспилотных автомобилей и летательных аппаратов, развитие интернета вещей и систем искусственного интеллекта выводят эту область в авангард развития информационных технологий.
В нашу жизнь все больше проникают технологии, использующие методы сбора и анализа данных, кластеризации и классификации, статистического вывода. В корпоративной, промышленной и повседневной жизни повсеместно внедряются технологии распознавания, перешедшие не так давно на новый качественный уровень.
Прогресс развивается, считающиеся сложнейшими ранее задачи сейчас способны выполнятся на современных компьютерах и мобильных устройствах. Развитие виртуальной реальности, дополненной реальности, интернета вещей, усложнение искусственного интеллекта в играх и программном обеспечении требуют новых идей и подходов, нового уровня скорости и точности распознавания образов, а развитие вычислительных мощностей позволяет их реализовать.
Задача трекинга, а именно определение местоположения одного или нескольких объектов в видеопотоке кадров во времени на данный момент является одной из наиболее распространенных и необходимых из задач компьютерного зрения. Она находит применение в составе систем контроля скорости, слежения за территорией, обнаружения объектов, распознавания лиц, беспилотных автомобилях, системах контроля качества на промышленных предприятиях и многих других.
Трекинг принято разделять в зависимости от необходимости отслеживания одного или нескольких объектов. Для отслеживания одиночного объекта на данный момент разработано множество алгоритмов, однако задача трекинга множества объектов (MOT) гораздо более универсальна и применима для широкого спектра прикладных задач.
Отслеживание нескольких объектов является более сложной задачей, особенно в случае их частичного перекрытия (окклюзии), или их значительного сходства, но МОТ гораздо более универсальна и применима для широкого спектра прикладных задач...
В данной выпускной квалификационной работ была создана система трекинга объектов, работающая с любым видеоисточником, на основе сверточной нейронной сети YOLO версии 3. Система успешно определяет местонахождение уникальных объектов, при условии их корректного распознавания нейросетью. Точность и скорость работы системы в будущем можно повысить, использовав более совершенную архитектуру сверточной нейронной сети.
Текущий уровень точности распознавания и трекинга дает возможность использовать данную систему в составе любого программного комплекса для решения прикладных задач отслеживания объектов. Сеть может быть дополнительно обучена для определения классов, отсутствующих в базовом датасете COCO. Данная система готова к использованию в комплексе определения нарушений ПДД, контроля скорости, обеспечения контроля безопасности против проникновения на охраняемую территорию, подсчета объектов с помощью управляемого дрона или БПЛА и многим другим применениям.
Требования технического задания выполнены в полном объеме.