ГЛОССАРИЙ 3
ВВЕДЕНИЕ 4
1 ВВЕДЕНИЕ В ПРЕДМЕТНУЮ ОБЛАСТЬ 6
2 ЦЕЛИ И ЗАДАЧИ 9
3 ОПИСАНИЕ СТРУКТУРЫ КОМПЛЕКСА 10
4 АНАЛИЗ ИНСТРУМЕНТОВ 12
5 ПРЕДВАРИТЕЛЬНАЯ НАСТРОЙКА 14
5.1 Определение оптимального фокусного расстояния 14
6 ОБЗОР АЛГОРИТМА 17
7 ВЫДЕЛЕНИЕ ОБЪЕКТОВ 19
7.1 Предварительный анализ существующих решений 19
7.2 Разметка. Инструмент разметки 19
7.3 Виды разметки 20
7.4 Обучение нейросетей 22
7.4.1 Выбор архитектуры 22
7.4.2 Выделение региона интереса 23
7.4.3 Выделение рейки и канала 25
7.4.4 Выделение секторных пластинок 26
7.5 Аугментация 27
7.6 Алгоритм обучения 29
7.7 Оценка производительности и точности 31
7.7.1 Производительность 31
7.7.2 Точность 31
7.8 Результаты 32
8 ТРЕКИНГ ОБЪЕКТОВ 35
8.2 DeepSort 35
8.3 Оптический поток 38
9 ПОСЛЕДУЮЩАЯ РАБОТА 39
ЗАКЛЮЧЕНИЕ 41
СПИСОК ЛИТЕРАТУРЫ 42
ПРИЛОЖЕНИЕ А 43
ПРИЛОЖЕНИЕ Б 45
ПРИЛОЖЕНИЕ В 47
ПРИЛОЖЕНИЕ Г
В последнее время широко заметны тенденции к цифровой трансформации бизнеса. Все чаще выполнение рутинных задач делегируется компьютерам с целью экономии времени персонала и денег компании. Развитие компьютерного зрения позволяет автоматизировать задачи связанные с распознаванием образов на фотографиях и видео. Еще 10 - 15 лет назад автоматизация подобного рода задач была крайне затруднительна.
Сейчас, благодаря развитию нейросетевых алгоритмов, появились новые возможности в распознавании образов. Причем постоянно появляются все новые области и сценарии применения компьютерного зрения.
В результате анализа тенденций развития рынка компьютерного зрения в России и сравнения их с мировыми трендами, оценка объема рынка компьютерного зрения России в 2018 г., по данным Tadviser [2], составила около 8 млрд. руб.
В оценку рынка компьютерного зрения в России были включены три его основных сегмента: программное обеспечение, услуги и оборудование. Факторы оценки: генерируемый каждым сегментом доход, а также объем продаж оборудования и программного обеспечения, относящихся к технологиям машинного зрения.
К концу 2023 г. объем рынка компьютерного зрения в России, по оценке Tadviser, может достигнуть и превысить 38 млрд руб. при сохранении курса рубля на дату исследования, а также при сохранении текущих тенденций развития цифровой экономики.
Это наглядно демонстрирует большую потребность бизнеса в решениях видеоаналитики на основе компьютерного зрения.
Одной из классических задач компьютерного зрения, нашедшего широкое применение в прикладных областях, является распознавание различных объектов и прослеживание их перемещения на видео.
Под объектом в этих задачах понимается не только ограничивающая рамка, а метка объекта в самом широком смысле. Это может быть маска сегментации, координаты центра объекта, выделенный левый или правый край объекта, скелетная модель, или любое множество точек, произвольным образом описывающих объект.
Трекинг объектов особенно актуален для автоматизации видеоаналитики на производствах. Будь это слежение за соблюдением персоналом техники безопасности, слежение за корректным соблюдением всех этапов технологического процесса с целью контроля качества изделий, или автоматизация рутинных проверок с целью экономии средств.
В данной работе рассматривается задача выделения и трекинга объектов как часть разработки прототипа системы определения кривизны лавного привода, в рамках сервиса видеоаналитики, который реализуется силами команды из нескольких человек в компании NTR Lab.
В результате данной работы был реализован прототип системы выделения объектов в видеопотоке. На базе выделенных объектов реализован прочий функционал, требуемый заказчиком.
Была проведена демонстрация проекта, в результате которой было принято решение продолжить сотрудничество с нами. На текущий момент разработка системы продолжается.