Введение 4
1. Постановка задачи 5
2. Описание и подготовка данных 6
3. Специфика задачи 8
4. Метрики оценки качества 10
5. Существующие подходы к локализации объектов на изображении 12
5.1. Контурный анализ 12
5.2. HOG/SVM 13
5.3. Свёрточные нейронные сети 15
5.3.1. R-CNN 17
5.3.2. YOLO 18
6. Предложенный алгоритм локализации напитков 19
7. Классификация напитков 22
8. Результаты 24
9. Недостатки предложенного подхода 26
Заключение 27
Список литературы
Прорывы, произошедшие в компьютерном зрении в последние несколько лет, открыли ранее недостижимые горизонты и вдохновили специалистов искать новые сферы применения технологиям компьютерного зрения.
Одна из таких новых задач, которую всё чаще ставят перед собой крупные зарубежные торговые холдинги, - это задача автоматической проверки правильности раскладки товаров на полках магазинов.
Выкладка товаров является особым инструментом достижения целей мерчендайзинга. Практика показала, что отдельные точки пространства торгового зала магазина по-разному стимулируют продажи. Следовательно, товары и их марки могут получить конкурентные преимущества в зависимости от занимаемых ими мест на прилавках.
Раскладку товара нужно периодически, по мере опустошения полок, корректировать, а необходимость этого - сначала проверить. Кроме того, такая проверка требуется начальству торгового заведения для оценки качества работы соответствующего персонала. Сейчас этим, за редким исключением, занимаются люди, что стоит торговым сетям ощутимых денег. Закономерно, что появилось желание ради сокращения издержек проверять раскладку товара автоматически. А в последние годы, в связи с прорывами в области компьютерного зрения, подобные автоматические системы становятся реальностью. Схема работы следующая:
1. Сотрудник магазина или аппаратура делает снимок витрины
2. На изображении находятся и распознаются товары
3. Расположение товаров сравнивается с планограммой, генерируется отчёт о выкладке
Сложная часть схемы - второй пункт, автоматическое обнаружение и распознавание товара на фото. Именно это и является предметом исследования в данной работе.
В рамках работы были выполнены следующие задачи:
• Написано приложение с графический интерфейсом для разметки и подготовки данных
• Разработан гибридный алгоритм локализации напитков на фотографиях магазинных прилавков. Предложенный алгоритм использует специфику задачи и сочетает HOG-дескрипторы и SVM с глубокими нейронными сетями.
• Спроектированы и обучены нейронные сети, распознающие определённые виды бутылок и банок. Внесённая модификация (SVM с замороженными параметрами) позволила добиться удовлетворительной точности для бутылок даже на тех классах, для которых было очень мало тренировочных данных.