Аннотация 3
Аббревиатуры 4
1 Введение 5
2 Общее описание задачи детекции и входных данных . . 6
2.1 Описание задачи 6
2.2 Описание входных данных 6
3 Обзор литературы 8
3.1 Быстрая R-CNN 9
3.2 Модификация: FPN 10
4 Постановка и анализ эксперимента 13
4.1 Данные 13
4.2 Выбор опорной модели 14
4.2.1 Модификация: NDFT 14
4.3 Метрики качества для задачи детекции 16
4.3.1 Локализация 17
4.3.2 Классификация 18
4.3.3 Average Presicion 20
5 Эксперименты 22
5.1 Увеличение выборки реальных данных 22
5.2 Смесь данных без использования модуля NDFT 22
5.3 Смесь данных с использованием модуля NDFT 23
6 Выводы 26
7 Список используемой литературы 27
Проблема недостатка данных для обучения стоит с самого начала революции нейронных сетей. Известно, что чем больше данных принял алгоритм, тем выше его качество. К примеру, существуют стандартизированные аннотированные коллекции данных, состоящих из миллионов примеров для нейросетевых алгоритмов. К большому сожалению, все наборы данных были размечены людьми, это очень трудоемкая работа. Ошибки, выявленные в результате этого кропотливого коллекционирования, очень дорого могут обойтись - градиенты, передающиеся с помощью метода обратного распространения ошибки в нейросети, могут переполнится и алгоритм ничему не научится.
XXI век - век прорывных технологий. Инженеры и ученые стремятся к автоматизации процессов, чтобы достигнуть наивысшего качества. Как сократить время и ошибки при работе над аннотацией данных?
С другой стороны, уже давно существуют программы автоматического генерирования синтетических данных. Но, согласно последним экспериментам ученых-исследователей машинного обучения, нейронные сети очень легко подстраиваются под искуственные данные, не показывая высокого качества работы на реальных размеченных данных.
Почему так происходит? Наш мир гораздо богаче и порой состоит из сложных структур, которых очень сложно описать с помощью детерминированной программы.
Данной проблемой занимается такая область машинного обучения, как Domain Adaptation. Она объясняет, как обучить модель на данных из домена-источника (source domain) так, чтобы она показывала сравнимое качество на целевом домене (target domain).
Научная новизна заключается в постановке задачи минимизации и разработке нового состязательного способа обучения модели для сохранения высокого качества детекции на реальных данных, которых зачастую получить труднее, чем искуственно-созданных.
Рассмотренная мной проблема актуальна и имеет прикладной характер. Результаты, полученные в этой работе, могут использоваться в реальной жизни при разработке нейросетевых алгоритмов.
Прежде всего стоит отметить, что работа направлена на прикладную применимость исследованного модуляNDFT. По результатам экспериментов можно уверенно сказать, что 50 % выборки реальных данных можно заменить синтетической. В данной работе не проводились эксперименты над варицией реальных данных для модуляNDFT, поскольку классификатор с Cross-entropy loss эффективно распознает данные при сбалансированной выборке. Хочется отметить, что эта проблема также решаема с помощью идей, взятых, например, из статьи [30], но это уже тема для отдельного исследования.
Данную модель можно вывести в режим работы реального времени, если заменить блок извлечения признаков на более легкий. Это необходимо для автоматического принятия решений БПЛА.
Поставленная задача успешно выполнена. Думаю, если развивать идеи области машинного обучения Domain Adaptation, то в ближайшем будущем можно тратить гораздо меньше сил на ручную разметку, а также даже по нескольким образом успешно детектировать объекты даже в самых сложных ситуациях.