РАЗРАБОТКА И АНАЛИЗ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ ДЛЯ ОПРЕДЕЛЕНИЯ ВИДОВОГО И КОЛИЧЕСТВЕННОГО СОСТАВА ЛИЧИНОК КОМАРОВ НА ИЗОБРАЖЕНИЯХ
ВВЕДЕНИЕ 3
1 Филогенетика и классификация Anopheles 7
1.1 История 7
1.2 Классификация 10
2 Обзор существующих методов детектирования объектов 133
2.1 Извлечение признаков и методики 14
2.1.1 Гистограмма направленных градиентов 148
2.2 Классификация 22
3 Практическая часть 29
3.1 Описание используемых данных 29
3.2 Исследуемые алгоритмы детектирования личинок и предлагаемый алгоритм30
3.2.1 Fast R-CNN 30
3.2.2 HOG - дескриптор и ансамбль решающих деревьев 33
3.3 Результаты работы детектора 39
ЗАКЛЮЧЕНИЕ 43
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 4
Комары - самые опасные переносчики заболеваний человека в мире, среди которых наибольшее значение имеет малярия. Сибирский климат является пригодным для развития малярийного плазмодия и малярия долгое время была большой проблемой для Томской губернии. В связи с глобальным потеплением климата, высоким темпом миграции населения и большой численностью малярийного комара опасная эпидемиологическая обстановка может восстановиться. В настоящем проекте мы впервые предложили разработку сети автономной станций для удаленного наблюдения за численностью и видовым составом малярийных комаров в природных популяциях. Станции должны были размещаться на водной поверхности и регистрировать численность личинок комаров с помощью модуля фотофиксации водной поверхности. Анализ полученных данных должен был проводиться компьютерной программой обученной для распознавания образа личинок. Растровые изображения должны были передаваться по каналу 3G и обрабатываться автоматически с использованием подходов машинного обучения.
В результате разработки таких станций можно проводить исследования динамике численности и видового состава малярийных комаров в зависимости от широты и прямых значений температуры внешней среды. Разветвленная сеть подобных автономных наблюдательных станций должна значительно снизить затраты на экспедиции и анализ материала и необходимо для эффективного мониторинга маляриогенной обстановки на больших территориях России.
В результате проделанных работ по проекту нам удалось разработать и протестировать устройство для оценки численности малярийных комаров от получения первичных данных в виде изображений поверхности воды до обработанных числовых данных. Модуль по определению видов комаров был разработан, но не прошел лабораторные испытания, в связи с невозможностью запуска станции в полевых условиях.
Хотя многие подходы для детектирования объектов уже были предложены, обнаружение объектов все еще является сложной задачей из-за широкой изменчивости появления объектов. Кроме того, это также конкурентная область, так как высокая исследовательская деятельность в этой области постоянно поднимает верхнюю границу точности и эффективности на новый уровень.
Существующие методы обнаружения пешеходов используют комбинации основных функций и обучаемых классификаторов (SVM, повышенные классификаторы и др.).
Целью настоящей работы является разработка и оценка разработанного подхода к обнаружению объектов, в частности личинок комаров на изображениях, в основе которого лежит HOG - дескриптор для извлечения признаков и ансамбля решающих деревьев в качестве классификатора. HOG - дескриптор был выбран исходя из того, что извлечение признаков в современных детекторах производится с помощью нейронных сетей, что делает модель более тяжелой и долгой по времени обучения.
Методы исследования, которые были использованы в работе:
1. Анализ источников, описывающих существующие подходы детектирования объектов на изображении.
2. Разработка оптимального подхода детектирования объектов
3. Проведение экспериментов по детектированию личинок комаров с существующими решениями и разрабатываемым подходом.
4. Расчет, визуализация и интерпретация результатов, полученных в работе.
Научная новизна работы заключается в предложенном подходе детектирования личинок комаров, на основе HOG - дескриптора и ансамбля решающих деревьев. Подход рассматривает изображение методом плавающего окна, выделяет признаки и классифицирует личинки комаров.
Практическая значимость работы состоит в том, что подход применяется в полевых условиях по проекту ВИУ № 8.1.63.2018 “Разработка автономной станции для определения численности и видового состава малярийных комаров в полевых условиях”.
Диссертация состоит из 3 разделов. В первом рассматриваются вводные данные в область классификации малярийных комаров. Во втором разделе рассматриваются существующие методы детектирования объектов на изображении. В третьем приводится описание данных, алгоритмов и описание эксперимента.
В результате выполнения проекта были проанализированы литературные источники, описывающие исследования в сфере разработки наиболее эффективных алгоритмов детектирования объектов на изображении, по результатам анализа был разработан алгоритм детектирования личинок комаров с использованием HOG-дескриптора и ансамбля решающих деревьев. Проведенные эксперименты показали эффективность разработанного подхода на имеющихся данных.
Результаты экспериментов показали, что предложенный HOG- детектор на основе обучения случайных решающих деревьев достигает более высоких показателей качества по сравнению с методами, основанными на линейных классификаторах (SVM + HOG, точность 77,9 % [6]) и каскадах слабых классификаторов (AdaBoost+Haar, точность 95,1 % при величине ложных срабатываний 4,9*10-3). Однако он уступает данным методам при усилении последних несколькими комбинированными признаками и использовании информации о текстуре и цвете личинок (LBP + HOG + GMM, точность 99,3 % при величине ложных срабатываний 3,6*10-3[6]).
Полученные результаты позволят разработать автономную станцию для удаленного контроля над малярийной ситуацией в регионах в рамках проекта от Научного Фонда им. Д. И. Менделеева, что делает вклад не только в научные исследования, связанные с машинным обучением, но и в развитие программы по борьбе с распространением малярии.