🔍 Поиск готовых работ

🔍 Поиск работ

ОБНАРУЖЕНИЕ ОБЪЕКТОВ ВИДЕОРЯДА НА ОСНОВЕ ТЕХНОЛОГИИ МАШИННОГО ОБУЧЕНИЯ (НА ПРИМЕРЕ ЛЕСНЫХ ПОЖАРОВ)

Работа №201454

Тип работы

Диссертация

Предмет

информатика

Объем работы167
Год сдачи2023
Стоимость700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
19
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
ГЛАВА 1 АНАЛИЗ АЛГОРИТМОВ И МЕТОДОВ ОБНАРУЖЕНИЯ
ОБЪЕКТОВ 11
1.1. Актуальность исследования, обзор состояния проблемы 11
1.2. Обнаружение пожара в лесу с помощью цветовой обработки 15
1.3. Обнаружение пожара в лесу с помощью цветовой обработки и
выделения динамических признаков 17
1.3.1 Временная разница 18
1.3.2 Вычитание фона 18
1.3.3 Оптический поток 19
1.4. Классификация объектов 20
1.4.1 Классификация на основе обучения 21
1.4.2 Статистическая классификация 21
1.5. Обнаружение пожара в лесу с использованием методов глубокого
обучения 22
1.6. Опорные области для обнаружения объектов 33
1.7. Локализация ограничивающей рамки, объединение предсказаний .... 36
1.8. Рекуррентные нейронные сети 39
1.9. Используемые метрики оценки качества детектирования объектов ... 41
1.10. Выводы по первой главе 44
ГЛАВА 2 ТЕХНОЛОГИЯ ОБНАРУЖЕНИЯ ОБЪЕКТОВ ВИДЕОРЯДА НА ОСНОВЕ ТЕХНОЛОГИИ МАШИННОГО ОБУЧЕНИЯ (НА ПРИМЕРЕ ЛЕСНЫХ ПОЖАРОВ) 46
2.1. Разработка алгоритма обнаружения дымового облака 46
2.2. Разработка алгоритма выделения динамических признаков объекта . 49
2.3. Разработка алгоритма локализации объектов на изображении 53
2.3.1 Трекинг объектов детектором EfficientDet 53
2.3.2 Алгоритм кластеризации прогнозов 58
2.4. Разработка алгоритма фильтрации обнаруженных объектов 64
2.5. Состав комплекса программных средств 72
2.6. Выводы по второй главе 75
ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ РАЗРАБОТАННЫХ
АЛГОРИТМОВ 77
3.1. Подготовка эксперимента 77
3.2. Тестирование программной реализации алгоритмов 79
3.3. Выбор модели НС 87
3.4. Результаты тестирования алгоритмов объединения предсказаний 91
3.5. Результаты тестирования классификатора 96
3.6. Результаты тестирования технологии раннего обнаружения
пожароопасных объектов в лесном массиве 104
3.7. Оценка работоспособности предложенных алгоритмов при решении
различных задач 107
3.7.1 Выделение динамических признаков для отслеживания
перемещений дистального конца катетера 107
3.7.2 Обнаружение объектов в решение задачи навигации роботов .. 111
3.7.3 Фильтрация обнаруженных объектов с помощью гибридной
архитектуры НС в задаче оценки парковочного пространства 113
3.8. Выводы по третьей главе 119
ЗАКЛЮЧЕНИЕ 120
СПИСОК СОКРАЩЕНИЙ И ОПРЕДЕЛЕНИЙ 122
СПИСОК ЛИТЕРАТУРЫ 124
ПРИЛОЖЕНИЕ А 137
ПРИЛОЖЕНИЕ Б 141
ПРИЛОЖЕНИЕ Г

Актуальность темы исследования. Обнаружение объектов в видеоряде является одной из ключевых проблем исследований в области искусственного интеллекта, которые включены в направление Н1 Стратегии научно-технического развития Российской Федерации. При разработке эффективных методов и алгоритмов обнаружения объектов на основе таких признаков как форма, цвет и текстура требуется учитывать ряд мешающих факторов: размытие объектов при движении, вариативность признаков, изменение условий освещения, перекрытие объектов в процессе перемещения и другие. Игнорирование этих факторов может привести к снижению точности обнаружения и увеличению вероятности ложного срабатывания систем распознавания.
Перспективными инструментами для решения задач анализа статических и динамических признаков на кадрах видеозаписей являются технологии машинного обучения, в частности нейронные сети (НС). Для их применения необходимо осуществлять сбор, разметку и предварительную подготовку исходных данных; выбор модели и подбор параметров архитектуры НС; тонкую настройку гиперпараметров НС, т.е., скорости обучения и объема данных (размера батча) с целью снижения времени сходимости в процессе обучения; интерпретацию результатов анализа данных НС, в том числе анализ хронологии изменения объекта в видеоряде.
Задачи автоматического обнаружения динамических объектов в видеопотоке являются наиболее актуальными в таких приложениях, как автоматическое распознавание лиц [1], медицинская диагностика [2], робототехника [3], транспортные системы [4] и др.
Одним из приложений, имеющих социально важное значение, является разработка систем раннего обнаружения лесных пожаров [5]. Ежегодно в Российской федерации фиксируется от 10000 до 35000 лесных пожаров, а их общая площадь превышает 1 млн га. Согласно заявлению Федерального агентства лесного хозяйства в 2022 году общая площадь лесных пожаров в России составила 8,96 млн га, а за последние 3 года в среднем выгорело около 17,8 млн га леса. При этом экономический ущерб составил в среднем 9,7 млрд рублей.
На точность обнаружения пожаров влияет множество факторов, включая освещенность, погодные условия, прозрачность окружающей среды, схожесть характерных признаков с облачностью и туманностью. Дополнительные сложности при обнаружении пожаров создает непостоянство таких признаков, как форма, цвет и текстура. При этом пожар является одним из наиболее сложных объектов обнаружения. Поэтому существует необходимость разработки специальных методов и алгоритмов, учитывающих мешающие факторы, которые влияют на точность и надежность обнаружения объектов в видеоряде.
Целью диссертационной работы является разработка технологии и алгоритмов обнаружения объектов, обладающих динамическими признаками на изображениях видеоряда, обеспечивающих высокое качество распознавания.
В связи с поставленной целью должны быть решены следующие задачи:
- провести анализ существующих методов и алгоритмов обнаружения объектов видеоряда с динамическими признаками;
- разработать технологию автоматического обнаружения объектов с динамическими признаками, состоящими из предложенных и реализованных алгоритмов;
- разработать программное обеспечение и провести вычислительный эксперимент с целью оценки качества результатов обнаружения объектов, полученных на основе предлагаемых алгоритмов.
Методы исследования. Использованы методы цифровой обработки изображений, технология компьютерного зрения, методы преобразования и анализа изображений, машинного обучения и прикладного программирования. Экспериментальные численные исследования проводились с использованием методов математического анализа, моделирования и математической статистики.
Научная новизна
- Предложена технология анализа изображений в видеопоследовательности, позволяющая достичь высокой точности обнаружения объектов за счет локализации и классификации каждого объекта с учетом как статических, так и динамических признаков.
- Предложен и обоснован алгоритм объединения предсказаний нейросети, позволяющий объединять плотные группы объектов, выделенных на основе статических признаков в один объект на основе оценки отношения площадей пересечения соседних объектов, используемые для формирования кластеров, локализующих распознаваемые объекты.
- Разработан алгоритм классификации обнаруженных объектов на основе, состоящей из сверточной и рекуррентной нейросетей гибридной архитектуры, обеспечивающей неявное представление хронологии изменения объектов при повышении точности классификации изображений в видеопотоке.
Достоверность полученных результатов диссертационной работы подтверждается результатами тестирования, апробации и внедрения разработанных алгоритмов и технологии на собственных и общедоступных базах изображений.
Практическая ценность работы. Разработанные в диссертационной работе алгоритмические и программные средства могут быть использованы для решения задач обнаружения объектов видеоряда в различных прикладных областях: медицинская диагностика, контроль перемещений роботов, мониторинг местности и т.п.
Положения, выносимые на защиту:
1. Технология анализа изображений в видеопоследовательности на основе предложенных алгоритмов локализации и классификации с учетом статических и динамических данных позволяет достичь высокой точности классификации объектов по метрике F-score не менее 95 %.
2. Алгоритм объединения предсказаний нейросети, позволяющий объединять плотные группы объектов, выделенные на основе статических признаков в один объект c целью повышения точности локализации распознаваемых объектов. Реализация предложенного алгоритма позволяет повысить точность локализации на 6 %.
3. Алгоритм классификации обнаруженных объектов на основе предложенной гибридной архитектуры нейросети позволяет увеличить качество классификации по метрике F-score на 9 %.
Реализация и внедрение результатов работы. Результаты
диссертационного исследования использованы при выполнении следующих научно-исследовательских проектов: государственное задание "Наука" №FFSWW- 2020-0014 "Разработка научных основ технологии роботизированной мультипараметрической томографии на основе методов обработки больших данных и машинного обучения для исследования перспективных композиционных материалов", 2020-2022 гг.; грант РФФИ № 20-37-90055 "Методы и интеллектуальные технологии планирования движения беспилотных транспортных средств", 2020-2022 гг.; грант УМНИК №16068ГУ/2020 "Система детектирования и локализации очага возгорания в видеоряде на основе средств компьютерного зрения", 2020-2023 гг.
Результаты работы также используются: в ООО "НТП КИБЕРЦЕНТР" (г. Томск) - в программном обеспечении информационно-телекоммуникационной системы интеллектуального видеонаблюдения и аналитики лесопожарной обстановки (ИТС «ИВА»), в ООО "Спотпаркинг" (г. Томск) - в составе системы для обнаружения автомобилей на парковочном пространстве и в учебном процессе в отделении информационных технологий Инженерной школы информационных технологий и робототехники ТПУ. Акты о внедрении приложены к диссертационной работе.
Апробация. Основные результаты данной работы освещались на следующих конференциях и симпозиумах: Международная научно-практическая конференция
студентов, аспирантов и молодых ученых, г. Томск, 2019 г.; 14-й Международный форум по стратегическим технологиям "IFOST 2019", г. Томск, 2019 г.; XXXIV Международная научная конференция "Математические методы в технике и технологиях", г. Санкт-Петербург, 2021 г.; 4-й Международный семинар по
фотограмметрии и методам компьютерного зрения для видеонаблюдения, биометрии и биомедицины, г. Москва, 2021 г; 31-я Международная конференция по компьютерной графике и зрению "ГрафиКон 2021", г. Нижний Новгород, 2021 г.; International Symposium on Electrical, Electronics and Information Engineering, Online, 2021 г.; 6-я Международная конференция по тестированию программного обеспечения, машинному обучению и комплексному анализу процессов, TMPA 2021, г. Томск, 2021 г.; SIBCON-2022 международная IEEE-сибирская конференция по управлению и связи, г. Томск, 2022 г.
Личный вклад соискателя. Основные научные результаты, выносимые на защиту, получены автором лично. Данная работа выполнена в сотрудничестве с учёными и исследователями, оказавшими содействие при проведении настоящего исследования, а именно: постановка задач исследования по теме диссертации выполнена совместно с научным руководителем Гергет О.М. (Томский политехнический университет); обзор существующих алгоритмов анализа, обработки и визуализации данных выполнен совместно с Даниловым В.В. (Томский политехнический университет) и научным руководителем Гергет О.М. (Томский политехнический университет); сбор, разметка и валидация данных пожаров выполнены совместно с сотрудниками компании «ИНКОМ»; разработка алгоритмов выполнена совместно с Лаптевым В.В. («Спутник») и Колпащиковым Д.Ю. (НОЛ ОАБД ИШИТР, Томский политехнический университет).
Публикации. Основные результаты диссертационного исследования отражены в 13 работах: 5 публикаций в рецензируемых журналах,
рекомендованных ВАК РФ, из них - 2 публикации проиндексированы в базах научного цитирования Scopus и Web of Science; 1 патент на изобретение, 3 свидетельства о государственной регистрации программ для ЭВМ; 4 статьи в сборниках трудов международных и российских конференций.
Структура и объем диссертации. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы из 133 наименований. Работа содержит 163 страниц основного текста, включая 54 рисунков и 10 таблиц.
Во введении обоснована актуальность темы исследования, сформулированы цель и задачи работы, определена научная новизна, а также отражены практическая значимость и положения, выносимые на защиту.
В первой главе введены необходимые термины и обозначения; проведен обзор методов обнаружения объектов на кадрах видеоряда, описаны известные современные нейросетевые методы обнаружения объектов. Подробно рассмотрены модели рекуррентных нейронных сетей, позволяющих решить задачу выделения временной составляющей движения дымового облака. Проведен анализ алгоритмов объединения прогнозов нейросетевого анализа данных, назначение которых выделить исследуемый объект с нескольких кадров. Обоснована необходимость разработки комплексной технологии раннего обнаружения пожаров.
Во второй главе представлены: технология анализа изображений в видеопоследовательности, на основе предложенных алгоритмов локализации и классификации с учетом статических и динамических данных; алгоритм, позволяющий объединять разрозненные предсказания нейросети в итоговое решение; новая гибридная архитектура нейронной сети, основанная на интеграции данных сверточной нейронной сети в рекуррентную нейронную сеть, отличающаяся от существующих неявным представлением временной составляющей, агрегированной аугментацией данных и динамическим подбором размера батча в зависимости от скорости сходимости модели на прошлых итерациях, что позволяет осуществлять классификацию изображений в видеопотоке с высокой точностью.
В третьей главе представлены вычислительные эксперименты с целью оценки результатов обнаружения объектов, полученных на основе предлагаемых алгоритмов. Сравнение полученных результатов с аналогичными системами обнаружения, чьи характеристики представлены в открытом доступе, показало, что предложенная технология выделения объектов с динамическими признаками демонстрирует более высокую точность обнаружения и меньшее количество ложных срабатываний для задачи обнаружения лесных пожаров. Приведены примеры применения предложенных алгоритмов в других областях деятельности, что дает возможность говорить о свободной встраиваемости алгоритмов в системы в разных областях деятельности и их универсальности.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


1. Предложена технология анализа изображений в видеоряде позволяющей достичь высокого качества обнаружения объектов, на основе предложенных алгоритмов локализации и классификации с учетом статических и динамических данных. Предложенные в технологии алгоритмы могут быть применены с целью анализа изображений для широкого круга практических задач.
2. Реализован алгоритм выделения динамических признаков на последовательности кадров, основанный на алгоритмах цветовой обработки изображений и операции вычитания фона. При реализации алгоритма осуществляется вычисление средней интенсивности пикселей кадров последовательности с последующим вычислением разности ключевого кадра с одним из исходных кадров. Использование разработанного алгоритма для модели обнаружения объектов EfficientDet-D0 позволило повысить значения метрики полноты (Recall) на 31 %, а метрики точности (Precision) на 21 %.
3. Реализован алгоритм, позволяющий объединять результаты нейросети в
итоговое решение. Алгоритм выделяет плотные группы объектов данных, на основе оценки отношения площадей пересечения между соседними объектами, что отличает от других алгоритмов, базирующихся на фиксированном значении расстояния между объектами. Использование разработанного алгоритма позволяет повысить точность локализации на 6 % относительно
альтернативных подходов.
4. Предложен алгоритм классификации обнаруженных объектов, состоящий из алгоритма подготовки последовательности изображений для анализа гибридной архитектурой нейронной сети. Использование гибридной архитектуры позволяет анализировать статические характерные для дыма признаки с учетом временной составляющей. Применение предложенного классификатора позволило увеличить показатель F-score на 9 %.
5. Результаты диссертационной работы были использованы при выполнении НИР грант УМНИК №16068ГУ/2020, грант РФФИ № 20-37-90055, грант ГЗ "Наука" №FFSWW-2020-0014. Внедрены в организациях в ООО "НТП КИ-БЕРЦЕНТР" (г. Томск), в ООО "Спотпаркинг" (г. Томск) и в учебном процессе в отделении информационных технологий Инженерной школы информационных
технологий и робототехники ТПУ.



1. Li M., Huang B., Tian G. A comprehensive survey on 3D face recognition methods // Eng. Appl. Artif. Intell. 2022. Vol. 110. P. 104669.
2. Danilov V. V et al. Use of semi-synthetic data for catheter segmentation improvement // Comput. Med. Imaging Graph. Elsevier, 2023. Vol. 106. P. 102188.
3. Danilov V. V, Kolpashchikov D.Y., Laptev N. V. Automatic control of a continuous robot using the FABRIK algorithm // Model. Optim. Inf. Technol. 2019. Vol. 7, № 4. P. 1-2.
4. Poliak M., Jurecki R., Buckner K. Autonomous vehicle routing and navigation, mobility simulation and traffic flow prediction tools, and deep learning object detection technology in smart sustainable urban transport systems // Contemp. Readings Law Soc. Justice. Addleton Academic Publishers, 2022. Vol. 14, № 1. P. 25-40.
5. Laptev N. et al. Visualization System for Fire Detection in the Video Sequences // sv-journal.org. 2021. Vol. 13, № 2. P. 1-9.
6. Макунина Я.С., Никончук А.В. АНАЛИЗ ВОЗНИКНОВЕНИЯ ЛЕСНЫХ ПОЖАРОВ В РОССИИ // ИННОВАЦИИ В ХИМИКО-ЛЕСНОМ КОМПЛЕКСЕ: ТЕНДЕНЦИИ И ПЕРСПЕКТИВЫ РАЗВИТИЯ. 2021. P. 24-26.
7. Mahmoud M.A.I., Ren H. Forest Fire Detection Using a Rule-Based Image Processing Algorithm and Temporal Variation // Math. Probl. Eng. / ed. Bianco V. Hindawi, 2018. Vol. 2018. P. 7612487.
8. Cetin A.E. et al. Video fire detection-review // Digit. Signal Process. Elsevier, 2013. Vol. 23, № 6. P. 1827-1843.
9. Toreyin B.U. et al. Fire detection in infrared video using wavelet analysis // Opt. Eng. SPIE, 2007. Vol. 46, № 6. P. 67204.
10. Yuan C., Liu Z., Zhang Y. Fire detection using infrared images for UAV- based forest fire surveillance // 2017 International Conference on Unmanned Aircraft Systems (ICUAS). 2017. P. 567-572.
11. Stipanicev D. et al. Forest fire protection by advanced video detection system-Croatian experiences // Third TIEMS Workshop-Improvement of Disaster
Management System, Trogir. 2006.
12. Govil K. et al. Preliminary results from a wildfire detection system using deep learning on remote camera images // Remote Sens. Multidisciplinary Digital Publishing Institute, 2020. Vol. 12, № 1. P. 166.
13. Агеев В.Г. et al. ПРИМЕНЕНИЕ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ
АППАРАТОВ ДЛЯ МОНИТОРИНГА ЛЕСНЫХ И СТЕПНЫХ ПОЖАРОВ // Научный вестник НИИГД Респиратор. Государственный научно
исследовательский институт горноспасательного дела ..., 2019. № 3. P. 7-18.
14. Алчинов Е.И. et al. МОНИТОРИНГ ЛЕСНЫХ ПОЖАРОВ С ИСПОЛЬЗОВАНИЕМ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ // Редакционная коллегия ФШ Хафизов (отв. редактор) АВ Пермяков. 2018. P. 230.
15. Ксенофонтов Ю.Г. Использование современных информационных технологий в системах пожарного мониторинга лесных массивов // Актуальные проблемы обеспечения пожарной безопасности и защиты от чрезвычайных ситуаций. 2020. P. 211-217.
..133


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ