Детектирование объектов на изображениях с использованием машинного обучения
|
Введение 4
Цель и задачи работы 8
Обзор литературы 9
Глава 1. Набора данных 10
1.1. Набор данных для задачи детектирования 10
1.2. Набор данных для задачи классификации 11
Глава 2. Модели 14
2.1. Двухуровневые детекторы 14
2.2. YOLO 14
2.2.1 Архитектура YOLOv5 18
2.2.2 Функция потерь YOLO 19
2.3. Оценка качества модели 21
2.4. Метрика LIoU и ее производные 25
2.5. Классификатор MobileNetV2 28
2.5.1 Эффективные сверточные блоки 28
2.5.2 Архитектура 30
2.6. Аугментация 31
2.7. Перенос обучения 32
Глава 3. Эксперименты и результаты 33
3.1. Параметры обучения 33
3.2. Решение на базе YOLOv5 33
3.2.1 Результаты и валидация 33
3.2.2 Параметры аугментации 34
3.2.3 Модификации функции потерь 36
3.2.4 Анализ результатов YOLOv5 37
3.3. Классификатор 39
3.3.1 Обучение MobileNetV2 41
3.4. Объединение YOLO и MobileNetV2 41
3.4.1 Принцип работы 43
3.4.2 Выводы 44
Заключение 46
Список литературы 47
Цель и задачи работы 8
Обзор литературы 9
Глава 1. Набора данных 10
1.1. Набор данных для задачи детектирования 10
1.2. Набор данных для задачи классификации 11
Глава 2. Модели 14
2.1. Двухуровневые детекторы 14
2.2. YOLO 14
2.2.1 Архитектура YOLOv5 18
2.2.2 Функция потерь YOLO 19
2.3. Оценка качества модели 21
2.4. Метрика LIoU и ее производные 25
2.5. Классификатор MobileNetV2 28
2.5.1 Эффективные сверточные блоки 28
2.5.2 Архитектура 30
2.6. Аугментация 31
2.7. Перенос обучения 32
Глава 3. Эксперименты и результаты 33
3.1. Параметры обучения 33
3.2. Решение на базе YOLOv5 33
3.2.1 Результаты и валидация 33
3.2.2 Параметры аугментации 34
3.2.3 Модификации функции потерь 36
3.2.4 Анализ результатов YOLOv5 37
3.3. Классификатор 39
3.3.1 Обучение MobileNetV2 41
3.4. Объединение YOLO и MobileNetV2 41
3.4.1 Принцип работы 43
3.4.2 Выводы 44
Заключение 46
Список литературы 47
Курение — социальная проблема: важной задачей общества сегодня является не допустить того, чтобы число курильщиков росло, особенно среди детей и подростков. Согласно исследованиям ученых из Калифорнийского университета в Сан-Франциско (UCSF) [23], несмотря на существующие ограничения, количество сцен с курящими людьми в кино постепенно увеличивается, что действует как пропаганда курения и провоцирует рост числа курящих среди молодой аудитории. По соображениям учёных, чем чаще подростки видят курящих персонажей на экране, тем выше вероятность того, что они сами начнут курить.
Одной из мер по борьбе с ростом числа курильщиков, в том числе среди несовершеннолетних, является цензурирование визуального контента в интернете и на ТВ: фильмы со сценами курения как в России, так и в мире имеют более высокие возрастные ограничения, содержат специальные текстовые предупреждения о демонстрации курения и о его вреде. Некоторые прокатчики пошли дальше: они используют инструменты для закрашивания той небольшой части кадра, которая содержит сигарету или другое устройство для потребления никотина. Поиск и закрашивание таких областей обычно выполняется вручную покадрово, что сильно усложняет задачу ввиду потенциально большого объема работы.
Другим местом, где несовершеннолетние могут столкнуться с демонстрацией курения, являются социальные сети. В таких соцсетях, как Facebook, уже существует механизм автоматического распознавания потенциально неприемлемого контента — сцен насилия, жестокого обращения с животными и так далее. Изображения, содержащие сигареты или другие курительные предметы, также могут быть отнесены к категории потенциально неприемлемого контента.
Данная работа посвящена автоматизации поиска сигарет на изображениях (или кадрах). Детектирование объектов — задача, в рамках которой необходимо найти и выделить все объекты на изображении из множества заранее известных классов посредством нахождения координат их ограничивающих рамок и классификации контента внутри них. Детектирование — второй по популярности тип задач компьютерного зрения после классификации. Его отличает относительная простота, так как обучение проходит с учителем, а самые современные модели позволяют достигнуть высокой точности даже в системах реального времени.
Научных работ, связанных с детектированием на изображениях именно сигарет, в ходе работы обнаружено не было, однако существуют работы, посвященные более широкой области — курению. Некоторые подходы пытаются найти дым и определить цвет его источника. В рамках другого подхода для детектирования курения используется дополнительная нейронная сеть для поиска на изображении областей интереса — лиц и кистей рук, — после чего стоит задача обнаружить сигарету или нечто подобное внутри каждой области. Такой подход ведет к уменьшению ошибок первого рода (то есть помогает не пропускать сигареты на изображениях), но при работе с сигаретами могут возникнуть две основные сложности:
1. наличие предметов, похожих на сигарету — ручек, трубочек, белых полосок и пр., которые может быть трудно отличить даже человеку;
2. хотя сигареты, как правило, одной формы, может использоваться не только белая, но и цветная бумага.
В рамках работы для решения задачи детектирования сигарет используются общие подходы решения такого класса задач — обучение модели (YOLOv5), которая будет предсказывать ограничивающие рамки. А для того, чтобы сигареты и посторонние предметы внутри предсказанных рамок были правильно классифицированы, предлагается использование дополнительной модели для классификации контента внутри предсказанных ограничивающих рамок. Классификатор не помогает найти другие объекты на изображении, однако способствует отсеиванию заведомо неверно классифицированных объектов — ручек, трубочек, белых полосок и пр. Таким образом, модель уменьшает количество ошибок второго рода, что может быть актуально при затратных операциях по закрашиванию обнаруженных областей. Предложенный подход имеет ряд преимуществ:
• дополнительные данные проще собрать;
• сигареты на дополнительных данных более разнообразны;
• изображения не требуют выделения объектов на них, для них необходима лишь метка класса;
• при обучении бинарного классификатора используются также данные класса «не сигарета», в который входят ручки, белые полоски и прочие объекты, похожие на сигареты.....
Одной из мер по борьбе с ростом числа курильщиков, в том числе среди несовершеннолетних, является цензурирование визуального контента в интернете и на ТВ: фильмы со сценами курения как в России, так и в мире имеют более высокие возрастные ограничения, содержат специальные текстовые предупреждения о демонстрации курения и о его вреде. Некоторые прокатчики пошли дальше: они используют инструменты для закрашивания той небольшой части кадра, которая содержит сигарету или другое устройство для потребления никотина. Поиск и закрашивание таких областей обычно выполняется вручную покадрово, что сильно усложняет задачу ввиду потенциально большого объема работы.
Другим местом, где несовершеннолетние могут столкнуться с демонстрацией курения, являются социальные сети. В таких соцсетях, как Facebook, уже существует механизм автоматического распознавания потенциально неприемлемого контента — сцен насилия, жестокого обращения с животными и так далее. Изображения, содержащие сигареты или другие курительные предметы, также могут быть отнесены к категории потенциально неприемлемого контента.
Данная работа посвящена автоматизации поиска сигарет на изображениях (или кадрах). Детектирование объектов — задача, в рамках которой необходимо найти и выделить все объекты на изображении из множества заранее известных классов посредством нахождения координат их ограничивающих рамок и классификации контента внутри них. Детектирование — второй по популярности тип задач компьютерного зрения после классификации. Его отличает относительная простота, так как обучение проходит с учителем, а самые современные модели позволяют достигнуть высокой точности даже в системах реального времени.
Научных работ, связанных с детектированием на изображениях именно сигарет, в ходе работы обнаружено не было, однако существуют работы, посвященные более широкой области — курению. Некоторые подходы пытаются найти дым и определить цвет его источника. В рамках другого подхода для детектирования курения используется дополнительная нейронная сеть для поиска на изображении областей интереса — лиц и кистей рук, — после чего стоит задача обнаружить сигарету или нечто подобное внутри каждой области. Такой подход ведет к уменьшению ошибок первого рода (то есть помогает не пропускать сигареты на изображениях), но при работе с сигаретами могут возникнуть две основные сложности:
1. наличие предметов, похожих на сигарету — ручек, трубочек, белых полосок и пр., которые может быть трудно отличить даже человеку;
2. хотя сигареты, как правило, одной формы, может использоваться не только белая, но и цветная бумага.
В рамках работы для решения задачи детектирования сигарет используются общие подходы решения такого класса задач — обучение модели (YOLOv5), которая будет предсказывать ограничивающие рамки. А для того, чтобы сигареты и посторонние предметы внутри предсказанных рамок были правильно классифицированы, предлагается использование дополнительной модели для классификации контента внутри предсказанных ограничивающих рамок. Классификатор не помогает найти другие объекты на изображении, однако способствует отсеиванию заведомо неверно классифицированных объектов — ручек, трубочек, белых полосок и пр. Таким образом, модель уменьшает количество ошибок второго рода, что может быть актуально при затратных операциях по закрашиванию обнаруженных областей. Предложенный подход имеет ряд преимуществ:
• дополнительные данные проще собрать;
• сигареты на дополнительных данных более разнообразны;
• изображения не требуют выделения объектов на них, для них необходима лишь метка класса;
• при обучении бинарного классификатора используются также данные класса «не сигарета», в который входят ручки, белые полоски и прочие объекты, похожие на сигареты.....
В выпускной квалификационной работе:
1. Проведен поиск и разметка изображений, содержащих сигареты, а также из них составлен набор для обучения, валидации и проверки решения;
2. Выбрана и обучена модель детектирования на собранных данных;
3. Протестированы современные подходы искусственного дополнения исходного набора данных;
4. Произведены сравнения несколько подходов к определению функции потерь при обучении модели детектирования;
5. В модель детектирования встроен модуль классификации для уменьшения ошибок второго рода.
1. Проведен поиск и разметка изображений, содержащих сигареты, а также из них составлен набор для обучения, валидации и проверки решения;
2. Выбрана и обучена модель детектирования на собранных данных;
3. Протестированы современные подходы искусственного дополнения исходного набора данных;
4. Произведены сравнения несколько подходов к определению функции потерь при обучении модели детектирования;
5. В модель детектирования встроен модуль классификации для уменьшения ошибок второго рода.
Подобные работы
- Информационная технология распознавания жестов для человеко-машинного
взаимодействия на базе сверточных нейронных сетей
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2019 - Разработка программного обеспечения для распознавания объектов на графическом изображении
Бакалаврская работа, информационные системы. Язык работы: Русский. Цена: 5900 р. Год сдачи: 2018 - Распознавание и классификация объектов по данным
видеопотока на основе технологий дополненной реальности
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 4780 р. Год сдачи: 2016 - Детектирование людей на изображениях с помощью метода Виолы-Джонса
Бакалаврская работа, математика и информатика. Язык работы: Русский. Цена: 4700 р. Год сдачи: 2017 - Детектирование объектов на изображениях с использованием машинного обучения
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 4875 р. Год сдачи: 2022 - РАСПОЗНАВАНИЕ ОБЪЕКТОВ ЗАДАННОЙ ФОРМЫ НА ИЗОБРАЖЕНИИ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Бакалаврская работа, механика. Язык работы: Русский. Цена: 4220 р. Год сдачи: 2021 - РАЗРАБОТКА И АНАЛИЗ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ ДЛЯ ОПРЕДЕЛЕНИЯ ВИДОВОГО И КОЛИЧЕСТВЕННОГО СОСТАВА ЛИЧИНОК КОМАРОВ НА ИЗОБРАЖЕНИЯХ
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2020 - Обнаружение столкновений на парковке со стоящим транспортным средством
Бакалаврская работа, информатика. Язык работы: Русский. Цена: 4280 р. Год сдачи: 2021 - Применение методов машинного обучения при оценке и картографировании природных ресурсов
Магистерская диссертация, картография. Язык работы: Русский. Цена: 4835 р. Год сдачи: 2020





