Тема: Разработка web-приложения для создания обучающей выборки на основе реальных и смоделированных данных
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 6
1 ТЕХНОЛОГИИ СБОРА ОБУЧАЮЩЕЙ ВЫБОРКИ
ДЛЯ ЗАДАЧИ СЕГМЕНТАЦИИ 8
1.1 Методы решения задачи сегментации 8
1.2 Современные приложения для разметки данных 20
1.3 Существующие датасеты дыма в открытом доступе 23
1.4 Вывод по главе 26
2 СОЗДАНИЕ ИСКУСТВЕННОГО ДАТАСЕТА
С ПОМОЩЬЮ 3D МОДЕЛИРОВАНИЯ 28
2.1 Функции приложения Blender 3D 29
2.2 Создание моделей объектов для симуляции дыма 33
2.3 Генерация дыма в программе Blender 3D 39
2.4 Создание бинарной маски созданного видеопотока 41
2.5 Вывод по главе 43
3 РАЗРАБОТКА WEB ПРИЛОЖЕНИЯ
ДЛЯ СОЗДАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ 44
3.1 JSON формат масок 44
3.2 Алгоритмы программы по созданию обучающей выборки 54
3.3 Описание приложения для создания обучающей выборки 58
3.4 Вывод по главе 63
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 67
📖 Аннотация
📖 Введение
Одной из важнейших сфер машинного обучения является контроль воздуха и анализ газовых средств. Для охраны воздушной среды от различных выбросов необходимы наблюдение и контроль загрязнений, с чем и помогает справляться машинное обучение.
Метод обучения с учителем является самым популярным подходом для решения различных практических и исследовательских задач. Успех такого метода в первую очередь зависит от количества и качества собранного набора данных.
Для необходимого при обучении с учителем датасета должна быть создана маска, которую алгоритм впоследствии предскажет. В случае, если объём данных окажется достаточно мал, или же будет страдать качество собранного датасета, то это чревато серьёзной проблемой потери точности. Сбор и создание размеченных изображений является слабым звеном в исследовательских задачах. Разметка данных требует большого количества времени и усидчивости. И даже при большом уровне знаний таких людей могут возникать различные проблемы по типу неверного принятия решений в некоторых местах выделения маски.
Ручная разметка – это тяжёлая работа, объёмы которой могут достигать десятки тысяч изображений. Поэтому многие люди, занимающиеся машинным обучением, заинтересованы в улучшении эффективности разметки датасета.
В данный момент реализованы различные инструменты разметки, которые ускоряют этот процесс, но не все они в полной мере удовлетворяют требованиям задачи сегментации.
Целью данной работы является создание искусственного датасета и разработка приложения для разметки изображений вручную и с помощью методов сегментации. Для достижения данной цели необходимо решить
следующие задачи:
1) изучить существующие алгоритмы сегментации;
2) рассмотреть существующие приложения для разметки данных;
3) рассмотреть датасеты дыма в открытом доступе;
4) изучить программу для 3D моделирования – Blender;
5) создать достаточный объём искусственных видеороликов;
6) разработать web приложение для разметки данных;
7) разметить изображения из открытых источников.
✅ Заключение
Созданный искусственный датасет включает в себя различные типы изображений. Для эффективной разметки датасета было разработано приложение, которое позволяет проводить как ручную, так и автоматическую сегментацию изображений.
В соответствии с данной целью были рассмотрены технологии сбора обучающей выборки для задачи сегментации, современные приложения для разметки данных и существующие датасеты дыма в открытом доступе. Был проведен анализ методов решения задачи сегментации, который позволил выявить, что ни один из изученных алгоритмов или приложений не удовлетворяет полностью поставленным требованиям. Было решено разработать собственное веб-приложения с использованием специального формата масок, а также с использовать 3D-моделирования для создания искусственного датасета.
Далее была рассмотрена возможность создания искусственного датасета с помощью 3D моделирования в программе Blender 3D. Были подробно описаны функции приложения Blender 3D, а также создание моделей объектов для симуляции дыма в программе. В результате была разработана бинарная маска созданного видеопотока, которая использовалась в дальнейшем для создания обучающей выборки.
Затем было разработано веб-приложение для создания обучающей выборки, которое позволяет размечать данные вручную и с помощью оптического потока. Был создан специальный формат JSON для хранения бинарных масок изображений, были разработаны все необходимые алгоритмы и функции приложения.
Для полного функционирования приложения были добавлены запросы на сервер, позволяющие обрабатывать видео в формате mp4 с помощью алгоритмов оптического потока. Благодаря этому пользователь имеет возможность загрузить собственный видеоролик и, дождавшись ответа от сервера, выгрузить его на свой компьютер.
Добавлено описание приложения. Оно включает все варианты взаимодействия пользователя с приложением. Так же, полученная в результате работы программа, была официально зарегистрирована и на неё получен патент.
Таким образом, цель данной работы достигнута и все поставленные задачи решены. Созданный искусственный датасет позволит эффективно обучать модели для решения задачи сегментации дыма. Разработанное вебприложение может использоваться для разметки данных вручную и с помощью оптического потока, что упрощает процесс создания обучающей выборки.





