📄Работа №197752

Тема: Разработка web-приложения для создания обучающей выборки на основе реальных и смоделированных данных

Характеристики работы

Тип работы Дипломные работы, ВКР
Информатика и вычислительная техника
Предмет Информатика и вычислительная техника
📄
Объем: 66 листов
📅
Год: 2023
👁️
Просмотров: 38
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Реферат
ВВЕДЕНИЕ 6
1 ТЕХНОЛОГИИ СБОРА ОБУЧАЮЩЕЙ ВЫБОРКИ
ДЛЯ ЗАДАЧИ СЕГМЕНТАЦИИ 8
1.1 Методы решения задачи сегментации 8
1.2 Современные приложения для разметки данных 20
1.3 Существующие датасеты дыма в открытом доступе 23
1.4 Вывод по главе 26
2 СОЗДАНИЕ ИСКУСТВЕННОГО ДАТАСЕТА
С ПОМОЩЬЮ 3D МОДЕЛИРОВАНИЯ 28
2.1 Функции приложения Blender 3D 29
2.2 Создание моделей объектов для симуляции дыма 33
2.3 Генерация дыма в программе Blender 3D 39
2.4 Создание бинарной маски созданного видеопотока 41
2.5 Вывод по главе 43
3 РАЗРАБОТКА WEB ПРИЛОЖЕНИЯ
ДЛЯ СОЗДАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ 44
3.1 JSON формат масок 44
3.2 Алгоритмы программы по созданию обучающей выборки 54
3.3 Описание приложения для создания обучающей выборки 58
3.4 Вывод по главе 63
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 67

📖 Аннотация

В данной работе представлена разработка специализированного веб-приложения для формирования обучающих выборок, сочетающих реальные и синтетические данные, в рамках решения задачи семантической сегментации изображений. Актуальность исследования обусловлена критической зависимостью качества моделей машинного обучения с учителем от объёма и точности размеченных данных, при этом ручная разметка, особенно для таких объектов, как факелы промышленных выбросов, является крайне трудоёмкой и подверженной ошибкам процессом. Основным результатом стало создание комплексного инструментария, включающего методику генерации искусственного датасета дыма посредством 3D-моделирования в Blender и веб-приложение, предоставляющее интерфейс для гибридной (ручной и автоматической) разметки изображений с использованием формата JSON для хранения масок. Выводы работы подтверждают, что предложенный подход позволяет эффективно создавать репрезентативные обучающие выборки для последующего обучения нейронных сетей в прикладных задачах экологического мониторинга. Научная значимость заключается в адаптации и интеграции методов компьютерной графики и веб-разработки для решения проблемы недостатка данных, а практическая — в предоставлении готового решения для проекта «Экомонитор», направленного на автоматизацию сегментации выбросов. Теоретической основой послужили исследования в области цифровой обработки изображений (Гонсалес, Вудс), анализа методов сегментации (Лепешкин и др.), а также работы по применению нейронных сетей (Вакуленко, Жихарева) и 3D-моделирования (Прахов).

📖 Введение

В современном мире машинное обучение применяется практически в каждой отрасли жизни и особое место занимает в научных проектах. Целью машинного обучения является автоматизация решения сложных задач, например: медицинская диагностика, техническая диагностика, обнаружение спама, обнаружение мошенничества и т. д.
Одной из важнейших сфер машинного обучения является контроль воздуха и анализ газовых средств. Для охраны воздушной среды от различных выбросов необходимы наблюдение и контроль загрязнений, с чем и помогает справляться машинное обучение.
Метод обучения с учителем является самым популярным подходом для решения различных практических и исследовательских задач. Успех такого метода в первую очередь зависит от количества и качества собранного набора данных.
Для необходимого при обучении с учителем датасета должна быть создана маска, которую алгоритм впоследствии предскажет. В случае, если объём данных окажется достаточно мал, или же будет страдать качество собранного датасета, то это чревато серьёзной проблемой потери точности. Сбор и создание размеченных изображений является слабым звеном в исследовательских задачах. Разметка данных требует большого количества времени и усидчивости. И даже при большом уровне знаний таких людей могут возникать различные проблемы по типу неверного принятия решений в некоторых местах выделения маски.
Ручная разметка – это тяжёлая работа, объёмы которой могут достигать десятки тысяч изображений. Поэтому многие люди, занимающиеся машинным обучением, заинтересованы в улучшении эффективности разметки датасета.
В данный момент реализованы различные инструменты разметки, которые ускоряют этот процесс, но не все они в полной мере удовлетворяют требованиям задачи сегментации.
Целью данной работы является создание искусственного датасета и разработка приложения для разметки изображений вручную и с помощью методов сегментации. Для достижения данной цели необходимо решить
следующие задачи:
1) изучить существующие алгоритмы сегментации;
2) рассмотреть существующие приложения для разметки данных;
3) рассмотреть датасеты дыма в открытом доступе;
4) изучить программу для 3D моделирования – Blender;
5) создать достаточный объём искусственных видеороликов;
6) разработать web приложение для разметки данных;
7) разметить изображения из открытых источников.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Данная работа была выполнена в рамках проекта «Экомонитор» Института естественных и точных наук. Представленное в работе решение может быть использовано для создания датасета. Созданный, в процессе работы, набор данных позволит обучить нейронную сеть для сегментации факела выбросов.
Созданный искусственный датасет включает в себя различные типы изображений. Для эффективной разметки датасета было разработано приложение, которое позволяет проводить как ручную, так и автоматическую сегментацию изображений.
В соответствии с данной целью были рассмотрены технологии сбора обучающей выборки для задачи сегментации, современные приложения для разметки данных и существующие датасеты дыма в открытом доступе. Был проведен анализ методов решения задачи сегментации, который позволил выявить, что ни один из изученных алгоритмов или приложений не удовлетворяет полностью поставленным требованиям. Было решено разработать собственное веб-приложения с использованием специального формата масок, а также с использовать 3D-моделирования для создания искусственного датасета.
Далее была рассмотрена возможность создания искусственного датасета с помощью 3D моделирования в программе Blender 3D. Были подробно описаны функции приложения Blender 3D, а также создание моделей объектов для симуляции дыма в программе. В результате была разработана бинарная маска созданного видеопотока, которая использовалась в дальнейшем для создания обучающей выборки.
Затем было разработано веб-приложение для создания обучающей выборки, которое позволяет размечать данные вручную и с помощью оптического потока. Был создан специальный формат JSON для хранения бинарных масок изображений, были разработаны все необходимые алгоритмы и функции приложения.
Для полного функционирования приложения были добавлены запросы на сервер, позволяющие обрабатывать видео в формате mp4 с помощью алгоритмов оптического потока. Благодаря этому пользователь имеет возможность загрузить собственный видеоролик и, дождавшись ответа от сервера, выгрузить его на свой компьютер.
Добавлено описание приложения. Оно включает все варианты взаимодействия пользователя с приложением. Так же, полученная в результате работы программа, была официально зарегистрирована и на неё получен патент.
Таким образом, цель данной работы достигнута и все поставленные задачи решены. Созданный искусственный датасет позволит эффективно обучать модели для решения задачи сегментации дыма. Разработанное веб­приложение может использоваться для разметки данных вручную и с помощью оптического потока, что упрощает процесс создания обучающей выборки.
Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1 Вакуленко, С. А. Практический курс по нейронным сетям: учебное пособие / С. А. Вакуленко, А. А. Жихарева. – Санкт-Петербург: НИУ ИТМО, 2018. – 71 с.
2 Гонсалес, Р. Цифровая обработка изображений: учебник / Р. Гонсалес, Р. Вудс. – Москва: Техносфера, 2005. – 1072 с.
3 Лепешкин, О. М. Анализ методов сегментации изображений / О. М. Лепешкин, С. А. Романов, Ю. П. Стоянов // Молодой учёный. 2010. – №6(17). – с. 26–28.
4 Нестерихин, Ю. Е. О системе автоматической обработки изображений / Ю. Е. Нестерихин, Б. М. Пушной // Автометрия. 1977. – № 3. – С. 6–12.
5 Прахов, А. Blender. 3D-моделирование и анимация. Руководство для начинающих / А. Прахов. – Санкт-Петербург: БХВ, 2009. – 272 c.
6 Салаватов, P. M. Средства обработки изображений / P. M. Салаватов, С. Л. Шевелёв // Математические и технические проблемы обработки изображений, 1980. – С. 95–105.
7 Фисенко, В. Т. Компьютерная обработка и распознавание изображений: учебное пособие / В. Т. Фисенко, Т. Ю. Фисенко. – Санкт– Петербург: СПбГУ ИТМО, 2008. – 192 с.
8 Хуанг, Т.С. Быстрые алгоритмы в цифровой обработке изображений. Преобразования и медианные фильтры / Т. С. Хуанг // Радио и связь, 2012. – 754 с.
9 Хуанг, Т. С. Быстрые алгоритмы в цифровой обработке изображений // Радио и связь, 1984. – 224 с.
11 Blender Documentation Contents: Blender 2.91.0 – API documentation. [сайт]. URL: https://docs.blender.org/api.html (дата обращения: 15.02.2023).
12 Blender is the free and open source 3D creation suite. It supports the entirety of the 3D pipeline — modeling, rigging, animation, simulation, rendering,
compositing and motion tracking, even video editing and game creation. [сайт]. URL: https://www.blender.org (дата обращения: 07.02.2023).
13 Blender: Three ways to create objects. [сайт]. URL: https://en.blender.org/index.php/Dev:Py/Scripts/Cookbook/Code_snippets/ (дата обращения: 18.02.2023).
14 CVAT. Инструкция по разметке: [сайт]. – 2022. URL: https://habr.com/ru/articles/677484/ (дата обращения: 14.12.2022).
15 CVAT. Инструкция по разметке. Десять лучших опенсорсных инструментов аннотирования 2021 года для Computer Vision: [сайт]. – 2022. URL: https://habr.com/ru/articles/665684/ (дата обращения: 29.12.2022).
... всего 21 источников

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ