Тип работы:
Предмет:
Язык работы:


УЛУЧШЕНИЕ РЕЗУЛЬТАТОВ СЕМАНТИЧЕСКОЙ СЕГМЕНТАЦИИ НА ПРИМЕРЕ ЗАДАЧИ НЕЙРОСЕТЕВОЙ СЕГМЕНТАЦИИ ОБЪЕКТОВ НА ПОВЕРХНОСТИ ЗЕМЛИ

Работа №185305

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы53
Год сдачи2025
Стоимость4530 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
13
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 3
ВВЕДЕНИЕ 3
1 Обзор литературы 6
1.1 Основные подходы к решению задачи 6
1.2 Набор данных 10
1.3 Улучшение качества моделей 13
2 Предобработка данных 19
2.1 Разбиение на тайлы 19
2.2 Увеличение контрастности 21
2.3 Увеличение резкости 24
2.4 Обработка Nir канала 27
2.5 Нормализация 28
3 Основная идея нейросетевой архитектуры 30
3.1 Трансферное обучение 30
3.2 Модификация механизм внимания 31
4 Модель классификации 34
4.1 Многометочная классификация 34
4.2 Архитектура 36
5 Сегментационная сеть 40
6 Обучение 44
7 Заключение 47
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 48


Выделяется два вида сегментации: семантическая и экземплярная. В этой работе будет решаться задача семантической сегментации, на ней и заострим внимание.
Семантическая сегментация — это задача глубокого обучения, которая распределяет пиксели изображения по заранее определенным классам. Цель состоит в том, чтобы присвоить каждому пикселю изображения метку, позволяющую различать объекты и их границы на изображении.
В отличие от экземплярной сегментации семантическая не пытается разделить объекты одного класса друг от друга (если на картинке две опухоли, они будут отмечены одинаково)
На рисунке 1 изображен пример семантической и экземплярной сегментации соответственно.

Рисунок 1 — Различия разных видов сегментации

Говоря более формально, на вход модели подаётся картинка размера CXH*W, где C — количество каналов (цветов) изображения, H — высота изображения, W — ширина изображения. А на выходе из неё возвращается маска размера K*H*W. Где K — количество классов, на которые разбивается изображение. Для каждого пикселя разные значения на оси K обозначают вероятность принадлежности соответствующему классу.
Семантическая сегментация находит свое применение во многих задачах, например:
• Медицинские задачи:
о анализ медицинских изображений;
о выделение органов или патологий;
• Автономное вождение:
о Обнаружение препятствий;
о Понимание текущих дорожных условий;
• Робототехника:
о Выделение объектов для захвата и взаимодействия;
о Контроль качества;
• Обнаружение дефектов:
о Автоматический анализ текстур и поверхностей;
о Оценка размеров и формы производимых изделий.
Однако ручная сегментация, выполняемая экспертами, занимает слишком много времени и ресурсов, из чего следует необходимость использования автоматизированных методов сегментации. Но, несмотря на обилие существующих алгоритмов сегментации, они не лишены недостатков, среди которых основным является недостаточное качество их работы.
Актуальность работы заключается в том, что нужда в использовании автоматизированных методов сегментации изображений проявляется в различных областях, где требуется обработка больших объемов изображений для решения задач мониторинга, анализа и принятия решений. В частности, сегментация изображений поверхности Земли находит своё применение, например, в:
• Сельское хозяйство: автоматическая сегментация помогает в
определении состояния посевов, выделении сельскохозяйственных культур и анализе почвы;
• Экология и охрана окружающей среды: использование сегментации позволяет выявлять зоны загрязнения, отслеживать динамику лесных массивов и водоемов;
• Городское планирование: методы сегментации способствуют анализу городской инфраструктуры, дорожной сети и застройки;
• Управление чрезвычайными ситуациями: сегментация может ускорить определение зон бедствия, таких как наводнения, пожары или землетрясения, для оперативного реагирования;
• Картография: автоматическое выделение и классификация объектов, таких как дороги, здания и водные объекты, упрощает создание и обновление карт.
Исходя из этого, формулируется цель работы — разработка нейросетевой модели, решающей задачу семантической сегментации объектов на поверхности Земли. Для этого ставятся следующие задачи:
• Изучить способы решения подобных задач;
• Изучить методы улучшения качества сегментации;
• Найти подходящий набор данных;
• Используя изученный материал разработать нейросетевую архитектуру;
• Обучить и протестировать её.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В работе рассмотрена задача семантической сегментации изображений. Выбран набор данных, состоящий из изображений поверхности Земли. Проведен анализ классических архитектур нейросетей для решения подобных задач. Рассмотрены способы улучшения результатов нейросетевых моделей. На основе изученных материалов разработана и обучена собственная архитектура, включающая в себя как классический блок визуального внимания, так и улучшенная его версия, предложенная в данной работе. Разработанные методы показали свою эффективность на практике, в сравнении с другими нейросетевыми методами, обученными на этом же наборе данных.


1. Otsu, N. (1979). "A threshold selection method from gray-level histograms." IEEE Transactions on Systems, Man, and Cybernetics, 9(1), 62-66. doi:10.1109/TSMC.1979.4310076
2. Ozden, M., & Polat, E. (2005). Image segmentation using color and texture features. Proceedings of the 13th European Signal Processing Conference (EUSIPCO), 1-4.
3. Hu, L. & Cui, J. (2019) Digital image recognition based on Fractional- order-PCA-SVM coupling algorithm. Measurement. 145. pp. 150-159. DOI: 10.1016/j .measurement.2019.02.006
4. Belgiu, M., & Dragut, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, 114, 24-31. doi:10.1016/j.isprsjprs.2016.01.011
5. Ronneberger O., Fischer P., Brox T. U-Net: Convolutional networks for biomedical image segmentation // International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI-2015). 2015. V. 93. P. 234-241.
6. Jonathan Long, Evan Shelhamer, Trevor Darrell. Fully Convolutional Ne works for Semantic Segmentation [Текст] / Jonathan Long, Evan Shelhamer, Trevor Darrell // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2017. — № 4. — С. 640 - 651.
7. Yu, C., Wang, J., Peng, C., Gao, C., Yu, G., & Sang, N. (2018).
BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation. In Computer Vision - ECCV 2018: 15th European Conference, Munich, Germany, September 8-14, 2018, Proceedings, Part XIII (pp. 334-349).
https://doi.org/10.1007/978-3-030-01261-8_20
8. Chen, L.-C., Papandreou, G., Kokkinos, I., Murphy, K., & Yuille, A. L. (2018). DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs. IEEE Transactions on Pattern 

9. Badrinarayanan V., Kendall A., Cipolla R. SegNet: A deep convolutional encoder-decoder architecture for image segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. V. 39 (12). P. 54-62
10. Tong, X.-Y., Xia, G.-S., Zhu, X. Enabling country-scale land cover mapping with meter-resolution satellite imagery // ISPRS Journal of Photogrammetry and Remote Sensing. - 2023. - Т. 196, № 7. - С. 178-196. - DOI: 10.1016/j.isprsjprs.2022.12.011.
11. Друки А.А., Спицын В.Г., Болотова Ю.А., Башлыков А.А. Семантическая сегментация данных дистанционного зондирования Земли при помощи нейросетевых алгоритмов // Известия Томского политехнического университета. Инжиниринг георесурсов. - 2018. - Т. 329, № 1. - С. 59-68
12. Джо К.О. Методы сегментации новообразований головного мозга: магистерская диссертация / К.О. Джо; науч. рук. О.М. Гергет; Национальный исследовательский Томский политехнический университет, Инженерная школа информационных технологий и робототехники, Отделение информационных технологий. — Томск, 2020. — 83 с.
13. Wang, T.S., Kim, G.T., Kim, M., Jang, J. Contrast Enhancement¬Based Preprocessing Process to Improve Deep Learning Object Task Performance and Results // Applied Sciences. - 2023. - Vol. 13, No. 19. - P. 10760. - DOI: 10.3390/app131910760.
14. Woo, S., Park, J., Lee, J.-Y., & Kweon, I. S. (2018). CBAM: Convolutional Block Attention Module. Lecture Notes in Computer Science, 3-19. doi:10.1007/978-3-030-01234-2_1
15. Hengshuang Zhao; Jianping Shi; Xiaojuan Qi; Xiaogang Wang; Jiaya Jia Pyramid Scene Parsing Network// IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA. 2017. P.
6230 - 6239.
..29


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ