Введение 3
Глава 1. Обзор методов семантической сегментации трехмерных облаков точек 6
Глава 2. Экспериментальное исследование методов семантической сегментации трехмерных облаков точек 30
Глава 3. Анализ результатов экспериментального исследования 33
Заключение 36
Список литературы 37
В настоящее время современными технологиями сбора данных, которые позволяют получать трехмерные облака точек, являются лазерное сканирование, камеры глубин, стереофотограмметрия, структурированный свет. Они пришли на смену традиционным геодезическим методам и фотосъемке. Их популярность в разнообразных сферах деятельности: геодезии, строительстве, архитектуре, робототехнике можно объяснить получением более точных измерений с меньшими затратами времени, труда, финансовых ресурсов.
В то же время рост вычислительных мощностей и доступность трехмерных данных способствуют развитию технологий обработки облаков точек, которые реализуются задачами компьютерного зрения: сегментации, классификации и детекции. Сегментация - это процесс разделение всего облака точек на отдельные сегменты, с присвоением каждой точке значения класса данного объекта. Тогда как в классификации класс присваивается в целом к объекту, а не к каждой отдельной точке. Детекция - это процесс поиска и определения конкретных объектов в облаке, которые являются интересными для исследования.
Сегментация трехмерных облаков точек имеет более короткую историю, нежели другие задачи компьютерного зрения. Только с недавних пор этот термин стал очень популярен, однако в дистанционном зондировании ее часто называют классификацией.
Существует несколько видов сегментации: семантическая, паноптическая, по экземплярам, по частям. Выбор между задачами компьютерного зрения и их видами зависит от требований конкретной прикладной или научной задачи.
Семантическая сегментация трехмерных облаков точек заключается в присвоении каждой точке в трехмерном облаке точек соответствующей классовой метки. Она является важным инструментом обработки данных в дистанционном зондировании, геоинформатике, геодезии. Примерами использования данной технологии является инвентаризация, мониторинг, планирование объектов городской инфраструктуры и окружающей среды, анализа геометрических свойств объектов, создание точных и детализированных карт и моделей местности, способствует развитию концепций цифровых двойников и умных городов.
Трехмерное облако точек для геопространственных приложений — это набор точек в трехмерном пространстве, который представляет собой часть трехмерной сцены, где каждая точка описана дескрипторами, например, координатами и дополнительными признаками, такими как цвет, интенсивность. Важно отметить, что такие облака точек плотные и крупномасштабные, так как в ранние исследования технологиям обработки небольших и разреженных облаков точек, которые не отражали действительность.
Существует множество общедоступных наборов данных трехмерных облаков точек, которые ориентированы на автономное вождение. Новый набор данных 2023 года — Saint Petersburg 3D (Lytkin, 2023) содержит несколько крупномасштабных сцен, состоящих из плотных облаков точек мобильного LiDAR на открытом воздухе. Ему соответствует сбалансированный набор из 10 универсальных категорий объектов.
Многие геопростраственные приложения поддерживают работу с облаками точек, например, GlobalMapper, TerraScan, ENVI LiDAR, CloudCompare, Agisoft Metashape, Bentley Pointools, ArcGIS Pro, Autodesk ReCap, но не одна из данных программ не содержит специализированного инструмента для семантической сегментации. В некоторых из них, например, в CloudCompare, есть возможность интеграции стороннего пользовательского плагина для решения данной задачи. Для его создания нужно иметь знание языка программирования и API конкретной программы. В плагине необходимо реализовать не только, алгоритмы обработки облаков точек и обучения моделей, но и интерфейс для взаимодействия пользователя с ним.
Семантическая сегментация трехмерных облаков точек реализована различными методами - алгоритмами, разработка и исследование которых начались с 2010-х годов. С тех пор было предложено большое количество эффективных методов. В настоящее время наблюдается значительный прогресс в этой области. Семантическая сегментация облаков точек находится в стадии активного развития.
На основании вышеизложенного, можно сказать, что данное исследование имеет высокую актуальность.
С точки зрения практической значимости будет проведено экспериментальное исследования, а также получены метрические характеристики исследуемых методов для набора данных Saint Petersburg 3D.
С точки зрения научной значимости предстоит масштабный анализ существующих методов семантической сегментации трехмерных облаков точек для получения обобщенного и систематического представления в данной области исследования.
...
В последнее годы появилось множество новых эффективных методов семантической сегментации трехмерных облаков точек благодаря совершенствованию технологий сбора данных, вычислительных систем. Такие методы требуют исследований для понимания их применимости в тех или иных практических задачах, а также для оценки их эффективности.
В ходе данной работы был выполнен теоретический анализ методов семантической сегментации трехмерных облаков точек и составлен обзор большого количества из них, который дал понимание сути, преимуществ и недостатков каждого метода. Отобран релевантный метод KPConv (Thomas, 2019), потому что он удовлетворяет условиям данного экспериментального исследования. Для семантической сегментации выбрана нейронная сеть KP-FCNN, в которую входит KPConv. Проведено экспериментальное исследование на наборе данных Saint Petersburg 3D (Lytkin, 2023), где KP-FCNN продемонстрировала превосходные результаты семантической сегментации плотных крупномасштабных облаков точек для геопространственных приложений . Оценка классов с помощью метрики и визуализация размеченных облаков точек помогли проанализировать результаты KP-FCNN и сделать вывод о ее высокой эффективности.
1. He Y., Yu H., Liu X., Yang Z., Sun W., Wang Y., Fu O., Zou Y., Mian, A. Deep learning based 3D segmentation: A survey //arXiv preprint arXiv:2103.05423. — 2021.
2. Guo Y., Wang H., H Q., Li H., Liu L., Bennamoun M. Deep learning for 3d point clouds: A survey //IEEE transactions on pattern analysis and machine intelligence. - 2020. - Т. 43. - №. 12. - С. 4338-4364.
3. Xie Y., Tian J., Zhu X. X. Linking points with labels in 3D: A review of point cloud semantic segmentation //IEEE Geoscience and remote sensing magazine. - 2020. - Т. 8. - №. 4. — С. 38-59.
4. Bello S. A., Yu S., Wang C., Adam J. M., Li J. Deep learning on 3D point clouds //Remote Sensing. - 2020. - Т. 12. - №. 11. — С. 1729.
5. Lu D., Xie Q., Wei M., Xu L., Li J. Transformers in 3d point clouds: A survey //arXiv preprint arXiv:2205.07417 — 2022.
6. Su H., Maji S., Kalogerakis E., Learned-Miller E. Multi-view convolutional neural networks for 3d shape recognition //Proceedings of the IEEE international conference on computer vision. - 2015. - С. 945-953.
7. Qi C. R., Su H., NieBner M., Dai A., Yan M., Guibas L. J. Volumetric and multi-view cnns for object classification on 3d data //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2016. - С. 5648-5656.
8. Boulch A., Guerry J., Saux B., Audebert N. SnapNet: 3D point cloud semantic labeling with 2D deep segmentation networks //Computers & Graphics — 2018. — С. 189-198
9. Boulch A., Guerry J., Saux B., Audebert N. Unstructured Point Cloud Semantic Labeling Using Deep Segmentation Networks. 3DOR —2017. — C. 17-24
10. Guerry J., Boulch A., Saux B., Moras J., Plyer A., and Filliat D. SnapNet-R: Consistent 3D multi-view semantic labeling for robotics // IEEE international conference on computer vision. — 2017. — С. 669-678.
11. Tatarchenko M., Park J., Koltun V., Zhou Q. Y. Tangent convolutions for dense prediction in 3d//IEEE conference on computer vision and pattern recognition. - 2018. - С. 3887-3896.
12. Wu Z., Song S., Khosla A., Yu F., Zhang L., Tang X., Xiao J. 3DShapeNets: A Deep Representation for Volumetric Shapes//IEEE conference on computer vision and pattern recognition. - 2015. - С. 1912-1920.
13. Maturana D., Scherer S. VoxNet: A 3D convolutional neural network for real-time object recognition. //IEEE International Conference on Intelligent Robots and Systems. — 2015. — С. 922-928.
14. Verdoja F., Thomas D., Sugimoto A. Fast 3D point cloud segmentation using supervoxels with geometry and color for 3D scene understanding. // IEEE International Conference on Multimedia and Expo. — 2017 — С. 1285-1290.
15. Klokov R., Lempitsky V. Escape from cells: Deep Kd-networks for the recognition of 3D point cloud models. //IEEE conference on computer vision. — 2017. — С. 863-872.
... всего 54 источников