Локализация аэросъемки является важной задачей в современном
мире [29]. Одним из возможных сценариев её использования является построение карты для локализации других летательных аппаратов [1, 43]. Также локализация аэросъёмки может применяться для построения точной 3D-модели местности и ее дальнейшего использования
для анализа местности. Такие модели используются в различных областях, например, в геологии [60], строительстве [42] и многих других.
В большинстве случаев для локализации летательных аппаратов применяются такие системы глобального позиционирования как
GPS [25] или ГЛОНАСС [22]. Однако данный подход требует стабильности спутникового сигнала и отсутствия помех. Это не всегда возможно,
особенно в случае наличия отражений сигнала из-за водоёмов и/или
сложного рельефа местности. Также стоит отметить, что покрытие сигнала глобальных спутниковых систем на планете неравномерно. Все эти
причины вынуждают использовать другие подходы для локализации.
Одним из таких подходов является визуальная геолокализация —
задача нахождения местоположения сделанного снимка. Поиск может
осуществляться по-разному, однако чаще всего для этого используется заранее созданная база данных изображений и местоположений, им
соответствующих [65]. Данный подход обычно делится на два этапа:
глобальную локализацию и локальное выравнивание. Первый заключается в поиске ближайшего кадра из базы данных, а второй вычисляет точное положение системы, используя выбранный кадр. Глобальная
локализация (или VPR — visual place recognition) также может выполняться по-разному. Некоторые методы предполагают использование дескрипторов — компактного представления изображений в базе данных,
другие же используют ключевые точки изображений для сопоставления. Второй подход является более вычислительно сложным, однако
способен делать более точные предсказания [7].
Использование визуальной геолокализации в случае аэросъёмки может быть осложнено рядом факторов, такими как изменяющиеся по-
4годные условия, смена времен года и времени суток. Задача локализации аэрофотоснимков требует карт достаточно большого размера, что
также накладывает ограничения на этап глобальной локализации. При
этом снимки из общедоступных наборов данных, таких как Google Maps
API [26] и Sentinel [55], имеют разное разрешение. Для Sentinel максимальное разрешение составляет 10 м/пиксель, а в случае Google Maps
оно варьируется от 0.15 м/пиксель до 5 м/пиксель.
На данный момент обзоры-сравнения VPR-систем сфокусированы
на данных, снятых внутри и вне помещений [41, 23, 67, 18], и не затрагивают спутниковые изображения и аэрофотоснимки. Поэтому в рамках данной работы планируется провести обзор различных подходов
к визуальной геолокализации, предложить метрики для оценки качества различных методов и определить, какие методы в связке с каким
представлением карт дают наиболее точные результаты в случае аэрофотоснимков.
В рамках работы были выполнены следующие задачи.
1. Выполнен обзор существующих решений для визуальной геолокализации, а также глобальной локализации и локального выравнивания по отдельности.
2. Предложены и реализованы метрики для оценки результата работы различных методов локализации.
3. Спроектирован и разработан инструмент, позволяющий сравнивать различные подходы к визуальной локализации.
4. Проведено экспериментальное исследование различных методов
локализации с использованием разработанного инструмента.
[1] A 2D Georeferenced Map Aided Visual-Inertial System for Precise UAV Localization / Mao Jun, Zhang Lilian, He Xiaofeng et al. // 2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) / IEEE. - 2022. - P. 4455-4462.
[2] ALTO: A Large-Scale Dataset for UAV Visual Place Recognition and Localization / Ivan Cisneros, Peng Yin, Ji Zhang et al. // arXiv preprint arXiv:2207.12317. — 2022.
[3] Adaptive-attentive geolocalization from few queries: A hybrid ap¬proach / Gabriele Moreno Berton, Valerio Paolicelli, Carlo Masone, Barbara Caputo // Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. — 2021. — P. 2918-2927.
[4] Ali-Bey Amar, Chaib-Draa Brahim, Giguere Philippe. Mixvpr: Feature mixing for visual place recognition // Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. — 2023. — P. 2998-3007.
[5] Anyloc: Towards universal visual place recognition / Nikhil Keetha, Avneesh Mishra, Jay Karhade et al. // arXiv preprint arXiv:2308.00688. — 2023.
[6] Arandjelovic Relja, Zisserman Andrew. All about VLAD // Proceed¬ings of the IEEE conference on Computer Vision and Pattern Recog¬nition. — 2013. — P. 1578-1585.
[7] Are Local Features All You Need for Cross-Domain Visual Place Recog¬nition? / Giovanni Barbarani, Mohamad Mostafa, Hajali Bayramov et al. // Proceedings of the IEEE/CVF Conference on Computer Vi¬sion and Pattern Recognition. — 2023. — P. 6154-6164.
[8] Attentional pyramid pooling of salient visual residuals for place recogni¬tion / Guohao Peng, Jun Zhang, Heshan Li, Danwei Wang // Proceed-
ings of the IEEE/CVF International Conference on Computer Vision. — 2021. —P. 885-894.
[9] Automatic UAV image geo-registration by matching UAV images to georeferenced image data / Xiangyu Zhuo, Tobias Koch, Franz Kurz et al. // Remote Sensing. — 2017. — Vol. 9, no. 4. — P. 376.
[10] Berton Gabriele, Masone Carlo, Caputo Barbara. Rethinking vi¬sual geo-localization for large-scale applications // Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recogni¬tion. — 2022. — P. 4878-4888.
[11] Bradski Gary. The openCV library. // Dr. Dobb’s Journal: Software Tools for the Professional Programmer.— 2000.— Vol. 25, no. 11.— P. 120-123.
[12] Bui Duc Viet, Kubo Masao, Sato Hiroshi. Attention-based neural net¬work with Generalized Mean Pooling for cross-view geo-localization between UAV and satellite // Artificial Life and Robotics. — 2023. — P. 1-11.
[13] Choi Junho, Myung Hyun. BRM localization: UAV localization in GNSS-denied environments based on matching of numerical map and UAV images // 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) / IEEE. — 2020. — P. 4537-4544.
[14] Coarse-to-Fine Visual Place Recognition / Junkun Qi, Rui Wang, Chuan Wang, Xiaochun Cao // International Conference on Neural Information Processing / Springer. — 2021. — P. 28-39.
[15] CurriculumLoc: Enhancing Cross-Domain Geolocalization through Multi-Stage Refinement / Boni Hu, Lin Chen, Runjian Chen et al. // IEEE Transactions on Geoscience and Remote Sensing. — 2024.
[16] DeTone Daniel, Malisiewicz Tomasz, Rabinovich Andrew. Superpoint: Self-supervised interest point detection and description // Proceedings of the IEEE conference on computer vision and pattern recognition workshops. — 2018. — P. 224-236.
[17] Deep residual learning for image recognition / Kaiming He, Xi- angyu Zhang, Shaoqing Ren, Jian Sun // Proceedings of the IEEE con¬ference on computer vision and pattern recognition. — 2016. — P. 770¬778.
[18] Deep visual geo-localization benchmark / Gabriele Berton, Ric¬cardo Mereu, Gabriele Trivigno et al. // Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. — 2022. — P. 5396-5407.
[19] Dinov2: Learning robust visual features without supervision / Maxime Oquab, Timothee Darcet, Theo Moutakanni et al. // arXiv preprint arXiv:2304.07193. — 2023.
[20] EigenPlaces: Training Viewpoint Robust Models for Visual Place Recognition / Gabriele Berton, Gabriele Trivigno, Barbara Caputo, Carlo Masone // Proceedings of the IEEE/CVF International Confer¬ence on Computer Vision. — 2023. — P. 11080-11090.
[21] Fast aerial image geolocalization using the projective-invariant contour feature / Yongfei Li, Shicheng Wang, Hao He et al. // Remote Sens¬ing. — 2021. — Vol. 13, no. 3. — P. 490.
[22] GLONASS.— URL: https://glonass-iac.ru/en/about_glonass/ (дата обращения: 2023-12-01).
[23] Garg Sourav, Fischer Tobias, Milford Michael. Where is your place, visual place recognition? // IJCAI. — Vol. 8. — 2021. — P. 4416-4425.
[24] Geolocalization with aerial image sequence for UAVs / Yongfei Li, Hao He, Dongfang Yang et al. // Autonomous Robots. -- 2020. -¬Vol. 44, no. 7. —P. 1199-1215.
[25] The Global Positioning System. — URL: https://www.gps.gov (дата обращения: 2023-12-01).
[26] Google Maps API.— URL: https://developers.google.com/maps (дата обращения: 2023-12-01).
[27] Google map aided visual navigation for UAVs in GPS-denied environ¬ment / Mo Shan, Fei Wang, Feng Lin et al. // 2015 IEEE international conference on robotics and biomimetics (ROBIO) / IEEE.— 2015.— P. 114-119.
[28] Gurgu Marius-Mihail, Queralta Jorge Pena, Westerlund Tomi. Vision¬Based GNSS-Free Localization for UAVs in the Wild // 2022 7th Inter¬national Conference on Mechanical Engineering and Robotics Research (ICMERR) / IEEE. - 2022. - P. 7-12.
[29] Harvey Winthrop, Rainwater Chase, Cothren Jackson. Direct aerial visual geolocalization using deep neural networks // Remote Sensing. — 2021. —Vol. 13, no. 19. —P. 4017.
[30] Image matching from handcrafted to deep features: A survey / Ji- ayi Ma, Xingyu Jiang, Aoxiang Fan et al. // International Journal of Computer Vision. — 2021. — Vol. 129, no. 1. — P. 23-79.