Введение 5
1. Постановка задачи и терминология 6
1.1. VO и SLAM 6
1.2. Предварительные сведения 7
1.2.1. Группы Ли SO(3), SE(3), Sim(3) 7
1.2.2. Пространство изображения и связанные операции 9
1.2.3. Метод наименьших квадратов и оценки максимального правдоподобия 10
2. Алгоритмы VO и VSLAM 12
2.1. Классификация 12
2.2. Методы оценки качества модели 13
2.3. Обзор данных для экспериментов 14
2.3.1. Tum Mono Dataset 15
2.3.2. KITTI Dataset 15
2.3.3. ApolloScape 16
2.3.4. Эксперименты 16
2.4. LSD-SLAM 17
2.4.1. Отслеживание кадров 17
2.4.2. Оценка глубин 19
2.4.3. Sim(3) ограничение и оптимизация карты территории 19
2.4.4. Полученные результаты 20
2.5. Semi-direct Visual Odometry 23
2.5.1. Оценка движения 25
2.5.2. Оценка карты глубин 26
2.5.3. Полученные результаты 28
2.6. Direct Sparse Odometry 28
2.6.1. Полученные результаты 30
3. Анализ результатов 33
3.1. Выводы 34
Заключение 36
Список литературы 37
Одной из фундаментальных задач в сфере мобильных роботов и беспилотных автомобилей является локализация объекта и построение карты окружающей территории. Существует множество подходов к решению этой проблемы с использованием различных технических средств, например, таких, как лазерные установки типа LiDAR [5, 22], IMU [16], GPS, радар [21]. Все они, однако, имеют различные недостатки. Например, технология LiDAR очень дорогая, а GPS имеет огромную погрешность и не может использоваться сама по себе в системах, где требуется большая точность. В связи с этим, большой интерес представляют методы визуальной одометрии, то есть методы, которые используют информацию, захваченную с видеопотока камеры, установленной на объекте. Действительно, камеры имеют низкую стоимость по сравнению с большинством других технических средств, кроме того существуют алгоритмы, способные качественно преобразовывать фотометрическую информацию в информацию о местоположении камеры. Разумеется, и этот способ страдает от многих проблем. Например, плохое освещение может сильно испортить оценку движения, а для корректного сопоставления необходимо доминирование в окружении статичных объектов. Кроме того, существуют фундаментальные геометрические ограничения для определения точного вращения и перемещения камеры по изображениям. Для многих систем, однако, это наиболее многообещающий подход, нередки и его сочетания с использованием других дополнительных датчиков (LiDAR, IMU и т.д.). Кроме того, текущие исследования далеко продвинулись в ослаблении ограничений для применимости этого метода. Настоящая работа, следуя тенденциям, представляет обзор современных подходов визуальной одометрии для монокулярных камер.
В ходе работы удалось разобраться с современными методами в задачах VO, изучить их открытые реализации и найти там ошибки, а так же познакомиться с различными наборами данных, из которых хочется отметить недавно вышедший ApolloScape, так как до этого он не применялся (в литературе) для оценки качества алгоритмов одометрии.
В заключение хочется сказать, что оценка точности методов SLAM и VO является непростой задачей, так как разные алгоритмы работают при разных условиях, и небольшое их нарушение приводит к плачевным результатам. Это в основном касается монокулярных алгоритмов, в то время как алгоритмы, работающие со стереопарой, не столь подвержены сильным колебаниям в качестве.
Также я пришел к выводу, что открытые реализации требуют серьезной доработки для того, чтобы быть использованными реальных задачах.