Карта глубины представляет собой матрицу расстояний от стереокамеры до объекта для каждого пикселя одного из изображений.
Компьютерное стереозрение позволяет получать карты глубины посредством фиксированной системы из двух оптических камер. Это дешевле, а в некоторых задачах и эффективнее, чем активные системы, такие как Microsoft Kinect и Intel RealSence.
Стереозрение применяется в таких областях, как распознавание жестов, обход препятствий и 3D-реконструкция. Оно является областью активных исследований на протяжении многих лет, однако эффективное со всех точек зрения решение пока ещё не найдено.
Предложенная модификация улучшает качество алгоритма без существенных потерь в скорости и итоговая реализация, запущенная на GeForce GTX 1060, соответствует требованиям задач реального времени на разрешении 750 х 500. В дальнейшем планируется упростить алгоритм для эффективной работы на большем разрешении и на более слабом оборудовании.
[1] Hartley R. I., Zisserman A. Multiple view geometry in computer vision. Second edition. Cambridge University Press, 2004.
[2] Scharstein D., Szeliski R. A taxonomy and evaluation of dense two-frame stereo correspondence algorithms // International Journal of Computer Vision. 2002. No 47. P. 7-42.
[3] Zhang Y., Gu Y., Huang K. et al. Accurate image-guided stereo matching with efficient matching cost and disparity refinement // IEEE Transactions on Circuits and Systems for Video Technology. 2016. Vol. 26. No 9. P. 16321645.
[4] Xing M., Xun S., Mingcai Z. et al. On building an accurate stereo matching system on graphics hardware // 2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops). Barcelona: IEEE. 2011. P. 467-474.
[5] Jure Zbontar, Yann LeCun. Stereo matching by training a convolutional neural network to compare image patches // JMLR 17(65):1-32, 2016.
[6] Hirschmiiller H. Stereo processing by semiglobal matching and mutual information // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2008. Vol. 30. No 2. P. 328-341.
[7] Scharstein D., Hirschmiiller H., Kitajima Y. et al. High-resolution stereo datasets with subpixel-accurate ground truth //In German Conference on Pattern Recognition (GCPR 2014). Munster: GCPR. 2014. P. 31-42.