Распознавание положения и конфигурации объекта в реальном времени является сложной и важной задачей компьютерного зрения. Эта задача возникает во многих областях, таких как распознавание и захват движений, робототехника, управление жестами, виртуальная реальность и др.
Цель работы - по поступающей с SD-сенсора, в области видимости которого находится объект, последовательности кадров, оценить параметры сочлененной модели (расположение и конфигурацию), соответствующей этому объекту, на каждом кадре.
Для достижения цели были решены следующие задачи.
1. Параметризация модели.
2. Разработка критериев качества соответствия модели и данных.
3. Оптимизационная задача.
В работе предложен метод нахождения параметров модели. Продемонстрировано применение к решению задачи распознавания позы человека и построения скелетной модели. Метод основан на оптимизации нескольких критериев качества соответствия модели и данных, полученных с сенсора глубины.
В работе предложен метод оценивания параметров модели по картам глубины. Продемонстрировано применение метода к решению задачи распознавания позы человека и построения скелетной Данная задача является важной в области компьютерного зрения. Предложен- ныйалгоритм можно использовать для распознавания и захвата движений, в робототехнике, для управления жестами, для представления человека в виртуальной реальности.
Метод был протестирован на открытом наборе данных StanfordMotionCaptureDataset. Средний процент попаданий составлил 95.3588%, что превышает значение в 91,4%, полученное для алгоритма, использующегося в сенсоре MicrosoftKinect1.
Время работы алгоритма составляет в среднем 30 миллисекунд за кадр на настольном компьютере. Это позволяет использовать алгоритм в режиме реального времени. Однако, на менее производительных встраиваемых и мобильных процессорах время работы возрастает в несколько раз, что не позволяет запускать на них алгоритм в режиме реального времени.
Алгоритм преимущественно предназначен для фронтальных поз и не покрывает развороты на 360 градусов.
В перспективе возможно ускорение работы алгоритма за счет снижения временных затрат на регистрацию поверхностей и вычисление значений функции и градиентов. Также возможно улучшение качества за счет добавления новых критериев.
модели (рисунок 5.1).