Тип работы:
Предмет:
Язык работы:


Реконструкция трехмерной поверхности лица на базе морфированной модели

Работа №130339

Тип работы

Бакалаврская работа

Предмет

программирование

Объем работы34
Год сдачи2016
Стоимость4300 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
81
Не подходит работа?

Узнай цену на написание


Введение 4
1. Обзор 7
1.1. Нахождение перспективной камеры . . . . . . . . . . . . 7
1.2. Детекция ключевых точек на лице . . . . . . . . . . . . . 8
1.3. Реконструкция поверхности лица . . . . . . . . . . . . . . 9
2. Описание подхода 11
2.1. Условия решаемой задачи . . . . . . . . . . . . . . . . . . 11
2.2. Начальное приближение камеры . . . . . . . . . . . . . . 11
2.3. Алгоритм Левенберга-Марквардта . . . . . . . . . . . . . 12
2.4. Использование морфированной модели . . . . . . . . . . 13
3. Реализация 14
3.1. Система сбора статистических данных . . . . . . . . . . . 14
3.1.1. Рендеринг трехмерной модели лица . . . . . . . . 16
3.1.2. Детектирование ключевых точек на лице . . . . . 18
3.2. Система генерации тестов и проведения экспериментов . 19
3.3. Реализация предложенного подхода . . . . . . . . . . . . 21
4. Эксперименты 22
4.1. Зависимость от ковариационной матрицы . . . . . . . . . 22
4.2. Задача нахождения перспективной камеры . . . . . . . . 24
4.3. Реконструкция поверхности лица и камеры . . . . . . . . 25
4.4. Зависимость от параметров тестовых данных . . . . . . . 28
Заключение 29
Список литературы 30
Приложение

В современном мире графика в компьютерных играх и киноиндустрии продолжает совершенствоваться с каждым годом. Несколько последних лет прослеживается тенденция съемки настоящих актеров для
отрисовки 3D моделей компьютерных персонажей. Для того, чтобы создать полнометражную компьютерную анимацию, требуется участие высоко квалифицированных художников, а также большое количество временных и вычислительных ресурсов. Поэтому развитие технологий
захвата движений актера, построения трехмерных моделей сцены и
объектов на ней, распознавания лиц и основных черт лица постепенно приводит к автоматизации процесса создания трехмерных моделей актеров и повышению их реалистичности.
Получение трехмерной модели лица обычно требует наличия специального устройства, как Kinect или лазерный сканер. Но такие приборы сложно использовать вне специальных лабораторий из-за трудностей в
оборудовании необходимого окружения и их высокой цены. В более
простом случае реконструировать 3D модель лица пытаются по одной
или нескольким фотографиям. При таком подходе, как правило, используют базы шаблонных моделей для поиска максимально близких к исходному изображению ключевых областей.
Большинство ограничений в автоматических методах синтеза лиц
существуют, чтобы избежать нереалистичных, непохожих на натуральное лицо, результатов. Например, некоторые методы требуют внесения ручных правок по ходу процесса генерации трехмерной модели
или работают только для фронтального изображения лица. С появлением морфированной модели [1] (3D morphable model, 3DMM) стали активно развиваться новые направления автоматической генерации, реконструкции и анимации лиц. Основная идея использования морфированной модели заключается в разложении произвольной поверхности лица в линейную комбинацию базисных лиц. За счет аппроксимации произвольной модели базисными уменьшается требуемый размер заранее подготовленной базы, а высокая детализация исходных моделей позволяет синтезировать реалистичные лица. Подход линейной аппроксимации не требует высокой вычислительной мощности, поэтому применяется даже для генерации моделей в реальном времени [8] и дает реалистичные результаты при построении анимации лиц.
Реконструкция трехмерной модели лица по двухмерному изображению состоит из двух задач: построения трехмерной поверхности лица и нахождения его положения в пространстве. В соответствии с определением параметрической модели Парке [18] поверхность лица задается набором координат трехмерных вершин и множеством плоскостей, проходящих через них. Положение трехмерной модели в пространстве описывается матрицей поворота и вектором переноса камеры.
Задача определения ориентации и позиции откалиброванной перспективной камеры по n известным 3D точкам в координатах модели
и их 2D проекциям на изображении (perspective-n-point problem, PnP)
имеет решение при n ≥ 3 [4, 7]. При наличии информации о более, чем
3 точках на изображении и их положении в трехмерном пространстве,
глобально оптимальное решение этой задачи может быть найдено алгоритмом OPnP [26] за вычислительную сложность равную O(n).
Минимизация функции стоимости в виде нелинейных наименьших квадратов методом Левенберга-Марквардта позволяет уменьшить ошибку найденной ориентации и позиции камеры OPnP алгоритмом. Для
этого в качестве весовой матрицы в методе наименьших квадратов следует взять обратную ковариационную матрицу распределения 2D точек в 3D. Алгоритм Левенберга-Марквардта помимо оптимизации параметров камеры можно в тоже время использовать для приближения
параметров морфированной модели, с целью получения трехмерной поверхности лица.
Описанные положения о вычислении начального приближения параметров перспективной камеры с помощью OPnP алгоритма и использование обратной ковариационной матрицы в качестве матрицы весов
при минимизации функции стоимости в виде нелинейных наименьших
квадратов легли в основу предлагаемого статистического подхода.
5Постановка задачи
Цель данной работы реализовать и провести апробацию нового статистического подхода по реконструкции трехмерной поверхности лица и нахождению матрицы поворота и вектора переноса перспективной камеры по одному исходному изображению повернутого лица.
В ходе работы для достижения описанной цели были поставлены следующие задачи.
1. Разработать систему сбора статистических данных, необходимых для предлагаемого алгоритма.
2. Реализовать предлагаемый подход к реконструкции 3D поверхности лица и нахождению параметров перспективной камеры.
3. Разработать систему генерации тестовых данных и проведения сравнительных экспериментов.
4. Провести сравнение с существующими алгоритмами нахождения перспективной камеры и алгоритмами реконструкции 3D поверхности лица.
5. Исследовать зависимость результатов предлагаемого подхода от изменения параметров тестовых данных.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате работы были выполнены следующие задачи:
• разработана система сбора статистики распределения ключевых точек в трехмерном пространстве;
• реализован статистический подход к решению задачи реконструкции трехмерного лица по изображению;
• разработана система генерации тестовых данных и проведения экспериментов;
• сравнение показало, что для задачи нахождения камеры подход
точнее аналогов в 2 раза, а для задачи реконструкции поверхности
лица и камеры дает ошибку по камере близкую к аналогам и в 2 раза меньшую ошибку поверхности лица;
• исследована зависимость результатов предлагаемого подхода от
ковариационной матрицы и добавления Гауссовского шума на изображения лиц.
Таким образом, было получено, что предлагаемый статистический
подход на базе морфированной модели дает по сравнению с аналогами наиболее стабильные результаты на разных тестовых данных, как
для задачи нахождения перспективной камеры, так и для задачи реконструкции поверхности лица и камеры одновременно.
Дальнейшая работа с целью улучшения полученных результатов может быть направлена в сторону применения других алгоритмов детекции ключевых точек, а также увеличения количества используемых в алгоритме ключевых точек за счет добавления неустойчивых особых точек по краям лица и подбородка


[1] Blanz Volker, Vetter Thomas. A morphable model for the synthesis of
3D faces // Proceedings of the 26th annual conference on Computer
graphics and interactive techniques. / ACM Press/Addison-Wesley
Publishing Co. –– 1999. –– P. 187–194.
[2] Cootes T. F., et al. Active shape models-their training and
application // Computer vision and image understanding. –– 1995. ––
P. 38–59.
[3] Dalal N., Triggs B. Histograms of oriented gradients for human
detection // Computer Vision and Pattern Recognition. –– 2005. ––
P. 886–893.
[4] DeMenthon D., Davis L. S. Face alignment through subspace
constrained mean-shifts // IEEE Transactions on Pattern Analysis &
Machine Intelligence. –– 1992. –– P. 1100–1105.
[5] Face alignment by explicit shape regression / X. Cao, Y. Wei, F. Wen,
J Sun // Proceedings of IEEE Conference on Computer Vision and
Pattern Recognition. –– 2012. –– P. 2887–2894.
[6] Haralick R. M., et al. Pose estimation from corresponding point data //
Systems, Man and Cybernetics, IEEE Transactions on. –– 1989. ––
P. 1426–1446.
[7] Hartley R., Zisserman A. Multiple view geometry in computer vision. ––
Cambridge university press, 2003.
[8] Huber P., et al. Fitting 3D Morphable Models using local features //
arXiv preprint arXiv:1503.02330. –– 2015.
[9] Izadi S., et al. KinectFusion: real-time 3D reconstruction and
interaction using a moving depth camera // Proceedings of the 24th
annual ACM symposium on User interface software and technology. /
ACM. –– 2011. –– P. 559–568.
30[10] Jiang D. et al. Efficient 3D reconstruction for face recognition //
Pattern Recognition. –– 2005. –– P. 787–798.
[11] Jiang D. et al. Park U., Jain A. K. 3D face reconstruction from stereo
video // Computer and Robot Vision. The 3rd Canadian Conference
on. –– 2006. –– P. 41–41.
[12] Kemelmacher-Shlizerman I., Basri R. 3d face reconstruction from a
single image using a single reference face shape // Pattern Analysis
and Machine Intelligence, IEEE Transactions on. –– 2011. –– P. 394–
405.
[13] Lepetit V., Moreno-Noguer F., Fua P. Epnp: An accurate o (n) solution
to the pnp problem // International journal of computer vision. ––
2009. –– P. 155–166.
[14] Li S., Xu C., Xie M. A robust O (n) solution to the perspective-npoint problem // Pattern Analysis and Machine Intelligence, IEEE
Transactions on. –– 2012. –– P. 1444–1450.
[15] Lienhart R., Maydt J. An extended set of haar-like features for
rapid object detection // Image Processing. 2002. Proceedings. 2002
International Conference on. / IEEE. –– 2002. –– P. 900–903.
[16] Lu C. P., Hager G. D., Mjolsness E. Fast and globally convergent
pose estimation from video images // Pattern Analysis and Machine
Intelligence, IEEE Transactions on. –– 2000. –– P. 610–622.
[17] Moré J. J. The Levenberg-Marquardt algorithm: implementation and
theory. –– Numerical analysis : Springer Berlin Heidelberg, 1978.
[18] Parke F.I. A parametric model for human faces. №. UTEC-CSc-75-
047. –– UTAH UNIV SALT LAKE CITY DEPT OF COMPUTER
SCIENCE, 1974.
[19] Paysan P. A 3D face model for pose and illumination invariant face
recognition // Advanced video and signal based surveillance, 2009.
31AVSS’09. Sixth IEEE International Conference on. –– 2009. –– P. 296–
301.
[20] Qu C., et al. Adaptive Contour Fitting for Pose-Invariant 3D Face
Shape Reconstruction. –– 2015.
[21] Saragih J. M., Lucey S., Cohn J. F. Deformable model fitting by
regularized landmark mean-shift // International journal of computer
vision. –– 2011. –– P. 200–215.
[22] Viola P., Jones M. J. Robust real-time face detection // International
journal of computer vision. –– 2004. –– P. 137–154.
[23] Wang N., et al. Facial feature point detection: A comprehensive
survey // arXiv preprint arXiv:1410.1037. –– 2014.
[24] X. Gao, et al. A review of active appearance models // Systems,
Man, and Cybernetics, Part C: Applications and Reviews, IEEE
Transactions on. –– 2010. –– P. 145–158.
[25] Xiong X., Torre F. Supervised descent method and its applications to
face alignment // Proceedings of the IEEE conference on computer
vision and pattern recognition / IEEE. –– 2013. –– P. 532–539.
[26] Zheng Y. Revisiting the pnp problem: A fast, general and optimal
solution // Proceedings of the IEEE International Conference on
Computer Vision. –– 2013. –– P. 2344–2351

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ