Тип работы:
Предмет:
Язык работы:


Применение style-transfer моделей для генерации искусственных данных в задаче генерации 3D-моделей персонажей по скетч рисункам

Работа №142501

Тип работы

Бакалаврская работа

Предмет

прикладная информатика

Объем работы34
Год сдачи2022
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
28
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 5
1. Обзор предметной области 6
2. Описание исходных данных 9
3. Применение существующих моделей 12
3.1. Cycle Gan 13
3.2. Contrastive Unpaired Translation 16
3.3. UGATIT 19
3.4. AdaIn 21
3.5. StyTr2 24
4. Применение искусственных данных в задаче определения 2D
позы 26
Заключение 30
Список литературы 31

В наши дни трудно представить себе человека, который не пользуется какими-либо электронными устройствами. Несмотря на это, нам важны не устройства сами по себе, а скорее контент, доступ к которому они предостав­ляют. Этот контент может принимать различные формы, однако наиболее часто он представляется в виде визуальной информации. Большую часть по­добного рода информации можно отнести к тем или иным разновидностям компьютерной графики.
Производство графики представляет собой комплексный процесс. В первую очередь на свет появляются концепты и наброски, представляющие собой первое видение будущего произведения или его части. По существую­щим концепт-артам создаются 3D модели. 3D-художник вручную переносит содержание двумерного изображения в трехмерное пространство. На постро­енную модель накладываются текстуры. В зависимости от формы и содер­жания конечного продукта в пайплайн может добавиться труд аниматоров, скульпторов, риггеров и других специалистов.
^здание трехмерной компьютерной графики является длительным и дорогим процессом, включающем в себя труд множества людей.
В настоящее время существуют различные разновидности программно­го обеспечения, стремящиеся облегчить труд цифровых художников. К ним относятся пакеты для 3D моделирования, скульптинга, текстурирования и другие. Большинство из них можно настроить с помощью различных плаги­нов и сделать процесс работы с 3D более удобным.
В связи с быстрым развитием методов, основанных на анализе данных, логично попытаться применить их к задачам, решаемым в процессе создания компьютерной графики. В частности, попытаться внедрить нейронные сети в пайплайн создания 3D модели или анимации для того, чтобы освободить художника от рутинных задач.
Однако данный подход встречается с некоторыми трудностями на сво­ем пути к реализации: для обучения моделей, основанных на анализе данных, требуется большое количество этих самых данных. К сожалению, для решения задач, связанных с обработкой рисунков с человекоподобными персонажами существует мало размеченных наборов данных. Это оправдано, так как для получения разметки по рисункам в большинстве случаев необходим труд про­фессионалов. Например в задаче реконструкции позы персонажа по рисунку для каждого элемента данных необходимо провести ручную реконструкцию позы, что, в свою очередь, является довольно трудоемким процессом, который подвластен не каждому.
Не стоит забывать, что при рисовании художники не используют точные математические измерения для ортографической или перспективной проек­ции, вместо этого полагаясь на свой опыт и эмпирические правила [16, 36]. В связи с этим художники часто искажают пропорции конечностей и ис­пользуют нелинейную перспективу [32]. Кости персонажей часто выходят за пределы своей нормальной длины на рисунках из-за неточностей рисунка или художественной лицензии [36, 16, 34]. Все это не позволяет использовать искусственные данные в необработанном формате, сгенерированные как есть.
В данной работе мы хотим преодолеть ограничения, накладываемые на применение нейронных сетей в работе с реалистичными изображениями, пу­тем создания искусственных данных на основе существующих 3D-моделей [2]. Эти искусственные данные должны, быть похожи на реальные рисунки, чтобы затем на них имело смысл проводить обучение нейронных сетей для решения различных задач, требующих размеченных датасетов. Для создания датасета предлагается воспользоваться современными моделями переноса стиля между изображениями [14]. Перенос стиля позволит нам использовать обширные базы с 3D моделями для создания правдоподобных набросков с соответствующими им разметками, полученными непосредственно из 3D мо­делей.
Предполагается исследовать применимость подобного подхода к гене­рации искусственных данных в задаче реконструкции 2D скелета персонажа по рисунку. В связи с тем, что персонажи на рисунках часто имеют нереали­стичные или сильно искаженные пропорции также мы хотим сравнить методы переноса стиля с применением пространственных аугментаций.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках работы было изучено несколько архитектур нейронных сетей, позволяющих переносить стиль между изображениями. Эксперименты пока­зали, что генеративно состязательные сети плохо приспособлены для работы с разреженными изображениями, какими являются например наброски.
Были отобраны архитектуры, позволяющие правдоподобно переносить стиль с реальных рисунков на изображения, сгенерированные по трехмерным моделям. Такими архитектурами оказались модели, основанные на специаль­ных слоях, осуществляющих смешивание статистик контента и стиля.
Были собраны наборы данных правдоподобных скетчей с помощью мо­делей AdaIN и StyTr2 с использованием различных стилевых источников. На данных наборах была обучена модель для определения 2D позы персонажа по изображению, которая показала себя не лучше предобученной модели и моде­ли обученной на данных, непосредственно сгенерированных из трехмерных моделей.
Было изучено применение пространственных аугментаций при обуче­нии модели определения 2D позы, которые позволили превзойти качество, полученное на данных без переноса стиля.


[1] Adain repository. https://github.com/naoto0804/pytorch-AdaIN.
[2] Adobe’s mixamo. https://www.mixamo.com/#/.
[3] Albumentations. https://albumentations.ai/.
[4] Coco dataset. https://cocodataset.org/.
[5] Cut repository. https://github.com/taesungp/contrastive- unpaired-translation.
[6] Cyclegan repository. https://github.com/junyanz/pytorch- CycleGAN-and-pix2pix.
[7] K. nichol. painter by numbers, wikiart. https://www.kaggle.com/c/ painter-by-numbers.
[8] Style transfer with transformers repository. https://github.com/ diyiiyiii/StyTR-2.
[9] Ugatit repository. https://github.com/znxlwm/UGATIT-pytorch.
[10] Blender Online Community. Blender - a 3D modelling and rendering package. Blender Foundation, Stichting Blender Foundation, Amsterdam, 2018. URL: http://www.blender.org.
[11] Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei- Fei. Imagenet: A large-scale hierarchical image database. In 2009 IEEE conference on computer vision and pattern recognition, pages 248-255. leee, 2009.
[12] Yingying Deng, Fan Tang, Xingjia Pan, Weiming Dong, Chongyang Ma, and Changsheng Xu. Stytr" 2: Unbiased image style transfer with transformers. arXiv preprint arXiv:2105.14576, 2021.
[13] Mathias Eitz, James Hays, and Marc Alexa. How do humans sketch objects? ACM Trans. Graph. (Proc. SIGGRAPH), 31(4):44:1-44:10, 2012.
[14] Leon A Gatys, Alexander S Ecker, and Matthias Bethge. Image style transfer using convolutional neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 2414-2423, 2016.
[15] Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde- Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. Advances in neural information processing systems, 27, 2014....38


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ