ВВЕДЕНИЕ 8
1 АНАЛИТИЧЕСКИЙ ОБЗОР ЛИТЕРАТУРЫ 10
1.1 Основные понятия нейронных сетей 10
1.2 Методы вычислительной геометрии 11
1.2.1 Построение минимальных выпуклых оболочек 11
1.2.2 Алгоритм Грехэма 11
1.2.3 Теорема о разделяющей оси 12
1.2.4 Обнаружение столкновений 14
1.2.5 Алгоритм построения OBB 15
1.2.6 Основные понятия компьютерной графики 16
1.3 Детектирование частей тела человека 16
1.3.1 DeepPose 17
1.3.2 Forward-or-Backward Information (FBI) 20
1.3.3 SMPL 20
2 СПЕЦИАЛЬНАЯ ЧАСТЬ 24
2.1 Содержательная постановка задачи 24
2.2 Математическая постановка задачи 25
2.3 Адаптация математического аппарата к входным данным 27
2.3.1 Первый этап: выбор базовой модели 27
2.3.2 Второй этап: разбиение входных данных на подзадачи 28
2.3.3 Третий этап: выбор метода построения фигур 29
2.4 Идея алгоритма 32
2.5 Описание алгоритма 34
2.6 Функциональная схема 39
2.7 Тестирование и результаты 40
ЗАКЛЮЧЕНИЕ 47
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Данная работа находится на стыке искусства и науки. Связь между рисунком и математикой заметили еще в эпоху Возрождения. Большой вклад в этой области внес Леонардо да Винчи, а также Дюрер, Альберти, Микеланджело, Ашбе и множество других выдающихся личностей [1].
Так, к примеру, итальянский учёный, математик и художник Альберти считал рисование такой же точной, подвергаемой законам и правилам наукой, как и математика [2]. Он заложил научное обоснование в обучение изобразительному искусству, заключающемуся не в механическом копировании видимого образа, а в форме упражнений, способных развивать мышление учеников. Как точно потом сформулировал эту мысль Микеланджело "Рисуют головой, а не руками". Также большой вклад в теорию рисования внес великий Леонардо да Винчи.
Человеческий мозг устроен так, что его мышление, память и другие формы познания действительности строятся на базовом восприятии образов [3]. Следовательно, большое значение на раннем этапе развития человека играет пространственное воображение.
Помимо перечисленных аспектов, образное мышление является важным навыком для математиков [4]. Для решения сложных задач необходимо уметь оперировать абстрактными понятиями в математическом пространстве, что довольно сложно сделать без представления общей структуры. И, естественно, данное умение должно быть хорошо развито у художников. У многих начинающих рисовальщиков возникает сложность в отражении правильных пропорций и перспективных искажений объектов сложной формы [5]. Особенно часто проблема возникает с изображение человека. Так в конце 19 века выделились две методики в школьном преподавании рисунка, а именно геометральный и натуральный методы [6].
Первый основывается на обобщении сложной формы до простых геометрических фигур: параллелепипедов, сфер, призм, конусов и т.п. Такое представление помогает легче улавливать правильные расстояния, размеры и пропорции. После построения такой конструкции набросок уточняется и детализируется, как бы переходя от простого к сложному.
Второй метод предполагает перенос видимых линий и кривых непосредственно, опираясь только на интуитивное восприятие.
Одним из основоположников геометрального метода является Ашбе [7]. В его школу-студию в Мюнхене съезжались многие ученики из всех стран Европы, в том числе и из России. Также сторонниками данного принципа были Дюрер [8], Чистяков [9], Сапожников [10] и многие другие. Примечательно то, что с 1888 года геометральный метод был введен во всех общеобразовательных школах. В настоящее время он часто встречается в программах художественных школ и различных пособиях по рисованию.
В данной работе автором рассмотрено использование методов машинного обучения для решения задачи восстановления фигуры и позы человека в пространстве по двумерному изображению. Целью данного исследования является разработка алгоритма декомпозиции 3D модели человеческой фигуры на простые геометрические тела, точно повторяющие силуэт позы.
Прототипом трехмерного объекта на выходе является Гестальта (от нем. Gestalt - образ, форма) - небольшая шарнирная кукла с гнущимися конечностями (рисунок 1). В ее создании был заложен геометральный принцип, так как формы в ней максимально упрощены, что дает возможность изучать расположение теней и световых бликов на достаточно простом объекте.
В выпускной квалификационной работе автором была рассмотрена узкоспециализированная задача визуализации человеческой фигуры в виде простых геометрических тел, а именно: параллелепипедов. Данная модель является
вспомогательным инструментом для художников, упрощающим восприятие формы и конструкции изображаемого объекта.
1) Для достижения поставленной цели определены требования к модели, основанные на эмпирическом анализе предметной области.
2) Изучены различные модели, методы и алгоритмы восстановления трехмерных объектов по фотографии. На основе анализов производительности и удовлетворения требуемым критериям, выбрана подходящая модель оценки позы по фотоснимку, а также определены входные данные для дальнейшего развития алгоритма.
3) Сформулировано математическое описание искомой конструкции и разработано решение задачи.
4) Также предусмотрены возможные возмущения на входе в виде выступов на поверхности исходного объекта и выбрана концепция, нечувствительная к таким неровностям. Для этого введена аппроксимация шестиугольными фигурами, выбранная в связи с тем фактом, что природные тела, а именно человеческое тело, имеет скругленные контуры, далекие от идеальных параллелепипедов.
5) Оценено оптимальное количество окаймляющих трехмерных тел для создания модельной фигуры приемлемого восприятия. Данный алгоритм назван «Задачей об окаймляющем параллелепипеде», который может быть использован как в двумерном, так и в трехмерном пространствах.
6) Также введена эвристика поворота множества, требующая на входе приблизительно симметричного расположения точек относительно диагоналей. Угол поворота рассчитывается на основании разницы сумм в разных координатных четвертях и в разных областях относительно границы фигуры шестиугольника.
7) Разработано ПО и проведено тестирование.
8) Основные результаты проделанной работы опубликованы в тезисах студенческой конференции «75-е Дни науки студентов МИСиС» [35].
Алгоритм показал достойные результаты и воспроизвел изображения, очень близкие к материалам из учебных пособий для художников.
1 Золотарева Л. Р. "Художественная картина мира" итальянского Ренессанса в контексте освоения истории искусства // Известия АлтГУ. Филология и искусствоведение. 2013. - С. 182-187.
2 Бакиева О. А. Методика преподавания изобразительного искусства: Учебное пособие. - Тюмень: Издательство Тюменского государственного университета, 2012.
3 Запорожец А.В. Сенсорное воспитание дошкольников / А. В. Запорожец, А.П. Усова. - М.: Академия, 1963.
4 Каплунович И. Я. Формирование структуры пространственного мышления учащихся при решении математических задач: Дисс. ... канд. пед. наук. - М., 1978.
5 Власов В. Г. Обращаемое пространство в изобразительном искусстве и проективном мышлении [Электронный ресурс] // Архитектон: известия вузов. 2019. №1(65). URL: http://old.archvuz.ru/PDF/%23%2065%20PDF/%2365_20_Vlasov.pdf (дата обращения: 25.02.2020).
6 Белякова Л. Г. Теоретические основы обучения пространственному рисованию // Вестник Вятского государственного гуманитарного университета. Педагогика и психология. - 2010.- № 2(3). - С. 50-55.
7 Молева Н. М., Белютин Э. М. Школа Антона Ашбе. К вопросу о путях развития художественной педагогики на рубеже XIX-XX веков. - М.: Искусство, 1958.
8 Черниенко И. Б. Научное мировоззрение художника эпохи Возрождения (на примере Альбрехта Дюрера). // Вестник Пермского университета. История. - 2004. - № 5.
- С. 51-54.
9 Павлова М. А. Метод «поверочного рисования» П. П. Чистякова в современном художественном образовании // Евразийский Союз Ученых (ЕСУ). Педагогические науки.
- 2014. - № 9. - С. 46.
10 Сапожников А. П. Полный курс рисования: Учеб. пособие. Под редакцией Ларионова В. Н. - М.: АЛЕВ-В, 2003.
11 Мак-Каллок У. С., Питтс В. Логическое исчисление идей, относящихся к нервной активности // Автоматы / Под ред. К. Э. Шеннона и Дж. Маккарти. - М.: Изд-во иностр. лит., 1956.
12 Зенин А. В. Исследование возможностей использования нейронных сетей. - Казань: Молодой ученый, 2017.
13 Гудфеллоу Я., Глубокое обучение.: Учеб. пособие. // Гудфеллоу Я., Бенджио И., Курвилль А. - М. Изд-во ДМК-Пресс, 2018.
14 Форсайт Д А., Понс Ж. Компьютерное зрение. Современный подход. - М.: Вильямс, 2004.
15 Васильков Д М. Геометрическое моделирование и компьютерная графика вычислительные и алгоритмические основы: курс лекций. - Минск: БГУ, 2011.
16 Chan T. M. Output-Sensitive Construction of Convex Hulls: Ph.D. thesis / Department of Computer Science. - University of British Columbia, 1995.
17 Jarvis A. On the identification of the convex hull of a finite set of points in the plane. // In-formation Processing Letters. - 1973.
18 Andrew A. M. Another efficient algorithm for convex hulls in two dimensions // Information Processing Letters. - 1979.
19 Graham R. L. An efficient algorithm for determining the convex hull of a finite planar set // Information Processing Letters. - 1972.
20 Huynh J. Separating Axis Theorem for Oriented Bounding Boxes [Electronic resource]
// jkh.me: 2015.
URL: jkh.me/files/tutorials/Separating%20Axis%20Theorem%20for%200riente
d%20Bounding%20Boxes.pdf (дата обращения: 14.10.2019).
21 Ericson С. Real-Time Collision Detection // Morgan Kaufmann. - 2004.
22 Файзрахманов Р. А. Алгоритмы обнаружения коллизий плоских двумерных объектов произвольной формы 2015 // Файзрахманов Р. А., Мурзакаев Р. Т., Швецов М. Д., Мехоношин А. С., Хабибулин А. Ф. [Электронный ресурс]. - Электронный научный журнал «Инженерный вестник Дона», 2015
23 Лесков А. Г., Селиверстова Е. В. Расчет областей пересечения поверхностей захватных устройств манипуляторов и деформируемых объектов при планировании и моделировании захвата. // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2016.
24 Роджерс Д., Адамс Дж. Математические основы машинной графики. - М.: Мир, 2001.
25 Chowdhary C. L. Appearance-based 3-D Object Recognition and Pose Estimation: Using PCA, ICA and SVD-PCA Techniques. - LAP LAMBERT Academic Publishing. - 2011.
26 Alexander Toshev, Christian Szegedy, DeepPose: Human Pose Estimation via Deep Neural Networks. — CA, US. - 2014.
27 Bishop C. M. Pattern Recognition and Machine Learning // Journal of electronic imaging. - 2006.
28 Коэльо Л., Ричарт В. Построение систем машинного обучения на языке Python - М.: ДМК Пресс. - 2016.
29 Bogo F. Keep it SMPL: automatic estimation of 3d human pose and shape from a single image. // Bogo F., Kanazawa A., Lassner C., Gehler P. V., Romero J., and Black M. J. - In: ECCV. -2016.
30 Pishchulin, L DeepCut: Joint subset partition and labeling for multi person poseestimation. // Pishchulin, L., Insafutdinov, E., Tang, S., Andres, B., Andriluka, M., Gehler, P.,Schiele, B. - In: IEEE Conference on Computer Vision and Pattern Recognition, CVPR. - 2016.
31 Loper M. A skinned multi-person linear model. // Loper M., Mahmood N., Romero J., Pons-Moll G., and Black M. J. - ACM Trans. Graphics (Proc. SIGGRAPH Asia). -2015.
32 Anguelov D. SCAPE: shape completion and animation of people. // Anguelov D., Srinivasan P., Koller D., Thrun S., Rodgers J., and Davis J. - ACM transactions on graphics (TOG). - 2005
33 Botsch M. Geometric Modeling Based on Triangle Meshes. // Botsch M., Pauly M., Kobbelt L., Pierre Alliez P., Levy B. - ACM (SIGGRAPH). - 2006.
34 Букатов А. А., Гридчина Е. Е., Заставной Д. А. Методы скелетной анимации для
трансформации полигональных поверхностей трёхмерных моделей. // Электронный научный журнал «Инженерный вестник Дона». 2012. URL:
http://www.ivdon.ru/uploads/article/pdf/2012_3_11.pdf_897.pdf (дата обращения: 02.04.2019).
35 Цой Д. А. Алгоритм декомпозиции человеческой позы на элементы простой
формы по фотоснимку // 75-е дни науки студентов НИТУ «МИСиС» международные, межвузовские и институтские научно-технические конференции Книга 2. - М.:
Издательский Дом МИСиС, 2020. - С. 827.