Тип работы:
Предмет:
Язык работы:


Регрессия на основе гауссовских процессов для данных на неизвестном многообразии

Работа №127170

Тип работы

Бакалаврская работа

Предмет

математика

Объем работы20
Год сдачи2022
Стоимость4230 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
62
Не подходит работа?

Узнай цену на написание


Введение 2
2 Предварительные сведения 2
2.1 Гауссовские процессы в машинном обучении 2
2.2 Гауссовские процессы на Евклидовом пространстве и римановых многообразиях 3
2.2.1 Ядра Матерна 4
2.2.2 Гауссовские процессы на компактных римановых многообразиях . 4
2.3 Гауссовские процессы на графах 5
2.3.1 Гауссовские процессы Матерна на графах 5
2.3.2 О сходимости ядер Матерна на графе к ядрам Матерна на римановых многообразиях 6
3 Предлагаемый метод и гипотеза о многообразии 8
4 Эксперименты 8
4.1 Регрессионные задачи 9
4.2 Задачи классификации 14
4.2.1 Кривые на плоскости 15
4.2.2 MNIST 17
5 Заключение 18
6 Благодарности 18
Список литературы 19


Гауссовские процессы занимают важное место в машинном обучении и применяются для решения большого количества прикладных задач. Одной из ключевых особенностей моделей, основанных на гауссовских процессах, является их способность оценивать неопределенность в предсказаниях, а также учитывать априорную информацию о приближаемой функции.
В приложениях чаще всего рассматриваются гауссовские процессы на евклидовых пространствах , однако применение гауссовских процессов не ограничивается только евклидовым случаем. Модели, использующие гауссовские процессы, могут быть определены также на римановых многообразиях и графах. Описанию таких моделей посвящены разделы2.2.2 и2.3.1.
В данной работе предлагается подход для решения регрессионных задач и задач классификации с помощью моделей, использующих гауссовские процессы на графах, в рамках гипотезы, что исходные данные высокой размерности лежат на каком-то неизвестном многообразии меньшей размерности. Рассматривается несколько способов построения графа, моделирующего неизвестное многообразие, а также проводится сравнительный анализ полученных моделей с некоторыми известными моделями на различных наборах данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В данной работе предложен подход для построения моделей для данных на неизвестном многообразии, использующих гауссовские процессы. Восстановление неизвестного многообразия осуществлялось с помощью построения графа по точкам неизвестного многообразия, после чего применялась модель, использующая гауссовские процессы на графах. В ряде проведенных экспериментов предлагаемый подход показал качество выше, чем классические модели, а также модели, использующие гауссовские процессы, но не учитывающие структуры неизвестного многообразия. Важным практическим результатом является более стабильное поведение предложенных моделей на малом числе тренировочных данных. Однако, стоит отметить, что эффективная реализация предложенного подхода требует дополнительной работы, поскольку текущая реализация не оптимальна по времени: так, например, можно использовать разреженность матрицы дискретного оператора Лапласа для более эффективных вычислений, используя алгоритм Ланцоша, кроме этого дополнительных усилий требует эффективная реализация добавления новых точек данных, которые не были добавлены в граф на этапе его построения.


[1] V. Borovitskiy, I. Azangulov, A. Terenin, P. Mostowsky, M.P. Deisenroth, N. Durrande (2021),“Matern Gaussian Processes on Graphs”, Artificial Intelligence and Statistics, 2021.
[2] V. Borovitskiy, A. Terenin, P. Mostowsky, M.P. Deisenroth (2020),“Matern Gaussianprocesses on Riemannian manifoldss”, Advances in Neural Information Processing Systems.
[3] P. Whittle (1963). Stochastic processes in several dimensions. Bulletin of the International Statistical Institute.
[4] C. E. Rasmussen and C. K. Williams (2006). Gaussian Processes for Machine Learning. MIT Press.
[5] S. Gradshteyn and I. M. Ryzhik (2014). Table of Integrals, Series, and Products. Academic Press, 7th edition.
[6] Y. Canzani (2013). Analysis on Manifolds via the Laplacian. Harvard University.
[7] M.L. Stein (1999). Interpolation of spatial data: Some theory for kriging.
[8] David B Dunson, Hau-Tieng Wu, Nan Wu (2021). Graph based Gaussian processes on restricted domains. Journal of the Royal Statistical Society Series B (Statistical Methodology)
[9] A. Feragen, F. Lauze, S. Hauberg (2015). Geodesic Exponential Kernels: When Curvature and Linearity Conflict. IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
[10] I. S. Gradshteyn and I. M. Ryzhik (2014). Table of Integrals, Series, and Products. Academic Press, 7th edition.
[11] J. Hensman, N. Fusi, and N. D. Lawrence (2013). Gaussian processes for big data. In Uncertainty in Artificial Intelligence.
[12] Rastrigin, L.A. (1963). “The convergence of the random search method in the extremal control of a many parameter system”. Automation and Remote Control.
[13] M. Belkin; P. Niyogi (2008). Towards a theoretical foundation for Laplacian-based manifold methods.
[14] M. Belkin and P. Niyogi (2007). Convergence of Laplacian eigenmaps. Advances in Neural Information Processing Systems (NIPS).


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ