Тема: Методы градиентного спуска на основе метода Рунге - Кутты с разложением Лагранжа - Бюрмана
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Обзор литературы 5
1.1. Явные методы Рунге - Кутты 6
1.2. Разложение Лагранжа - Бюрмана 8
1.2.1 Формула разложения Лагранжа - Бюрмана 8
1.2.2 Явные методы Рунге - Кутты с разложением Лагранжа
- Бюрмана 9
1.2.3 Метод второго порядка точности 10
1.3. Применение методов Рунге - Кутты к решению оптимиза-ционных задач 12
1.4. Выводы 13
Глава 2. Построение и анализ градиентных методов 14
2.1. Случай квадратичной функции 14
2.1.1 Одношаговый метод 15
2.1.2 Двухшаговый метод 21
2.2. Случай возмущенной квадратичной функции 28
2.3. Результаты 30
Глава 3. Решение задач 31
3.1. Решение двумерной задачи для уравнения Пуассона .... 32
3.2. Решение трехмерной задачи для уравнения Пуассона . ... 34
3.3. Решение задачи минимизации интегрального функционала 36
3.4. Решение задачи для нелинейного интегро-дифференциального
уравнения 38
3.5. Решение задачи логистической регрессии 40
3.6. Результаты 42
Заключение 43
Список литературы 44
📖 Введение
машинного обучения [14], теории управления [23] и линейной алгебры [15,
28]. Их использование позволяет находить наилучшие решения в условиях
ограниченных времени и ресурсов. На практике большинство задач оптимизации можно решить только численно. В связи с этим разработка и исследование численных методов оптимизации являются актуальными задачами в
вычислительной математике.
Наиболее часто при решении оптимизационных задач используются
градиентные методы, которые основаны на движении вдоль антиградиента
— направления наискорейшего убывания функции. Примерами таких методов являются градиентный спуск, метод Нестерова [26] и метод тяжелого шарика [8]. Также в задачах оптимизации широко применяются численные методы второго порядка, среди которых наиболее распространен метод Ньютона. Стоит отметить, что методы первого порядка не используют матрицу
Гессе, вычисление которой может потребовать значительных вычислительных ресурсов для решения задач большой размерности.
В последние годы идет активное исследование методов оптимизации,
построенных на аналогии между градиентным спуском и задачей Коши для
обыкновенных дифференциальных уравнений [12, 17, 18, 19, 25, 27, 30, 31,
33, 34, 35]. Наиболее популярными численными методами решения задачи
Коши являются методы Рунге – Кутты (РК), которые основаны на разложении
решения в ряд Тейлора. Однако, решение можно разложить в ряд по степеням
некоторой функции, зависящей от шага метода. Эту задачу можно эффективно решить с помощью разложения Лагранжа – Бюрмана (ЛБ) [5]. Использование нестандартных разложений позволяет получить увеличенную область
устойчивости метода и проводить вычисления с бо́ льшим шагом.
В данной работе построены новые численные методы оптимизации выпуклых функций с использованием методов РК на основе разложения ЛБ,
проведено теоретическое исследование методов, а также приведены результаты их применения к задачам из различных областей и проведено сравнение
3с другими известными методами.
Целью работы является разработка и анализ новых численных методов
минимизации выпуклых функций с использованием методов РК на основе
разложения ЛБ. Для достижения поставленной цели необходимо решить следующие задачи:
- построение новых градиентных методов,
- получение условий сходимости,
- программная реализация и решение тестовых задач,
- сравнение построенных методов с другими известными методами оптимизации.
Глава 1 посвящена обзору литературы. Рассмотрена аналогия между
градиентным спуском и задачей Коши, а также осуществлен обзор статей,
связанных с тематикой работы. Представлено семейство методов РК и методы, основанные на разложении ЛБ. Сформулированы цель и задачи работы.
В Главе 2 приводится построение и анализ новых градиентных методов минимизации, сформулированы и доказаны теоремы о сходимости для
случая квадратичной и возмущенной квадратичной функции.
В Главе 3 проводится сравнение построенных методов с другими известными методами оптимизации. Рассматриваются задачи из различных областей: краевые задачи для уравнения Пуассона в двумерном и трехмерном
случаях; задача минимизации интегрального функционала; краевая задача
для нелинейного интегро-дифференциального уравнения и задача логистической регрессии с регуляризацией. По результатам расчетов показано, что
построенные методы могут сходиться быстрее, чем широко используемые
методы минимизации выпуклых функций.
✅ Заключение
В ходе работы были получены следующие результаты:
1. Построены методы спуска на основе двухэтапного метода Рунге - Кутты с разложением Лагранжа - Бюрмана.
2. Получены условия сходимости для случая квадратичной и возмущенной квадратичной функции.
3. Проведены вычислительные эксперименты по сравнению предложенных методов с известными методами минимизации при решении двумерных и трехмерных задач для уравнений эллиптического типа, задачи вариационного исчисления, задачи для нелинейного интегро-дифференциального уравнения и задачи логистической регрессии.
Из полученных результатов можно сделать следующие выводы:
1. В выражении для шага (2.14) за счет выбора параметра у можно влиять на скорость сходимости и шаг численного метода. За счет этого, при про-ведении практических расчетов можно производить вычисления с высокой эффективностью, экономя вычислительные ресурсы.
2. При решении задач из разных областей показано, что построенные методы могут сходиться быстрее, чем известные методы минимизации выпуклых функций.
Перспективной для дальнейшего исследования можно назвать задачу распространения методов на основе метода РК с разложением ЛБ на случай произвольной гладкой выпуклой функции. В частности, можно рассмотреть по строение квазиньютоновских методов и их применение к задачам машинного обучения, обработки изображений и теории управления.



