Динамический подход к описанию различных систем известен со времен Ньютона. Он является основой анализа большинства классических явлений в физике и других естественных науках: сначала строится соответствующая математическая модель в виде динамических уравнений, а далее тем или иным способом изучаются их решения, которые можно сопоставить с данными экспериментов. Развитие этих идей, а также представление о том, что состояние модели в любой момент времени однозначно определяется начальными условиями, привели исследователей к понятию динамической системы.
Хотя динамическая система и является некоторой математической абстракцией, данная парадигма стала продуктивным инструментом при описании многих реальных явлений. Наибольший успех в этом направлении был получен академиком А. А. Андроновым в 30-е годы ХХ века, которым была создана строгая теория автоколебаний двумерных систем [1, 3]. Следующей целью исследователей стало изучению возможности распространения этой теория на многомерные системы. Однако, несмотря на значительные открытия в данной области, до 60-х годов ХХ столетия не было понятно, насколько сложными могут быть движения в таких системах.
B 1963 г. американский метеоролог Э. Лоренц экспериментально показал принципиальное существование предельного режима (аттрактора) нового типа в гладких многомерных динамических системах [32]. Полученный Лоренцем аттрактор внешне представляет собой сложную геометрическую форму. С точки зрения численного моделирования, малая неточность в начальных данных в таких аттракторах приводит к разбеганию траекторий во времени. Такие предельные режимы называются хаотическими. Именно из-за чувствительности к выбору начальных данных предсказание хаотических траекторий существенно затруднено.
Хаотическое поведение наблюдается в самых разных системах — электрические схемы, лазеры, химические реакции, динамика жидкостей и магнитно-механических устройств, метеорология, движение спутников солнечной системы, динамика потенциалов в нейронах и молекулярных колебаниях, и во многих других. В настоящее время теория хаоса активно применяется, например, в медицине при изучении эпилепсии для предсказаний приступов, учитывая первоначальное состояние организма.
Динамический хаос встречается во множестве прикладных систем — от моделирования движения тектонических плит до изучения экономических процессов. Поэтому задача прогнозирования хаоса является крайне важной и актуальной. С другой стороны, в связи с чувствительностью к выбору начальных данных, долгосрочное прогнозирование в системах с хаотическим поведением становится сложной и нетривиальной задачей. Поэтому возможности традиционных методов исследования динамических систем, таких как, например, математическое моделирование, оказались сильно ограничены в исследовании хаоса.
Активное развитие машинного обучение с конца XX века дало толчок исследованию хаотической динамики и позволило выработать новый подход к решению этой задачи. Методы машинного обучения хорошо подходят для предсказания хаотической динамики, так как это универсальные методы аппроксимации функций, которые могут отображать любую нелинейную функцию без априорных предположений о данных. С помощью статистических методов алгоритмы машинного обучения позволяют классифицировать данные, строить прогнозы и выделять важные особенности в работе различных систем.
При этом критической проблемой в применении методов машинного обучения является переобучение. Это связано с тем, что модель машинного обучения улавливает не только полезную информацию, содержащуюся во входных данных, но и нежелательный шум. Это приводит к низкому уровню обобщающей способности. Данные вне выборки — это те данные, которые не используются при обучении модели. И эффективность методов с точки зрения обобщения для данных вне выборки всегда ниже, чем у обучающих данных. Таким образом, для достижения высокой точности предсказания в каждой конкретной задаче важно определить оптимальные параметры модели машинного обучения. Для этой цели используются различные алгоритмы оптимизации параметров модели.
От эффективности оптимизации параметров модели машинного обучения зависит практическая применимость метода машинного обучения. Существуют различные методы оптимизации параметров. Мы рассмотрели такие популярные алгоритмы оптимизации как алгоритм кукушки (CS) [11], алгоритм серых волков (GWO) [12], метод роя частиц (PSO) [4, 5], методы Пауэлла [2] и Джая-Пауэлла [18], алгоритм хаотической оптимизации (COA) [17], а также была разработана собственная модификацию алгоритма Пауэлла.
В данной работе мы проанализировали эффективность различных комбинаций алгоритмов машинного обучения и методов оптимизации параметров для предсказания хаотической динамики системы Лоренца и хаоса в модели лазеров с насыщающимся поглотителем. Также был разработан программный пакет на языке Python, позволяющий комбинировать методы машинного обучения SVR и XGBoost с описанными и предложенным алгоритмами оптимизации параметров.
В представленной работе были исследованы методы машинного обучения — регрессия опорных векторов и экстремальный градиентный бустинг, и алгоритмы оптимизации их параметров для предсказания хаотической динамики — алгоритм кукушки, алгоритм серых волков, метод роя частиц, алгоритм хаотической оптимизации, алгоритм Пауэлла и алгоритм Джая-Пауэлла. Основные результаты работы заключаются в следующем:
1. Предложена модификация алгоритма Пауэлла с помощью алгоритма серых волков. По результатам экспериментов данная модификация оказалась самой эффективной и обобщаемой из всех рассматриваемых алгоритмов оптимизации.
2. Реализован программный пакет для применения комбинаций изученных и разработанных методов машинного обучения и алгоритмов оптимизации их параметров.
В работе также показано, что, несмотря на универсальность и производительность методов машинного обучения для предсказания хаотической динамики, огромную роль при построении модели машинного обучения играет выбор алгоритма оптимизации параметров. Полученные в работе результаты позволяют реализовать эффективную модель машинного обучения в задачах предсказания хаотической динамики. В рамках дальнейшего исследования планируется создание новых модификаций алгоритмов оптимизации параметров.
1. Андронов А.А., Хайкин С.Э. Теория колебаний. М.-Л.: ОНТИ, 1937.
2. M. J. D. Powell. An efficient method for finding the minimum of a function of several variables without calculating derivatives (англ.) // The Computer Journal. — 1964. — 1 January (vol. 7). — P. 155-162.
3. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. 2-е изд. М.: Физматлит, 1959.
4. J. Kennedy, R. Eberhart, Particle Swarm Optimization. Proceedings of IEEE International Conference on Neural Networks IV: 1942-1948.
5. Y. Shi, R. Eberhart, A modified particle swarm optimizer. Proceedings of IEEE International Conference on Evolutionary Computation: 69-73.
6. Kennedy, J.; Eberhart, R.C., Swarm Intelligence — Morgan Kaufmann, 2001.
7. Hu X., Eberhart R. Solving Constrained Nonlinear Optimization Problems with Particle Swarm Optimization, 6th World Multiconference Syst. Cybern. Informatics. Orlando, Florida, USA, 2002. P. 203-206.
8. Poli, R. Analysis of the publications on the applications of particle swarm optimisation, Journal of Artificial Evolution and Applications — 2008.
9. C. Reynolds, Flocks, Herds, and Schools: A Distributed Behavioral Model Computer Graphics, 21(4), стр. 25-34, 1987.
10. Hu X., Eberhart R. Solving Constrained Nonlinear Optimization Problems with Particle Swarm Optimization // 6th World Multiconference Syst. Cybern. Informatics. Orlando, Florida, USA, 2002. P. 203-206.
11. X.-S. Yang; S. Deb (December 2009). Cuckoo search via Levy flights. World Congress on Nature & Biologically Inspired Computing (NaBIC 2009). IEEE Publications. pp. 210-214.
12. Mirjalili S., Mirjalili S. M., Lewis A., Grey wolf optimizer, Advances in Engineering Software. - 2014. - vol. 69, pp. 46-61. 2.
13. Long W., Cai S., Jiao J., Tang M., An efficient and robust grey wolf optimizer algorithm for large-scale numerical optimization, Soft Computing. - 2019. - vol. 3.
14. Д.В. Ежов, О. В. Коваленко, Параллельный алгоритм оптимизации непрерывных функций большой размерности на основе гибридизации алгоритма оптимизации «серых волков», Научный сервис в сети Интернет: труды XXII Всероссийской научной конференции (21-25 сентября 2020 г., онлайн), стр. 255-267.
15. В.А. Частикова, С.А. Жерлицын, Исследование алгоритма серых волков, Научные труды КубГТУ, № 16, 2016....40