Динамический подход к описанию различных систем известен со времен Ньютона. Он является основой анализа большинства классических явлений в физике и других естественных науках: сначала строится соответствующая математическая модель в виде динамических уравнений, а далее тем или иным способом изучаются их решения, которые можно сопоставить с данными экспериментов. Развитие этих идей, а также представление о том, что состояние модели в любой момент времени однозначно определяется начальными условиями, привели исследователей к понятию динамической системы.
Хотя динамическая система и является некоторой математической абстракцией, данная парадигма стала продуктивным инструментом при описании многих реальных явлений. Наибольший успех в этом направлении был получен академиком А. А. Андроновым в 30-е годы ХХ века, которым была создана строгая теория автоколебаний двумерных систем [1, 3]. Следующей целью исследователей стало изучению возможности распространения этой теория на многомерные системы. Однако, несмотря на значительные открытия в данной области, до 60-х годов ХХ столетия не было понятно, насколько сложными могут быть движения в таких системах.
B 1963 г. американский метеоролог Э. Лоренц экспериментально показал принципиальное существование предельного режима (аттрактора) нового типа в гладких многомерных динамических системах [32]. Полученный Лоренцем аттрактор внешне представляет собой сложную геометрическую форму. С точки зрения численного моделирования, малая неточность в начальных данных в таких аттракторах приводит к разбеганию траекторий во времени. Такие предельные режимы называются хаотическими. Именно из-за чувствительности к выбору начальных данных предсказание хаотических траекторий существенно затруднено.
Хаотическое поведение наблюдается в самых разных системах — электрические схемы, лазеры, химические реакции, динамика жидкостей и магнитно-механических устройств, метеорология, движение спутников солнечной системы, динамика потенциалов в нейронах и молекулярных колебаниях, и во многих других. В настоящее время теория хаоса активно применяется, например, в медицине при изучении эпилепсии для предсказаний приступов, учитывая первоначальное состояние организма.
Динамический хаос встречается во множестве прикладных систем — от моделирования движения тектонических плит до изучения экономических процессов. Поэтому задача прогнозирования хаоса является крайне важной и актуальной. С другой стороны, в связи с чувствительностью к выбору начальных данных, долгосрочное прогнозирование в системах с хаотическим поведением становится сложной и нетривиальной задачей. Поэтому возможности традиционных методов исследования динамических систем, таких как, например, математическое моделирование, оказались сильно ограничены в исследовании хаоса.
Активное развитие машинного обучение с конца XX века дало толчок исследованию хаотической динамики и позволило выработать новый подход к решению этой задачи. Методы машинного обучения хорошо подходят для предсказания хаотической динамики, так как это универсальные методы аппроксимации функций, которые могут отображать любую нелинейную функцию без априорных предположений о данных. С помощью статистических методов алгоритмы машинного обучения позволяют классифицировать данные, строить прогнозы и выделять важные особенности в работе различных систем.
При этом критической проблемой в применении методов машинного обучения является переобучение. Это связано с тем, что модель машинного обучения улавливает не только полезную информацию, содержащуюся во входных данных, но и нежелательный шум. Это приводит к низкому уровню обобщающей способности. Данные вне выборки — это те данные, которые не используются при обучении модели. И эффективность методов с точки зрения обобщения для данных вне выборки всегда ниже, чем у обучающих данных. Таким образом, для достижения высокой точности предсказания в каждой конкретной задаче важно определить оптимальные параметры модели машинного обучения. Для этой цели используются различные алгоритмы оптимизации параметров модели.
От эффективности оптимизации параметров модели машинного обучения зависит практическая применимость метода машинного обучения. Существуют различные методы оптимизации параметров. Мы рассмотрели такие популярные алгоритмы оптимизации как алгоритм кукушки (CS) [11], алгоритм серых волков (GWO) [12], метод роя частиц (PSO) [4, 5], методы Пауэлла [2] и Джая-Пауэлла [18], алгоритм хаотической оптимизации (COA) [17], а также была разработана собственная модификацию алгоритма Пауэлла.
В данной работе мы проанализировали эффективность различных комбинаций алгоритмов машинного обучения и методов оптимизации параметров для предсказания хаотической динамики системы Лоренца и хаоса в модели лазеров с насыщающимся поглотителем. Также был разработан программный пакет на языке Python, позволяющий комбинировать методы машинного обучения SVR и XGBoost с описанными и предложенным алгоритмами оптимизации параметров.
Цели и задачи работы
Первой целью данной работы является исследование и развитие существующих алгоритмов машинного обучения и методов оптимизации параметров.
Второй целью является создание программного пакета на языке Python для комбинирования изученных и разработанных методов и применения их к различным системам.
Третьей целью является применение полученных методов для предсказания хаоса в системе Лоренца и в модели лазеров с насыщающимся поглотителем. Исходя из результатов экспериментов проанализируем эффективность, точность и обобщающую способность методов.
Для достижения поставленной цели необходимо было решить следующие задачи:
1. Изучить методы машинного обучения: регрессия опорных векторов и экстремальный градиентный бустинг
2. Изучить и реализовать некоторые известные алгоритмы оптимизации параметров
3. Разработать и реализовать модификацию алгоритма Пауэлла
4. Применить комбинации изученных методов машинного обучения и алгоритмов оптимизации параметров к системе Лоренца
5. Проанализировать эффективности и точность моделей машинного обучения для системы Лоренца
6. Применить полученные комбинации методов для предсказания хаотической динамики в модели лазеров с насыщающимся поглотителем
7. Проанализировать обобщающую способность полученных моделей машинного обучения в сравнении с результатами экспериментов для системы Лоренца
В представленной работе были исследованы методы машинного обучения — регрессия опорных векторов и экстремальный градиентный бустинг, и алгоритмы оптимизации их параметров для предсказания хаотической динамики — алгоритм кукушки, алгоритм серых волков, метод роя частиц, алгоритм хаотической оптимизации, алгоритм Пауэлла и алгоритм Джая-Пауэлла. Основные результаты работы заключаются в следующем:
1. Предложена модификация алгоритма Пауэлла с помощью алгоритма серых волков. По результатам экспериментов данная модификация оказалась самой эффективной и обобщаемой из всех рассматриваемых алгоритмов оптимизации.
2. Реализован программный пакет для применения комбинаций изученных и разработанных методов машинного обучения и алгоритмов оптимизации их параметров.
В работе также показано, что, несмотря на универсальность и производительность методов машинного обучения для предсказания хаотической динамики, огромную роль при построении модели машинного обучения играет выбор алгоритма оптимизации параметров. Полученные в работе результаты позволяют реализовать эффективную модель машинного обучения в задачах предсказания хаотической динамики. В рамках дальнейшего исследования планируется создание новых модификаций алгоритмов оптимизации параметров.
1. Андронов А.А., Хайкин С.Э. Теория колебаний. М.-Л.: ОНТИ, 1937.
2. M. J. D. Powell. An efficient method for finding the minimum of a function of several variables without calculating derivatives (англ.) // The Computer Journal. — 1964. — 1 January (vol. 7). — P. 155-162.
3. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. 2-е изд. М.: Физматлит, 1959.
4. J. Kennedy, R. Eberhart, Particle Swarm Optimization. Proceedings of IEEE International Conference on Neural Networks IV: 1942-1948.
5. Y. Shi, R. Eberhart, A modified particle swarm optimizer. Proceedings of IEEE International Conference on Evolutionary Computation: 69-73.
6. Kennedy, J.; Eberhart, R.C., Swarm Intelligence — Morgan Kaufmann, 2001.
7. Hu X., Eberhart R. Solving Constrained Nonlinear Optimization Problems with Particle Swarm Optimization, 6th World Multiconference Syst. Cybern. Informatics. Orlando, Florida, USA, 2002. P. 203-206.
8. Poli, R. Analysis of the publications on the applications of particle swarm optimisation, Journal of Artificial Evolution and Applications — 2008.
9. C. Reynolds, Flocks, Herds, and Schools: A Distributed Behavioral Model Computer Graphics, 21(4), стр. 25-34, 1987.
10. Hu X., Eberhart R. Solving Constrained Nonlinear Optimization Problems with Particle Swarm Optimization // 6th World Multiconference Syst. Cybern. Informatics. Orlando, Florida, USA, 2002. P. 203-206.
11. X.-S. Yang; S. Deb (December 2009). Cuckoo search via Levy flights. World Congress on Nature & Biologically Inspired Computing (NaBIC 2009). IEEE Publications. pp. 210-214.
12. Mirjalili S., Mirjalili S. M., Lewis A., Grey wolf optimizer, Advances in Engineering Software. - 2014. - vol. 69, pp. 46-61. 2.
13. Long W., Cai S., Jiao J., Tang M., An efficient and robust grey wolf optimizer algorithm for large-scale numerical optimization, Soft Computing. - 2019. - vol. 3.
14. Д.В. Ежов, О. В. Коваленко, Параллельный алгоритм оптимизации непрерывных функций большой размерности на основе гибридизации алгоритма оптимизации «се-рых волков», Научный сервис в сети Интернет: труды XXII Всероссийской научной конференции (21-25 сентября 2020 г., онлайн), стр. 255-267.
15. В.А. Частикова, С.А. Жерлицын, Исследование алгоритма серых волков, Научные труды КубГТУ, № 16, 2016.
16. Cortes C, Vapnik V N, "Support Vector Networks Machine Learning, Vol.20, no.3, pp273-295, September 1995.
17. Yuxia Hu, Hongtao Zhang, "Chaos Optimization Method of SVM Parameters Selection for Chaotic Time Series Forecasting Physics Procedia, 2012, vol.25, pp. 588-594
18. L. Zhuang et al., "Parameter Estimation of Lorenz Chaotic System Based on a Hybrid Jaya-Powell Algorithm,"in IEEE Access, vol. 8, pp. 20514-20522, 2020
19. F. Takens, in: D. Rand, L.-S. Young (Eds.), Dynamical Systems and Turbulence, Warwick, 1980, Springer, Berlin, 1981, pp366.
20. Arcomano, T., Szunyogh, I., Pathak, J., Wikner, A., Hunt, B. R., & Ott, E. (2020). A machine learning-based global atmospheric forecast model. Geophysical Research Letters, 47.
21. T. Chen, C. Guestrin, Xgboost: A scalable tree boosting system, in: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM, 2016, pp. 785-794.
22. S.-H. Wang, H.-T. Li, E.-J. Chang, A.-Y. A. Wu, Entropy-assisted emotion recognition of valence and arousal using xgboost classifier, in: IFIP International Conference on Artificial Intelligence Applications and Innovations, Springer, 2018, pp. 249-260.
23. A.B. Parsa, A. Movahedi, H. Taghipour, S. Derrible, A.K. Mohammadian, Toward safer highways, application of xgboost and shap for real-time accident detection and feature analysis, Accident Analysis & Prevention 136 (2020) 105405.
24. Q. Huang, W. Xie, “The prediction of short-term exchange rate based on the phase space reconstruction and kalman”, Computer Applications and Software, vol.25, no.8, pp79-80, August 2008.
25. Z. Zhang, Y. Sun, “A new approach of STLF based on combination of phase space reconstruction theory and optimal recursive neural networks,” Electric Power, vol.37, no. 1, pp19-23, January 2004.
26. Z. Shan, C. Lin, “Chaos Prediction of Wave Hydrodynamic Pressure Signals Based on Local Support Vectors Machine,” Journal of System Simulation, 2008, vol.20, no.23,
pp6470-6472, December 2008.
27. G. Wu, P. Zhou, “Prediction Based on Phrase Construction and Its Application in Weather Forecast,” Chinese journal of nature, vol. 21, no. 2, pp107-110, April 999.
28. Cortes C, Vapnik V N, “Support Vector Networks,” Machine Learning, Vol.20, no.3, pp273-295, September 1995.
29. C. Hsu, C. Chang , C. Lin, “A practical guide to support vector classification”, http://www.csie.ntu.edu.twcjlin/papem/guide/guide.pdf, 2003
30. X. Yuan, Y. Wang, “Parameter selection of support vector machine for functionapproximation based on chaos optimization”, Journal of Systems Engineering and Electronics, Vol.19, no.1, pp191-97, January 2008.
31. Q. Liu, P. Que, C. Fei, S. Song, “Model selection for SVM using mutative scale chaos optimization algorithm”, Journal of Shanghai University, Vol. 10, no. 6,pp531-534,June 2006.
32. E. N. Lorenz, "Deterministic nonperiodic flow J. Atmos. Sci., vol. 20, no. 2, pp. 130-141, 1963.
33. Matsumoto T., Chua L., Komuro M. The Double Scroll, IEEE "Transactions on Circuits and Systems". 1985. V. 32 (8). P. 797-818.
34. B. Peng, B. Liu, F.-Y. Zhang, and L. Wang, "Differential evolution algorithm-based parameter estimation for chaotic systems Chaos, Solitons Fractals, vol. 39, no. 5, pp. 2110-2118, Mar. 2009.
35. Y. Tang and X. Guan, "Parameter estimation for time-delay chaotic system by particle swarm optimization,” Chaos, Solitons Fractals, vol. 40, no. 3, pp. 1391-1398, May 2009.
36. А. Н. Ораевский, Квантовая электроника, 1999, том 26, номер 3, 214-216
37. Ривлин Л.А. ЖЭТФ, 47, 624 (1965).
38. Воропаев Н.Д., Ораевский А.Н. Изв. вузов. Сер. Радиофизика, 8, 409 (1965).
39. Ораевский А.Н., Бенди Д.К. Письма в ЖЭТФ, 59, 319 (1994).
40. Ораевский А.Н., Бенди Д.К. Квантовая электроника, 24, 331 (1994).