Исследование химической кинетики имеет важное место в развитии многих естественных наук, аэродинамики космических аппаратов и физики атмосферы. Существует различные подходы для описания неравновесных течений, такие как однотемпературная (1T), многотемпературная (MT) и поуровневая (STS) модели. Для неравновесных течений поуровневый подход является наиболее подробным и обеспечивает наилучшее совпадение с экспериментальными данными, но во многих случаях такая модель является чрезмерно затратной с точки зрения вычислений.
Решить проблему вычислительных затрат возможно за счет алгоритмов машинного обучения, которые успешно используются обычно для классификации и регрессии, в особенности для задач с входными данными, представленных в виде многомерного массива. Согласно принятой поуровневой модели, наиболее затратные в вычислительном отношении модули связаны с вычислением транспортных свойств и исходных условий, из-за различных кинетических процессов, поэтому ее исследование является актуальным.
В настоящей работе будут использоваться алгоритмы машинного обучения для нахождения оптимального количества входных признаков для целевого признака и, при необходимости, для уменьшения их количества. Эта задача имеет первостепенное значение, поскольку она позволяет обрабатывать меньшие наборы данных, ускорять обучение и создавать более интерпретируемые модели.
В работе решена актуальная задача уменьшения размерности обучающей выборки для трех постановок задач химической кинетики: поуровневая модель для бинарной смеси N2/N с распределением Больцмана, течение газа внутри фронта ударной волны, многотемпературная модель для воздушной смеси с распределением Тринора. Данные таких моделей имеют большое количество входных признаков, что приводит к ухудшению работы регрессии, поэтому выбор множества оптимальных признаков является актуальной задачей, помогающей решать проблемы переобучения, а также позволяющей повысить производительность модели.
Отбор признаков во всех случаях проводился с использованием некоторых методов фильтрации, оболочки и встроенных методов. Проведен сравнительный анализ эффективности указанных алгоритмов и определен минимальный набор наиболее значимых входных параметров, выбранных большинством алгоритмов. Также проведена оценка влияния уменьшении обучающей выборки на точность регрессии.
Метод регрессионного анализа Лассо, использующий регуляризацию L1, позволяет найти параметры, которые сильно коррелируют с целевыми переменными, обнуляя все менее значимые признаки. Такой подход может быть удобен при рассмотрении более простых моделей, например, для моделей с распределением Больцмана, но для более сложных процессов такой подход может не показать всех важных с физической точки зрения признаков.
Была рассмотрена тепловая карта матрицы корреляции Пирсона, анализ которой Недостатком матрицы корреляции Пирсона является отражение только линейных отношений между параметрами, тогда как в большинстве реальных процессов возможны нелинейные связи между компонентами системы. Поэтому такой анализ может не давать точных результатов для поставленной физической задачи, так как между параметрами присутствуют нелинейные связи.
Анализ главных компонент позволяет определить минимальное количество данных в обучающей выборке, при которых модель будет иметь высокую степень точности. Такой метод удобен из-за его простоты в реализации и интерпретации полученных результатов.
Методы выбора функций на основе весов важности (SelectFromModel) и встроенного метода вычисления важности признаков на основе дерева решений выявили большое количество зависимостей целевых переменных от признаков. Очень важно иметь метод, который позволяет оценивать такие зависимости, несмотря на то, что выбирается избыточное множество входных параметров.
Методы рекурсивного устранения и последовательного выбора признаков требуют больших вычислительных ресурсов, но такие алгоритмы предоставляют ранжированный список признаков, который может быть использован в более глубоком анализе физического процесса.
При обучении регрессора и многослойного персепронного регрессора на уменьшенных наборах данных, которые были получены с использованием алгоритмов выбора признаков, модель предсказывает значения целевых признаков с высокой точностью.
[1] Campoli L., Kustova E., Maltseva P. Preliminary assessment of machine learning methods for state-to-state approaches // Preprint submitted to Elsevier. March 13, 2021
[2] Нагнибеда Е. А., Кустова Е. В. Кинетическая теория процессов переноса и релаксации в потоках неравновесных реагирующих газов. Изд-во СПбГУ. 2003 - 270с.
[3] Kustova E. V. On the simplified state-to-state transport coefficients. Chemical Physics. - 2001. - Т. 270. - №. 1. - С. 177-195.
[4] Losev, S.: Gasdynamic Lasers. Nauka, Moscow (1977)
[5] Талиев В.Н.: Аэродинамика вентиляции. Москва, Стройиздат, 1979
[6] Исаев В.И., Леонов Е.Г.: Гидроаэромеханика в бурении. Недра, Москва, 1987 г.
[7] Белоцерковский С. М., Ништ М. И. Отрывное и безотрывное обтекание тонких крыльев идеальной жидкостью. - Наука. Гл. ред. физ.-мат. лит., 1978.
[8] Белолипецкий В. М. и др. Механика жидкости и газа. - 2007.
[9] Тарапов И. Е., Борисенко А. И. Механика сплошной среды. В 3т. Харьков: Золотые страницы, 2002.T. 2. - 2005.
[10] Gidaspov V. Y., Losev S. A., Severina N. S. Nonequilibrium kinetics in oxygen dissociation behind a shock wave front. Mathematical Models and Computer Simulations. - 2010. - Т. 2. - №. 2. - С. 211-221.
[11] Shizgal B., Karplus M. Nonequilibrium contributions to the rate of reaction. I. Perturbation of the velocity distribution function. The Journal of Chemical Physics. - 1970. - Т 52. - №. 8. - С. 4262-4278.
[12] Кунова О.В., Нагнибеда Е.А. Поуровневое описание колебательной и химической ре-лаксации в воздухе. Вестник СПбГУ. Сер.1. - 2013. - Вып.3. - С. 103-111
[13] Вышинский В. В., Иванов В. К., Терпугов А. В. Моделирование сложных режимов по-лёта на пилотажных стендах с учётом атмосферной турбулентности. Аэро- и гидроме-ханика ТРУДЫ МФТИ. — 2015. — Том 7, № 1. С.36-43
[14] Mangal A., Holm E. A. A comparative study of feature selection methods for stress hotspot classification in materials //Integrating Materials and Manufacturing Innovation. - 2018. - Т. 7. - №. 3. - С. 87-95.
[15] Миллер А. Б., Стасенко А. Л. Динамическая модель спутных вихрей самолета у земли при порывистом градиентном ветре. Ученые записки ЦАГИ. - 2005. - Т 36. - №. 3-4. - С. 3-12.