Введение 4
1 Обзор используемых численных методов и программных технологий 9
1.1 Обзор методов численного решения уравнения неразрывности 9
1.2 Обзор основных тенденций в области параллельного программирования 12
2 Полулагранжевый метод для уравнения неразрывности 16
2.1 Постановка задачи 16
2.2 Базовые интегральные тождества 17
2.3 Вычисление интеграла на верхнем слое по времени . . . 18
2.4 Вычисление интеграла на нижнем слое по времени . . . 21
2.5 Учет границы втекания 30
2.6 Численный метод 32
3 Параллельная реализация алгоритма 33
3.1 Последовательная реализация алгоритма 33
3.2 Предварительный анализ возможности распараллеливания алгоритма 34
3.3 Параллельная реализация алгоритма для вычислительных систем с общей памятью 35
3.4 Параллельная реализация алгоритма для вычислительных систем с распределенной памятью 36
3.5 Гибридная параллельная реализация 39
4 Результаты численных экспериментов 40
4.1 Тестовая задача №1 40
4.2 Тестовая задача №2 40
5 Анализ эффективность параллельных алгоритмов
5.1 Аппаратное и программное обеспечение для численных экспериментов
5.2 Анализ производительности OpenMP-версии алгоритма
5.3 Анализ производительности MPI-версии алгоритма
5.4 Анализ производительности гибридной версии алгоритма
Заключение 43
Список использованных источников 45
Приложения 51
Приложение А. Профили численного решения для тестовой задачи №2 51
Приложение Б. Значения нормы численного решения для тестовой задачи №2 52
В настоящее время параллельное программирование активно применяется для ускорения научных вычислений, что позволяет решать все более широкий круг вычислительноемких задач, требующих большого объема оперативной памяти.
Применение прямых методов численного анализа требует большого объема вычислительных ресурсов. Однопроцессорный компьютер зачастую не может обеспечить требуемый объем оперативной памяти для работы с многомиллионными ячейками расчетных сеток, использование которых необходимо для достижения требуемой точности. Эффективным средством решения ресурсоемких задач является технология параллельных вычислений на распределенных системах кластерного типа. На пути перехода от персонального компьютера к суперкомпьютеру с параллельной архитектурой имеются определенные трудности, которые, во-первых, связаны с необходимостью распараллеливания вычислительного алгоритма, во-вторых, с принципиально более сложным написанием программного кода и недостаточно развитой системой отладки программ на кластере. При этом одним из факторов эффективного использования высокопроизводительной многопроцессорной вы-числительной техники является применение специальных методов математического моделирования. В связи с этим, одной из задач современной науки является развитие технологии математического моделирования, рассматривающей многопроцессорные вычислительные системы (МВС) как основной аппарат для вычислений.
Отметим далее, что за время существования МВС накоплен значительный опыт их использования, и они находятся в массовом доступе. Однако, огромные вычислительные возможности, предоставляемые этими системами, используются недостаточно. Причиной этому является сложность адаптации последовательных алгоритмов и программ к параллельным архитектурам. Поэтому разработка эффективных параллельных алгоритмов решения фундаментальных и прикладных задач, изначально ориентированных на использование МВС является чрезвычайно актуальной проблемой. При этом надо учитывать, что вместе с возможностями, которые предоставляет программистам многопроцессорная вычислительная техника, существует специфические требования к используемым алгоритмам [1]:
• обеспечение равномерного распределения вычислительной нагрузки по процессорам;
• ускорение расчетов при увеличении числа процессоров;
• необходимость синхронизации при остановке (завершении) итераций;
• снижение затрат времени на синхронизацию;
• периодический сбор данных для записи и анализа;
• обмен данными между процессорами для продолжения расчета;
• снижение объема передаваемой информации при обмене;
• снижение числа актов приема-передачи (то есть числа обменов между процессорами);
• уменьшение влияния размера задачи на ускорение;
• обеспечение масштабируемости и переносимости программы.
Выполнение всех этих требований, связанных с применением распределенных вычислений к начально-краевой задачи для уравнения неразрывности является основной целью данной работы.
Уравнение неразрывности входит в состав многих математических моделей сплошной среды (различных моделей движения газовой и гидродинамики), теории волн, электродинамики и даже квантовой механики (в двух последних, обычно используется термин «уравнение непрерывности»).
В то же время при численном интегрировании уравнения неразрывности возникает необходимое для большинства современных методов [2] - [5] условие Куранта-Фридрихса-Леви на шаг по времени, что приводит к проблемам нахождения решения при больших скоростях.
В работе [6] рассмотрен полулагранжевый метод, основанный на точном тождестве пространственных интегралов, области интегрирования которых лежат на соседних слоях по времени. Этот метод приводит к консервативной разностной схема, дающей сходимость численного решения к точному с порядком O 0Т^.
В качестве основной цели исследования выступает разработка и анализ производительности нескольких версия параллельных алгоритмов реализации полулагранжевого метода для уравнения неразрывности с помощью технологий OpenMP и MPI. Для достижения поставленной цели сформулированы следующие задачи исследования:
• разработка параллельных вычислительных алгоритмов решения начально¬краевой задачи для уравнения неразрывности;
• адаптация разработанного алгоритма к многопроцессорным вычислительным системам, которая складывается из выбора методов реализации алгоритма на параллельных ЭВМ, выявления трудно распараллеливаемых блоков, их оптимизации и верификации;
• проведении вычислительных экспериментов на серии тестовых задач для верификации разработанного вычислительного алгоритма;
• оценка производительности разработанных алгоритмов.
для уравнения неразрывности.
В качестве метода исследований используется вычислительный эксперимент, включающий в себя следующие этапы [7]:
• математическая формулировка задачи,
• построение приближенного (численного) метода решения задачи, написание вычислительного алгоритма;
• программирование на ЭВМ вычислительного алгоритма,
• проведение расчетов на ЭВМ,
• анализ полученных численных результатов и уточнение математической модели.
Диссертация состоит из введения, пяти глав, заключения, списка используемой литературы и приложений.
Во введении обосновывается актуальность темы исследования, кратко излагается содержание диссертации, указывается ее научная новизна, и формируются основные результаты работы. В первой главе привидится краткий обзор численных методов решения начально-краевых задач для уравнения неразрывности и излагается обзор основных тенденций в области параллельного программирования. Во второй главе приводится математическая постановка задачи, описание полулагранжевого метода. В третьей главе описаны параллельные вычислительные алгоритмы реализации полулагранжевого метода для вычислительных систем с общей памятью, с распределенной памятью и для гибридных вычислительных систем. В четвертой главе представлены результаты вычислительных экспериментов на тестовых задачах. В пятой главе осуществляется анализ производительности разработанных параллельных алгоритмов.
Основные результаты работы были представлены на следующих научных конференциях:
1. Международная конференция "IX Сибирский конгресс женщин-математиков 17-20 мая 2016 г, г. Красноярск;
2. XVII Всероссийская конференция молодых учёных по математическому моделированию и информационным технологиям, 30 октября - 3 ноября 2016 г, г. Новосибирск;
3. XX юбилейная Международная научно-практическая конференция, по-священная памяти генерального конструктора ракетно-космических си¬стем академика Михаила Федоровича Решетнева "Решетневские чтения 9-12 ноября 2016 г., г. Красноярск
Результаты магистерской диссертации опубликованы в работах [34] - [37]. Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований, Правительства Красноярского края, Красноярского краевого фонда поддержки научной и научно-технической деятельности» в рамках научного проекта № 16-41-243029.
В магистерской диссертации получены следующие результаты.
1. Разработан параллельный вычислительный алгоритм решения начально-краевой задачи для уравнения неразрывности;
2. Разработанный алгоритм адаптирован к многопроцессорным вычислительным системам.
3. Проведены вычислительные эксперименты на серии тестовых задач для верификации разработанного вычислительного алгоритма.
4. Оценена производительность разработанных алгоритмов.
В магистерской диссертации для двумерного уравнения неразрывности описан численный метод, основанный на точном тождестве двух пространственных интегралов на соседних слоях по времени. Представленный подход имеет первый порядок сходимости для гладких решений, что полностью подтверждается вычислительными экспериментами.
Также в ходе работы, было разработано три параллельных алгоритма.
1. Для вычислительных систем с общей памятью с использованием технологии OpenMP.
2. Для вычислительных систем с распределенной памятью с использованием технологии MPI.
3. Для гибридных вычислительных систем с использованием объединения технологий MPI и OpenMP.
Данные алгоритмы были реализованы в виде прикладных программ на языке C++. Проведенные исследования производительности параллельных про¬грамм позволяют сделать следующие выводы.
1. Параллельная программа, использующая технологию OpenMP, обладает высокой производительностью (эффективность распараллеливания приближается к 100%). Ускорение вычислений в этом случае равно количеству ядер процессора(прииспользовании8ядервычисленияускоряются в 8 раз). Однако такая программа может применяться только для систем с общей памятью, в том числе на персональных ЭВМ с многоядерными процессорами (например, дву- или четырех ядерные процессоры).
2. Параллельная программа, использующая технологию MPI, обладает так¬же высокой производительностью. Данная программа может быть использована на многопроцессорных вычислительных системах.
3. Гибридная параллельная программа, использующая объединение технологий MPI и OpenMP, обладает меньшей производительностью, чем параллельная программа, использующая только технологию MPI. Данные вид программы может быть использован только на вычислительных системах гибридного типа, в которых применяются многоядерные процессоры.
Полученные результаты имеют практическое значение и могут быть использованы при построении эффективных параллельных алгоритмов.
[1] Якобский, М.В. Распределенные системы и сети / М.В. Якобский. - М. : МГТУ "Станкин 2000. - 118с.
[2] Harten, A. On a class of high resolution total-variation-stable finite-difference schemes / A. Harten. - SIAM J. Numer. Anal. 1984. V. 21. P. 1-23.
[3] Harten, A. Uniformly high-order accurate non-oscillatory schemes / Harten A., Engquist B., Osher S., Chakravarthy S. // J. Comput. Phys. 1987. V. 71. P. 231-303.
[4] Osher, S. Convergence of generalized MUSCL schemes // SIAM J. Numer. Anal. 1985. V. 22. P. 947-961.
[5] Годунов, С.К. Уравнения математической физики. М. : Наука, 1979. 392с.
[6] Синь, ВэньCharacteristics-like approach for solving hyperbolic equation of first order / Синь Вэнь, Вяткин А.В., Шайдуров В.В. // Молодой ученый. 2013
[7] Самарский, А.А. Теория разностных схем: учебное пособие / А.А. Самарский. - М. : Наука : Главная редакция физико-математической литературы, 1983. - 616с.
[8] Рябенький, В.С. Об устойчивости разностных уравнений / В.С. Рябенький, А.Ф. Филиппов. — М. : Гостехиздат, 1956.
[9] Вазов, В. Разностные методы решения уравнений в частных производных / В. Вазов, Дж. Форсайт. — М. : Наука, 1963.
[10] Годунов, С.К. Разностные схемы (введение в теорию) / С.К. Годунов,
В.С. Рябенький. — М. : Наука, 1977.
[11] Бахвалов, Н.С. Численные методы / Н.С. Бахвалов, Н.П. Жидков, Г.М. Кобельков. — 3-е изд., перераб. и доп. — М. : БИНОМ. Лаборатория знаний, 2003.
[12] Магомедов, К.М. Метод характеристик для численного решения пространственных течений газа // Журнал вычислительной математики и математической физики. — 1966 — Т. 6, № 2 — С. 313-325.
[13] Wiin-Nielson On the application of trajectory methods in numerical forecasting // Tellus. - 1959. - Vol. 11 - P. 180-186.
[14] Pironneau, O. On the Transport-Diffusion Algorithm and Its Applications to the Navier-Stokes Equations // Numerische Mathematic, 38 (1982), 309-332. Zbl 0505.76100
[15] Douglas, J.Jr. Numerical methods for convection-dominated diffusion problems based on combining the method of characteristics with finite element or finite difference procedures / J.Jr. Douglas, T.F. Russel // SIAM
J. Numer. Anal., 19:5 (1982), 871-885. Zbl 0492.65051
[16] Iske, A. Conservative semi-Lagrangian advection on adaptive unstructured meshes // Numer. Meth. Part. Diff. Eq. — 2004. — Vol. 20. — P.388-411.
[17] Xin Wen Semi-Lagrangian Scheme for soling hyperbolic equation of first order / Xin Wen, Vyatkin A.V., Shaidurov V.V. // Молодой учёный. - 2013. - № 9(56). - С.6-13.
[18] Вяткин, А.В. Использование гибридных вычислительных систем для решения уравнения переноса модифицированным методом траекторий / Вяткин А.В., Ефремов А.А., Карепова Е.Д., Шайдуров В.В. // Пятая Международная конференция «Системный анализ и информационные технологии»: Труды конференции. В 2 т. Красноярск: ИВМ СО РАН. — 2013. — Т. 1. - С.45-55.
[19] Phillips, T.N. Conservative semi-Lagrangian finite volume schemes / Phillips T.N., Williams A. J. // Numer. Meth. Part. Diff. Eq. — 2001. — Vol. 17. — P.403-425.
[20] Arbogast, T. Convergence of a Fully Conservative Volume Corrected Characteristic Method for Transport Problems /T. Arbogast, W.H. Wang // SIAM J. Numer. Anal., 2010 — Vol. 48(3) — P. 797-823
[21] Robert, A. A semi-implicit and semi-Lagrangian numerical integration scheme for the primitive meteorological equations //J. Meteor. Soc. Japan. — 1982. — Vol. 60. — P. 319-325.
[22] Lauritzen, P.H. A conservative semi-Lagrangian multi-tracer transport scheme (CSLAM) on the cubed-sphere grid / Lauritzen P.H., Nair R.D., Ulrich P.A. //J. Comput. Phys. — 2010. — V. 229. — Issue 5. — P. 1401¬1424. — DOI: 10.1016/j.jcp.2009.10.036.
[23] Zerroukat, M. SLICE-S: A semi-Lagrangian inherently conserving and sfficient scheme for transport problems on the sphere / Zerroukat M., Wood
N., Staniforth A. // Quart. J. Roy. Meteor. Soc. — 2004. — Vol. 130. — N. 602. — P. 2649-2664.
[24] Zerroukat, M. A three-dimensional monotone and conservative semi¬Lagrangian scheme (SLICE-3D) for transport problems / Zerroukat M., Allen T. A // Quart. J. Roy. Met. Soc. — 2012. — DOI: 10.1002/qj.1902
[25] Тостых, М.А. Разработка многомасштабной версии глобальной модели атмосферы ПЛАВ / Тостых М.А., Желен Ж.Ф., Володин Е.М., Богословский Н.Н., Вильфанд Р.М., Киктев Д.Б., Красюк Т.В., Кострыкин
С.В., Мизяк В.Г., Фадеев Р.Ю., Шашкин В.В., Шляева А.В., Эзау И.Н., Юрова А.Ю. // Метеорология и гидрология. - 2015. - №6. - С. 25-35.
[26] Толстых, М.А. Глобальная полулагранжевая модель численного прогно¬за погоды. М, Обнинск: ОАО ФОП, 2010, 111 стр.
[27] Толстых, М.А. Параллельная версия полулагранжевой модели ПЛАВ с горизонтальным разрешением порядка 20 км. / Толстых М.А., Мизяк В.Г. // Труды Гидрометеорологического научно-исследовательского центра Российской Федерации. 2011, вып. 346. С 181-190.
[28] Фадеев, Р.Ю. Параллельная реализация совместной модели атмосферы и океана для бесшовного прогноза погоды и моделирования изменений климата / Фадеев Р.Ю., Ушаков К.В., Толстых М.А., Ибраев Р.А., Калмыков В.В. // Сборник трудов международной конференции "СУПЕР¬КОМПЬЮТЕРНЫЕ ДНИ В РОССИИ Москва, 2016г.". 2016, изд. дом МГУ, с. 398-206.
[29] Толстых, М.А. Численный прогноз погоды и моделирование изменений климата многомасштабной моделью атмосферы / Толстых М.А., Фадеев Р.Ю., Мизяк В.Г. // Параллельные вычислительные технологии (ПаВТ'2016) труды международной научной конференции. 2016. С. 721¬728.
[30] Machenhauer, B. Finite-Volume Methods in Meteorology / Machenhauer B., Kaas E., Lauritzen P.H. // Computational Methods for the Atmosphere and the Oceans. — 2009. — Special Vol. 14. — ELSEVIER — ISBN-13: 978-0-444¬51893-4.
[31] Tolstykh, M.A. Vorticity-divergence mass-conserving semi-Lagrangian shallow-water model using the reduced grid on the sphere / Tolstykh M.A., Shashkin V.V. // J. Comp. Phys. - 2012. - Vol. 231. - P. 4205-4233.
[32] Efremov, A. A Computational Realization of a Semi-Lagrangian Method for Solving the Advection Equation / A. Efremov, E. Karepova, V. Shaydurov, A. Vyatkin // Journal of Applied Mathematics. - 2014. - doi 10.1155/2014/610398
[33] Антонов, А.С. Параллельное программирование с использованием технологии OpenMP / Антонов А.С. // Учебное пособие. - М. Изд-во МГУ.- 2009.
[34] Вяткин, А.В. Параллельная реализация полулагранжевого метода для уравнения неразрывности / Вяткин А.В., Кучунова Е.В. // Образовательные ресурсы и технологии. — 2016. — №2 (14).
[35] Вяткин, А.В. Использование адаптивных сеток при решении двумерного уравнения неразрывности полулагранжевым методом / Вяткин А.В., Кучунова Е.В., Шайдуров В.В.// Сибирские электронные математические известия. — 2016. — Т. 13. — С. 1219-1228.
[36] Кучунова, Е.В. Параллельная реализация полулагранжевого метода для двумерного уравнения неразрывности на многопроцессорных вычисли¬тельных системах / Кучунова Е.В., Вяткин А.В. // Тезисы докладов XVII Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям. - Новосибирск, 2017.
- С. 48.
[37] Вяткин, А.В. Применение полулагранжевого метода для численного решения трехмерного уравнения неразрывности / Вяткин А.В., Кучунова Е.В. // Материалы XX Юлилейной международной научно¬практической конференции посвященной памяти генерального конструктора ракетно-космических систем академика М.Ф. Решетнева. В 2 т. - Красноярск, 2016. - Т.2 - С. 122-123.