Тема: Повышение производительности решения СЛАУ за счет реализации метода сопряженных градиентов с использованием вычислительных мощностей графических процессоров и технологии CUDA
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
2 Техническое задание 6
3 Научно-исследовательская часть 11
3.1 Постановка задачи 11
3.2 Анализ методов решения 14
3.2.1 Метод сопряженных градиентов 14
3.2.2 Предобуславливание 14
3.2.2.1 Неполное разложение Холецкого 16
3.2.2.2 Методы стабилизации неполного разложения
Холецкого 17
3.3 Выбор технологий 17
3.3.1 Г етерогенные вычисления 18
3.3.2 Технология CUDA 19
3.4 Анализ результатов тестирования 20
4 Проектно-конструкторская часть 25
4.1 Структуры хранения данных 25
4.1.1 Программа на CPU 25
4.1.1.1 Класс SparseArray 25
4.1.1.2 Класс Sparselterator 27
4.1.1.3 Класс SparseMatrix 28
4.1.2 Программа c использованием GPU 29
4.1.2.1 Строчный разреженный формат 29
4.2 Класс предобуславливателя 30
4.3 Программная реализация 32
4.3.1 Программа с использованием GPU 32
4.3.2 Программа с использованием GPU (оптимизированный
вариант) 32
5 Технологическая часть 34
5.1 Программная модель CUDA 34
5.1.1 Основные принципы 34
5.1.2 Иерархия нитей 35
5.1.3 Расширения языка 37
5.1.3.1 Атрибуты функций и переменных 37
5.1.3.2 Встроенные типы 38
5.1.3.3 Встроенные переменные 39
5.1.3.4 Оператор вызова GPU-ядра 39
5.2 Иерархия памяти CUDA 40
5.2.1 Регистры 40
5.2.2 Локальная память 41
5.2.3 Разделяемая память 41
5.2.4 Глобальная память 41
5.2.5 Константная и текстурная память 42
5.3 Уровень аппаратуры GPU 42
5.4 Прикладные математические библиотеки CUDA 43
5.4.1 CUBLAS 43
5.4.2 CUSPARSE 44
6 Заключение 45
7 Библиографический список
📖 Введение
Целью работы является повышение производительности решения СЛАУ МКЭ в рамках задач о нелинейном деформировании материалов за счет реализации метода сопряженных градиентов с использование вычислительных мощностей графических процессоров и технологии CUDA.
Задачи дипломной работы:
• реализовать алгоритм метода сопряженных градиентов с
использованием GPU;
• преобразовать схемы хранения матрицы СЛАУ с учетом
особенностей алгоритма;
• провести тестовые расчеты (матрицы предоставляет РК5 из собственных программ) для задач различной размерности;
• сравнить производительность алгоритма при использовании
различных типов предобуславливателей;
• провести анализ производительности алгоритма (в сравнении с CPU).
✅ Заключение
Был проведен анализ алгоритма метода сопряженных градиентов. Было выполнено преобразование схемы хранения матрицы с учетом особенностей реализации алгоритма с использованием GPU. Был реализован алгоритм метода сопряженных градиентов с использованием технологии CUDA. Был реализован программный модуль для расчета предобуславливателя на основе неполного разложения Холецкого. Была разработана схема перемножения разреженной матрицы на плотный вектор.
Был проведен анализ производительности, который показал сокращение временных затрат в два раза по сравнению с программным решением на CPU.



