ВВЕДЕНИЕ 4
4. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. Архитектура GPU 7
1.2. Архитектура Intel MIC 9
1.3 Параллельные СУБД 10
5. ОБЗОР МОДЕЛЕЙ МНОГОПРОЦЕССОРНЫХ СИСТЕМ 16
5.1 Модели параллельных вычислений 16
5.1.1 Модель PRAM 16
2.1.2. Модель BSP 18
2.1.3. Модель LogP 19
2.2. Модели параллельных систем баз данных 19
6. МОДЕЛЬ DMG 28
3.1. Модель аппаратной платформы 28
3.2. Модель операционной среды 30
4. РАЗРАБОТКА ПРОГРАММНОГО ЭМУЛЯТОРА 35
4.1 Варианты использования 35
4.2 Принципы эмулятора 36
5. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 37
ЗАКЛЮЧЕНИЕ 43
ЛИТЕРАТУРА 44
Объем информации, хранящейся на электронных носителях, стремительно увеличивается. В 2011 году он был в 30 миллионов раз больше, чем объем информации, содержащейся в книгах, написанных за весь период существования человечества. По данным аналитической компании IDC он достиг 1,8 зеттабайт (миллиарда терабайт). По прогнозам IDC, объем данных на планете будет как минимум удваиваться каждые два года вплоть до 2020 года[16,22].
Динамика роста данных объясняется ростом вычислительных средств, приложений и пользователей. Источниками возникновения сверхбольших данных являются данные с измерительных устройств, события от радиочастотных идентификаторов, потоки сообщений из социальных сетей[15], метеорологические данные, данные дистанционного зондирования Земли, потоки данных о местонахождении абонентов сетей сотовой связи, устройств аудио- и видеорегистрации. Настолько огромный объем данных необходимо хранить, обрабатывать и анализировать[5]. Данная задача не может быть выполнена классическими программно - аппаратными средствами. Для этого необходимо использовать многопроцессорные системы баз данных.
Параллельные СУБД, реализованные на аппаратной платформе кластерных вычислительных систем, на сегодняшний день являются одним из наиболее эффективных средств обработки сверхбольших баз данных [24]. Вычислительные кластеры позволяют уменьшить время расчетов по сравнению с одиночным компьютером, разбивая задание на параллельно выполняющиеся ветки, которые обмениваются данными по связывающей сети.
В настоящее время для увеличения вычислительной мощности применяют гибридные вычислительные системы, оснащенные совместно центральными процессорами и сопроцессорами. Сопроцессор работает, взаимодействуя с центральным процессором. Обычно сопроцессор настраивается на выполнение какой-нибудь специфической функции - математической операции или графического представления. Эту операцию сопроцессор может реализовывать во много раз быстрее, чем центральный процессор.
Существуют исследования, демонстрирующие производительность гибридных вычислительных систем под нагрузкой, сходной с нагрузкой, создающейся при выполнении запросов к параллельным системам баз данных. Результаты данных исследований показывают эффективность подобных архитектур [2, 6, 8, 21]. В соответствии с этим актуальной задачей является моделирование и исследование гибридных вычислительных систем, оснащенных многоядерными графическими процессорами.
Цель работы состоит в моделировании операции соединения на многопроцессорных системах с графическими ускорителями.
Для достижения поставленной цели необходимо решить следующие задачи:
1) выполнить обзор моделей многопроцессорных систем;
2) разработать математическую модель многопроцессорной системы, оснащенной графическими ускорителями, позволяющей моделировать операцию соединения;
3) реализовать предложенную модель в виде программного эмулятора;
4) с использованием разработанного эмулятора выполнить вычислительные эксперименты на проверку адекватности модели.
Структура работы
Работа состоит из введения, шести глав, заключения, литературы.
В первом разделе представлена программно-аппаратная архитектура графического процессора, архитектура процессора (сопроцессора) и параллельные СУБД. Во втором разделе изложены модели параллельных вычислений, модели параллельных систем баз данных. В третьем разделе описана модель, позволяющая выполнять моделирование операции соединения на 5
многопроцессорных системах с графическими ускорителями. Модель включает в себя модель аппаратной платформы, модель операционной среды. В четвертом разделе приведены детали проектирования и разработки программного эмулятора, реализующего разработанную модель. В пятом раз-деле описана настройка эмулятора. В шестом приведены вычислительные эксперименты.
Объем работы составляет 46 страниц, объем литературы - 24 наименования.
В работе рассмотрены вопросы моделирования и анализа многопроцессорных систем баз данных, оснащенных графическими ускорителями. По итогам работы получены следующие результаты:
1) разработана модель, позволяющая моделировать многопроцессорные системы баз данных, оснащенных графическими ускорителями;
2) на основе предложенной модели разработан программный эмулятор, позволяющий моделировать и исследовать различные многопроцессорные конфигурации;
3) проведены вычислительные эксперименты, направленные на поиск оптимальных аппаратных архитектур мультипроцессоров баз данных.