Тип работы:
Предмет:
Язык работы:


Моделирование аппаратной платформы мультипроцессора баз данных, оснащенного многоядерными сопроцессорами

Работа №80177

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы43
Год сдачи2016
Стоимость4855 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
24
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. ОБЗОР НАУЧНЫХ РАБОТ ПО ТЕМАТИКЕ ИССЛЕДОВАНИЯ . 8
1.1. Модель Roofline 8
1.2. Модель Лоусона 10
1.3. Модель PerDome 12
1.4. DMM 13
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 15
2.1. Требования к модели 15
2.2. Подмодель аппаратной платформы 16
2.3. Подмодель выполнения 20
3. ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ 25
3.1. Библиотека libdhm 25
3.2. Прототип эмулятора 31
4. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 33
4.1. Моделирование операции выборки 33
4.2. Моделирование операции соединения 36
ЗАКЛЮЧЕНИЕ 38
ЛИТЕРАТУРА

Одной из отличительных особенностей современных информационных технологий является стремительный рост объема накапливаемых и обрабатываемых данных. Зачастую пользователи информационных систем даже не подозревают, что используемые ими системы вынуждены обрабатывать огромное количество информации для выполнения своей работы. Так, например, каждый час пользователи популярного сетевого сервиса twitter создают более двадцати одного миллиона «твитов», а пользователи крупнейшей социальной сети «Facebook» — более двухсот пяти-десяти миллионов постов. Поисковая система Google обрабатывает более двух миллионов поисковых запросов каждую секунду. Большая часть собранной информации не структурирована, однако значительная ее часть преобразуется в более строгий формат.
Применение параллельных баз данных является важным подходом к обработке таких объемов информации. Быстрый рост объемов обрабатываемой информации подталкивает ученых и разработчиков к поиску новых алгоритмов и архитектурных решений, которые позволили бы повысить эффективность обработки баз данных. Одним из ключевых требований для обеспечения высокой производительности обработки баз данных является грамотное использование аппаратных особенностей используемого оборудования.
Одним из наиболее распространенных видов высокопроизводительных вычислительных систем являются гибридные вычислительные системы, которые оснащены не только центральными процессорами (CPU), но и графическими ускорителями, либо многоядерными сопроцессорами [16]. Более того, некоторые вычислительные системы оснащены несколькими видами многоядерных ускорителей одновременно. Такие вычислительные системы показывают высокий уровень производительности для многих задач, однако они обладают целым отличительных особенностей [9, 10]. Эти особенности делают необходимой разработку новых подходов и решений для достижения максимальной производительности при обработке баз данных.
Создание математических моделей гибридных вычислительных систем является актуальным научным вопросом, поскольку оно позволяет предсказать эффективность того или иного решения при разработке алгоритмов и программных систем. На сегодняшний день существует несколько моделей гибридных вычислительных систем, но все они ориентированы в большей степени на расчетные задачи и не учитывают специфику задач параллельной обработки баз данных. В то же время, существующие математические модели баз данных не учитывают особенностей гетерогенных вычислительных систем.
Учитывая вышесказанное, задача создания математических моделей СУБД, использующих гетерогенные гибридные вычислительные системы для обработки баз данных, является актуальной научной проблемой.
Цель и задачи работы
Целью данного исследования является создание математической модели для моделирования аппаратной платформы мультипроцессора баз данных, оснащенного многоядерными сопроцессорами. Для достижения поставленной цели необходимо решить следующие задачи:
1. выполнить обзор существующих математических моделей гибридных вычислительных систем;
2. разработать подмодель аппаратной платформы;
3. разработать подмодель выполнения модели;
4. спроектировать и реализовать программную библиотеку, реализующую разработанные подмодели;
5. провести вычислительные эксперименты, направленные на валидацию предложенных подмоделей.
Структура и объем работы
Данная работа состоит из введения, четырех глав, заключения и списка литературы. Объем работы составляет 42 страницы, объем библиографии — 25 источников.
Обзор работы
В первой главе проведен обзор существующих на сегодняшний день моделей гибридных вычислительных систем и моделей баз данных.
Во второй главе перечислены требования к математической модели аппаратной платформы мультипроцессора баз данных, оснащенного многоядерными сопроцессорами. Приведены подробные описания под-модели аппаратной платформы и подмодели выполнения.
В третьей главе описана разработка библиотеки libdhm, которая реализует предложенные во второй главе подмодели. Здесь же описана разработка прототипа эмулятора баз данных, использованного для первичной валидации предложенных подмоделей.
Четвертая глава посвящена вычислительным экспериментам, направленным на начальную валидацию предложенных подмоделей.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной работы была создана математическая модель для моделирования аппаратной платформы мультипроцессора баз данных, оснащенного многоядерными сопроцессорами. Для достижения поставленной цели были решены следующие задачи:
1. выполнен обзор существующих математических моделей гибридных вычислительных систем;
2. разработана подмодель аппаратной платформы;
3. разработана подмодель выполнения модели;
4. спроектирована и реализована программная библиотека, реализующая разработанные подмодели;
5. проведены вычислительные эксперименты, направленные на валидацию предложенных подмоделей.
В результате выполнения выпускной квалификационной работы были выполнены все поставленные задачи. Таким образом, цель данной работы была достигнута.
Дальнейшими направлениями исследований будут:
— разработка подмодели транзакций модели DHM;
— проверка корректности модели DHM.
Гранты
Данная работа была выполнена при поддержке гранта РФФИ № 16-37-00245 мол_а (2016 - 2017 гг.): «Моделирование параллельной обработки запросов с использованием сжатых колоночных индексов на кластерных вычислительных системах с многоядерными ускорителями».
Публикации
Данная работа является частью комплекса исследований, посвященных моделированию параллельной обработки запросов на высокопроизводительных вычислительных системах с многоядерными ускорителями. По результатам различных этапов этих исследований были опубликованы работы [1, 2, 3, 18, 19, 20, 21, 23].



1. Besedin K.Y., Kostenetskiy P.S., Prikazchikov S.O. Increasing Efficiency of Data Transfer Between Main Memory and Intel Xeon Phi Coprocessor or NVIDIA GPUS with Data Compression. // Lecture Notes in Computer Science, Springer, 2015. - Vol. 9251. - P. 319-323.
2. Besedin K.Y., Kostenetskiy P.S. Simulating of query processing on multiprocessor database systems with modern coprocessors. // 37th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO) 2014, Opatija, Croatia, May 26-30, 2014. IEEE, 2014. - P 1614-1616.
3. Besedin K.Y., Kostenetskiy P.S., Prikazchikov S.O. Using Data Compression for Increasing Efficiency of Data Transfer Between Main Memory and Intel Xeon Phi Coprocessor or NVidia GPU in Parallel DBMS. // Procedia Computer Science, 2015. - Vol. 66. - P. 635-641.
4. Boost C++ Libraries. [Электронный ресурс] URL: http://www.boost.org (дата обращения: 20.01.2016).
5. CMake — Cross Platform Make. [Электронный ресурс] URL: http://cmake.org (дата обращения: 22.01.2016).
6. Fang W., He B., Luo Q. Database Compression on Graphics Processors. // 36th International Conference on Very Large Data Bases Singapore, September 13-17, 2010. Proceedings. VLDB Endowment, 2010. - P 670-680.
7. Relational joins on graphics processors. / B. He, R. Fang, K. Yang, et al. // ACM SIGMOD international conference on Management of data, New York, USA, June 10-12, 2008, Proceedings. ACM, 2008. - P 511-524.
8. Ivanova E., Sokolinsky L. Decomposition of Natural Join Based on Domain-Interval Fragmented Column Indices. // 38th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO) 2015, Opatija, Croatia, May 25-29, 2015. - IEEE,2015.- P 223-226.
9. Jeffers, J.R. Intel Xeon Phi coprocessor high-performance programming. - USA: Elsevier, 2013. - 430 с.
10. Kirk D.B., Hwu W.W. Programming massively parallel processors. A hands-on approach. 2nd edition. - USA: Elsevier, 2013. - 519 с.
11. Kostenetskiy P.S., Sokolinsky L.B. Analysis of Hierarchical Multiprocessor Database Systems. // Proceedings of the 2007 International Conference on High Performance Computing, Networking and Communication Systems (HPCNCS-07), July 9-12 2007, Orlando, FL. - USA: ISRST, 2007. - P. 245-251.
12. Lawson G., Sundriyal V., Sosonkina M., Shen Y. Modeling performance and energy for applications offloaded to Intel Xeon Phi. // Proceedings of the 2nd International Workshop on Hardware-Software Co-Design for High Performance Computing, Co-HPC 2015 November 15 2015, Austin, Texas. - USA: ACM, 2015. - P. 7:1-7:8.
13. Lu F., Song J., Pang Y. HLognGP: A parallel computation model for GPU clusters. // Concurrency and Computation: Practice and Experience,
2015.- Vol. 25. - No. 17. - P. 4880-4896.
14. Olsen S., Romoser B., Zong Z. SQLPhi: A SQL-Based Database Engine for Intel Xeon Phi Coprocessors. // 2014 International Conference on Big Data Science and Computing Beijing, - China: ACM, 2014. -P. 17:7-17:6.
15. Tang L., Hu X.S., Barrett R.F. PerDome: a performance model for heterogeneous computing systems. // Proceedings of the Symposium on High Performance Computing, part of the 2015 Spring Simulation Multiconference, SpringSim ’15 April 12-15 2015, Alexandria, VA. - USA: SCS/ACM, 2015. - P 225-232.
16. TOP500 Supercomputer Sites. [Электронный ресурс] URL: http://www.top500.org/lists/2015/11/ (дата обращения: 22.01.2016).
17. Williams S., Waterman A., Patterson D.A. Roofline: an insightful visual performance model for multicore architectures. // Commun. ACM, 2009. - Vol. 52. - No. 4. - P. 65-76.
18. Беседин К.Ю., Костенецкий П.С. Применение сжатия информации при использовании многоядерных ускорителей для обработки баз данных. // Параллельные вычислительные технологии (ПаВТ’2015): труды международной научной конференции, Екатеринбург, Россия, 30 марта - 3 апреля 2015, - Челябинск: Издательский центр ЮУрГУ, 2015. - С. 43-53.
19. Беседин К.Ю. Костенецкий П.С. Исследование эффективности различных методов сжатия при передаче данных из основной памяти в память сопроцессора Intel Xeon Phi. // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции, Новороссийск, Россия, 22-27 сентября 2014, - М.: Издательство МГУ, 2014. - С. 114-119.
20. Беседин К.Ю., Костенецкий П.С. Моделирование обработки запросов на гибридных вычислительных системах с многоядерными сопроцессорами и графическими ускорителями // Программные системы: теория и приложения: электрон. научн. журн. Института программных систем им. А.К. Айламазяна РАН, 2014. - T. 5. - № 1(19). -С. 91-110.
21. Беседин К.Ю., Костенецкий П.С. Моделирование обработки запросов на гибридных вычислительных системах с многоядерными сопроцессорами и графическими ускорителями // Научный сервис в сети Интернет: все грани параллелизма: Труды Международной суперкомпьютерной конференции, Новороссийск, Россия, 23-28 сентября 2013, - М.: Изд-во МГУ, 2013. - С. 202-210.
22. Кормен Т.Х., Лейзерсон Ч.И., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ, 2-е изд. — М.: Издательский дом «Вильямс», 2012. - 1296 с.
23. Костенецкий П.С., Беседин К.Ю. Исследование эффективности различных методов сжатия при передаче данных из основной памяти в память сопроцессора Intel Xeon Phi // Вычислительные методы и программирование, 2014. - Т. 15. - № 4. - С. 593-601.
24. Костенецкий П.С., Соколинский Л.Б. Моделирование иерархических многопроцессорных систем баз данных // Программирование, 2013. - Т. 39. - № 1. - С. 3-22.
25. Саттер Г., Александреску А. Стандарты программирования на C++. - М.: Издательский дом «Вильямс», 2004. - 224 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ