Тип работы:
Предмет:
Язык работы:


Параллельный алгоритм решения задачи анализа рыночной корзины для многоядерного ускорителя Intel Xeon Phi

Работа №80165

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы32
Год сдачи2016
Стоимость4860 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
188
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. СОВРЕМЕННЫЕ АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИ АНАЛИЗА
РЫНОЧНОЙ КОРЗИНЫ 8
1.1. Формальные определения и постановка задачи 8
1.2. Популярные существующие алгоритмы решения задачи анализа
рыночной корзины 9
1.3. Распространение многоядерных ускорителей Intel MIC 11
1.4. Обзор работ по тематике исследования 12
1.5. Выводы по разделу 14
2. ПРОЕКТИРОВАНИЕ 15
2.1. Описание алгоритма DIC 15
2.2. Принципы распараллеливания и модификации алгоритма DIC 17
2.3. Структура хранения данных 19
2.4. Выводы по разделу 20
3. РЕАЛИЗАЦИЯ 21
3.1. Модульная структура параллельного алгоритма DIC 21
3.2. Особенности реализации 22
3.3. Выводы по разделу 23
4. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 24
4.1. Аппаратная платформа и данные 24
4.2. Время выполнения последовательного алгоритма 24
4.3. Время выполнения параллельного алгоритма 25
4.4 Ускорение параллельного алгоритма 26
4.5. Выводы по разделу 27
ЗАКЛЮЧЕНИЕ 28
ЛИТЕРАТУРА 29


Задача анализа рыночной корзины является одной из задач интеллектуального анализа данных [27], представляя собой поиск наиболее часто совместно покупаемых товаров (поиск ассоциативных правил [2]). Решение данной задачи позволяет определить список рекомендованных для покупателя товаров, основываясь на списке товаров, которые он собирается приобрести [12].
На сегодня в связи с глобализацией интернета наблюдается прогрессирующий рост электронной коммерции [20]. За 2015 год только через Amazon.com было продано более двух миллиардов товаров [1]. Сервисы электронной коммерции нуждаются в решении задачи анализа рыночной корзины своих посетителей для увеличения конверсии. В силу этого актуальной является задача динамического анализа рыночной корзины.
Базы данных в настоящее время имеют сверхбольшие размеры, а сервисы электронной коммерции обычно оперируют миллионами наименований товаров. В связи с этим для эффективного решения задачи анализа рыночной корзины требуются масштабируемые производительные алгоритмы, позволяющие решить задачу анализа рыночной корзины на основе выбранных пользователем товаров за короткое время [2].
На ноябрь 2015 года более 85 % списка TOP500 самых мощных суперкомпьютеров мира [22] основаны на кластерной архитектуре. Более 18% суперкомпьютеров из этого списка (включая первую строку списка) оснащены ускорителями на базе архитектуры Intel Many Integrated Core [6]. На сегодня наиболее часто используемым ускорителем из списка Intel MIC является сопроцессор Intel Xeon Phi.
Таким образом, актуальной является задача разработки параллельного алгоритма анализа рыночной корзины для ускорителей на базе архитектуры Intel MIC.
Цель и задачи исследования
Цель данной работы состояла в разработке и исследовании эффективности параллельного алгоритма решения задачи анализа рыночной корзины для многоядерного ускорителя Intel Xeon Phi. Для достижения данной цели необходимо было решить следующие задачи:
1) выполнить обзор существующих последовательных и параллельных алгоритмов решения задачи анализа рыночной корзины;
2) разработать параллельный алгоритм решения задачи анализа рыночной корзины для многоядерного ускорителя Intel Xeon Phi;
3) реализовать разработанный алгоритм и провести вычислительные эксперименты по исследованию производительности разработанного алгоритма.
Структура и объем работы
Работа состоит из введения, четырех глав, заключения и библиографии.
Объем работы составляет 31 страницу, объем библиографии - 26 наименований.
Содержание работы
Первый раздел, «Современные алгоритмы решения задачи анализа рыночной корзины», посвящен обзору существующих алгоритмов решения задачи анализа рыночной корзины. В данном разделе рассматриваются последовательные и параллельные решения в области анализа рыночной корзины.
Второй раздел, «Проектирование», содержит описание последовательного алгоритма, принципов его распараллеливания и описание используемых структур хранения данных.
Третий раздел, «Реализация», содержит описание модульной структуры программного комплекса решения задачи анализа рыночной корзины. Также в этом разделе описываются интерфейсы программного комплекса и основные аспекты реализации.
Четвертый раздел, «Вычислительные эксперименты», содержит результаты вычислительных экспериментов по исследованию производительности разработанного алгоритма.
В заключении в краткой форме излагаются итоги выполненного исследования и рассматриваются перспективы дальнейшего развития темы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Цель данной работы состояла в разработке и исследовании эффективности параллельного алгоритма решения задачи анализа рыночной корзины для многоядерного ускорителя Intel Xeon Phi.
В ходе выполнения выпускной квалификационной работы магистра были решены следующие задачи:
1) выполнен обзор существующих последовательных и параллельных алгоритмов решения задачи анализа рыночной корзины;
2) разработан параллельный алгоритм решения задачи анализа рыночной корзины для многоядерного ускорителя Intel Xeon Phi;
3) разработанный алгоритм реализован и проведены вычислительные эксперименты по исследованию производительности разработанного алгоритма.
В качестве возможного направления дальнейших исследований интересной представляется задача модификации разработанного алгоритма для кластерных систем на базе многоядерных ускорителей Intel Xeon Phi.



1. Amazon Statistic. [Электронный ресурс] URL: http://expandedram- blings.com/index.php/amazon-statistics/(дата обращения: 01.06.2016).
2. Agrawal, R., Imielinski, T., Swami, A. Mining association rules be¬tween sets of items in large databases. // Proceedings of the 1993 ACM SIG- MOD international conference on Management of data. - SIGMOD, 1993. - P. 207.
3. Agrawal, R., Srikant, R. Fast Algorithms for Mining Association Rules in Large Databases. // Proceedings of 20th International Conference on Very Large Data Bases, September 12-15, 1994, Santiago de Chile, Chile. - Morgan Kauffman, 1994. - P. 487-499.
4. Brin S., Motwani R., Ullman J.D. Dynamic itemset counting and implication rules for market basket data. // International Conference on Manage¬ment of Data, May 13-15, 1997, Tucson, Arizona. ACM, 1997. - P. 255-264.
5. De la Briandais, R. File searching using variable length keys. // Proc. Western J. Computer Conf. - Brass, 1959. - P. 295-298.
6. Duran A., Klemm M. The Intel® Many Integrated Core Architecture. // HPCS. - IEEE, 2012. - P. 365-366.
7. Frequent Itemset Mining Dataset Repository. [Электронный ресурс] URL: http://fimi.ua.ac.be/data/(дата обращения: 01.06.2016).
8. Goethals B., Zaki M.J.. Advances in frequent itemset mining imple-mentations. // SIGKDD Explorations, 2004. - No. 6. - Vol. 1. - P.109-117.
9. Han J. Pei J., Yin Y. Mining Frequent Patterns Without Candidate Generation. // Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. - SIGMOD, 2000. - P. 1-12.
10. Li N. Parallel Implementation of Apriori Algorithm Based on MapReduce. / N. Li, L. Zeng, Q. He, et al. // 13th ACIS International Conference. - SNPD, 2012. - P. 236-241.
11. Liu G. AFOPT: An Efficient Implementation of Pattern Growth Approach. / G. Lui, H. Lu, J.X. Yu, W. Wang, X. Xiao // FIMI, 2003. - P. 27-37.
12. Michael J. A., Linoff G.A.. Data Mining Techniques for Marketing, Sales and Customer Support. // UIC, 2004. - 888 p.
13. Missaoui B., Arour K., Slimani Y. Parallel Binary Approach for Frequent Itemsets Mining. // ICICA - IJCCE, 2013. - Vol. 2. - No. 3. - P. 230¬235.
14. OpenMP. [Электронный ресурс] URL: http://www.openmp.org/(дата обращения: 05.06.2016).
15. Ozdogan G.O., Abul O. Task-Parallel FP-Growth on Cluster Computers. // LCNEE, 2010. - Vol. 62. - P. 383-388.
16. Pranjape-Voditel P., Deshpande U. A DIC-based distributed algorithm for frequent itemset generation // Journal of software, 2011. - V.6. - P. 306¬313.
17. Pramudiono I., Kitsuregawa M. Parallel FP-Growth on PC Cluster. // Advances in Knowledge Discovery and Data Mining. - LNCS, 2003. - Vol. 2637. - P. 467-473.
18. Schlegel, B. Scallable Frequent Itemset Mining on Many-core Proces¬sors. / B. Schlegel, T. Karnagel, T. Kiefer, W. Lehner // Proceedings of Ninth International Workshop on DaMoN. - ACM, 2013. - No. 3. - P. 26-34.
19. Schlegel, B. pcApriori: scalable apriori for multiprocessor systems. / B. Schlegel, T. Karnagel, T. Kiefer, W. Lehner // Proceedings of 25th Interna¬tional Conference on SSDBM. - ACM, 2013. - No. 20. - P. 43-55.
20. Tkacz E.; Kapczynski A. Internet - Technical Development and Ap-plications. // Springer, 2009. - P. 255.
21. Toivonen, H. Sampling Large Databases for Association Rules. // Pro-ceedings of 22th ICVLDB. - Morgan Kaufman, 1996. - P. 134-145.
22. Top 500 Supercomuter Sites. [Электронный ресурс] URL: http://top500.org(дата обращения: 01.06.2016).
23. Zaki M.J., Parallel Data Mining for Association Rules on Shared- memory Systems / M. Zaki, M. Ogihara, S. Parthansarathy, W. Li // Proceedings of the 1996 ACM/IEE. - Supercomputing, 1996. - P. 1-29.
24. Zaki, M.J. Scalable algorithms for association mining. // IEEE Trans-actions on Knowledge and Data Engineering, 2000. - Vol. 12. - No. 3. -
P. 372-390.
25. Гамма Э., Хелм Р. Приемы объектно-ориентированного проектирования. Паттерны проектирования. // Питер, 2007. - 366 с.
26. Костенецкий П.С., Сафонов А.Ю. Суперкомпьютерный комплекс ЮУрГУ. // Параллельные вычислительные технологии (ПаВТ’2016): труды международной научной конференции (28 марта - 1 апреля 2016 г., г. Архангельск). - 2016. - С. 561-573.
27. Кречетов Н.В. Продукты для интеллектуального анализа данных. // Рынок программных средств. - 1997. - № 14. - С. 32-39.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ