📄Работа №197268

Тема: РАЗРАБОТКА ПАРАЛЛЕЛЬНОГО АЛГОРИТМА ПОИСКА САМОЙ ПОХОЖЕЙ ПОДПОСЛЕДОВАТЕЛЬНОСТИ ВРЕМЕННОГО РЯДА ДЛЯ МНОГОЯДЕРНЫХ ПРОЦЕССОРОВ INTEL XEON PHI (KNIGHTS LANDING)

📝

Тип работы Дипломные работы, ВКР

📚

Предмет информатика

📄

Объем: 29 листов

📅

Год: 2018

👁️

4290 руб.

🛒 Купить работу

Не подходит эта работа?
Закажите новую по вашим требованиям

Узнать цену на написание

ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить

📋 Содержание

ВВЕДЕНИЕ 5
1. ОБЗОР РАБОТ ПО ТЕМАТИКЕ ИССЛЕДОВАНИЯ 9
2. ФОРМАЛЬНЫЕ ОБОЗНАЧЕНИЯ И ПОСТАНОВКА ЗАДАЧИ 11
2.1. Формальные обозначения 11
2.2. Последовательный алгоритм UCR-DTW 12
3. ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ PHIBESTMATCH 16
3.1. Краткое описание параллельного алгоритма phiBestMatch 16
3.2. Модуль Block’n’Pad 18
3.3. Модуль CalculateLB 18
3.4. Модуль LowerBounding 19
3.5. Модуль FillMatrixDTW 21
3.6. Модуль CalculateDTW 22
4. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 23
4.1. Цели экспериментов 23
4.2. Наборы данных 24
4.3. Результаты экспериментов 25
ЗАКЛЮЧЕНИЕ 27
ЛИТЕРАТУРА 28

📖 Введение

Актуальность темы
В интеллектуальном анализе данных (Data Mining) большой интерес вызывают временные ряды. Данные, представленные в виде временных рядов, широко распространены во многих предметных областях: в науке (температура, влажность воздуха), экономике (ежедневные цены на акций, курсы валют), медицине (электрокардиограммы), биологии (ДНК), астрономии.
Поиск похожих подпоследовательностей во временном ряде часто используется как подпрограмма во многих задачах интеллектуального анализа временных рядов: обнаружении мотивов [12], классификации [1, 23], кластеризации [7]. Основной идеей задачи является нахождение к подпоследовательностей в заданном временном ряде, наиболее похожих на образец поиска.
Существуют области, в которых поиск похожих подпоследовательностей очень необходим, например, в мониторинге температуры, в медицине [13], в энтомологии [19], распознавании жестов и слов в рукописном тексте и др. Например, каждый день астрономы получают большое количество данных, измеренных с помощью антенной решетки. Поиск определенной последовательности в большой базе данных может помочь астрономам обнаружить типичные астрономические явления [4].
Схожесть двух подпоследовательностей определяет мера схожести. Среди десятков различных мер схожести, наилучшей мерой признана динамическая трансформация временной шкалы (Dynamic Time Warping, DTW) [5]. Однако классический расчет DTW трудоемок и сложен, из-за чего снижается эффективность алгоритмов, которые используют данную меру. Чтобы улучшить производительность алгоритмов на основе DTW, исследователями были предложены техники [3,5, 9, 13,15], которые ускоряют поиск самой похожей подпоследовательности. Однако вычисление расстояния DTW по-прежнему занимает слишком много времени, до 80 % всего времени поиска подобия [24]. Поэтому есть необходимость в распараллеливании DTW меры.
В связи с этим были предложены исследователями различные параллельные реализации данного алгоритма на таких вычислительных системах, как кластерах [16, 20], многоядерных процессорах [18], GPU [24], FPGA [15, 22]. Однако перечисленные реализации не могут быть перенесены на Intel Xeon Phi. Поэтому объектом исследования данной работы является процессор Intel Xeon Phi.
Использование процессоров Intel Xeon Phi - новая тенденция в разработке аппаратных средств для суперкомпьютеров. Intel Xeon Phi основан на архитектуре Intel Many Integrated Core (MIC), которая выполняет более одного триллиона операций в секунду (TFLOPS) с плавающей запятой. Процессор Intel Xeon Phi включает до 61 процессорных ядер, основанных на архитектуре x86 и соединенных высокопроизводительной встроенной кольцевой шиной. Каждое ядро содержит 512-битный блок векторных вычислений (vector processor unit, VPU), так что может обрабатывать 16 32битных целых чисел на каждом такте. Также Intel Xeon Phi поддерживает параллелизм уровня потоков для ускорения сложных вычислительных задач с использованием таких технологий параллельного программирования, как OpenMP, MPI.
Существует два поколения Intel Xeon Phi. Второе поколение Phi, Knights Landing (KNL) [17], отличается от первого поколения Phi, Knights Corner (KNC) [2], тем, что может выступать в качестве автономного процессора без центрального процессора. Данная работа является продолжением работ [11, 25], в которых представлена разработка поиска похожих подпоследовательностей в режиме offload, когда приложение запускается на хост-системе и некоторые вычислительно сложные участки программы выгружаются на сопроцессор Intel Xeon Phi (Knights Corner). Однако данная схема работы алгоритма слабо использует возможности векторизации Intel Xeon Phi и не применима для процессоров второго поколения Knights Landing, которые могут запускать программы только в native режиме.
В данной работе рассматривается случай, когда все данные размещаются в оперативой памяти Intel Xeon Phi. Данный случай является практически значимым во многих предметных областях, например, в энтомологии, распознавании речи и др.
Цель и задачи исследования
Целью данной выпускной квалификационной работы является разработка параллельного алгоритма поиска самой похожей подпоследовательности временного ряда для многоядерных процессоров Intel Xeon Phi (Knights Landing).
Для достижения поставленной цели необходимо было решить следующие задачи:
1) провести обзор параллельных алгоритмов поиска похожих подпоследовательностей временных рядов;
2) изучить аппаратную архитектуру и программную модель процессора Intel Xeon Phi (Knights Landing);
3) спроектировать и реализовать параллельный алгоритм поиска самой похожей подпоследовательности временного ряда для многоядерных процессоров Intel Xeon Phi (Knights Landing);
4) провести вычислительные эксперименты по анализу эффективности разработанного алгоритма.
Структура и объем работы
Работа состоит из введения, 4 глав, заключения и списка используемой литературы.
Объем работы составляет 31 страница, объем библиографии - 25 наименований.
Содержание работы
Первая глава, «Обзор работ по тематике исследования», содержит обзоры существующих параллельных алгоритмов поиска похожих подпоследовательностей во временном ряде для различных вычислительных систем. В каждом алгоритме выявлены плюсы и минусы.
Вторая глава, «Формальные обозначения и постановка задачи», содержит формальные определения и обозначения, описание задачи поиска самой похожей подпоследовательности во временном ряде. Приведены техники ускорения поиска самой похожей подпоследовательности, и описан последовательный алгоритм UCR-DTW, на основе которого разработан параллельный алгоритм.
Третья глава, «Параллельный алгоритм phiBestMatch», содержит детальное описание разработанного параллельного алгоритма для многоядерного процессора Intel Xeon Phi.
В четвертой главе, «Вычислительные эксперименты», приведены результаты вычислительных экспериментов по исследованию предложенного алгоритма.
В заключении приведены основные итоги проделанной работы.

✅ Заключение

Данная выпускная квалификационная работа была посвящена разработке параллельного алгоритма поиска самой похожей подпоследовательности временного ряда для многоядерных процессоров Intel Xeon Phi (Knights Landing).
В ходе выполнения работы были получены следующие основные результаты:
1) проведен обзор параллельных алгоритмов поиска похожих подпоследовательностей временных рядов на различных вычислительных системах;
2) изучена аппаратная архитектура и программная модель процессора Intel Xeon Phi (Knights Landing);
3) спроектирован и реализован параллельный алгоритм поиска самой похожей подпоследовательности временного ряда для многоядерных процессоров Intel Xeon Phi (Knights Landing);
4) проведены вычислительные эксперименты на реальных и синтетических данных, показавшие хорошую масштабируемость разработанного алгоритма.
В ходе выпускной квалификационной работы были сделаны доклады на 71-ой студенческой научной конференции ЮУрГУ и XIII Уральской выставке НТТМ «Евразийские ворота России - Шаг в будущее».
В рамках выпускной работы была подана статья на XX международную конференцию «Data Analytics and Management in Data Intensive Domains 2018».

Нужна своя уникальная работа?

Срочная разработка под ваши требования

Рассчитать стоимость

ИЛИ

Поиск аналога

📕 Список литературы

1. Athitsos V Approximate embedding-based subsequence matching of time series. / V Athitsos, P. Papapetrou, M. Potamias, G. Kollios,
D. Gunopulos. // Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2008, Vancouver, BC, Canada, June 10-12, 2008. - 2008. - P 365-378. - URL: http://doi.acm.org/10.1145/1376616.1376656.
2. Chrysos G. Intel® Xeon Phi coprocessor (codename Knights Corner). // 2012 IEEE Hot Chips 24th Symposium (HCS), Cupertino, CA, USA, August 27-29, 2012. - 2012. - P 1-31.
3. Fu A.W. Scaling and time warping in time series querying. /
A.W. Fu, E.J. Keogh, L.Y.H. Lau, C.A. Ratanamahatana, R.C. Wong. // VLDB J. - 2008. - Vol. 17. - No. 4. - P 899-921. - URL: https://doi.org/10.1007/s00778-006-0040-z.
4. Huang S. DTW-Based Subsequence Similarity Search on AMD Heterogeneous Computing Platform. / S. Huang, G. Dai, Y. Sun, Z. Wang, Y. Wang, et al. // 10th IEEE International Conference on High Performance Computing and Communications & 2013 IEEE International Conference on Embedded and Ubiquitous Computing, HPCC/EUC 2013, Zhangjiajie, China, November 13-15, 2013. - 2013. - P 1054-1063. - URL: https://doi.org/10.1109/HPCC.and.EUC.2013.149.
5. Hui D. Querying and Mining of Time Series Data: Experimental Comparison of Representations and Distance Measures. / D. Hui, T. Goce,
S. Peter, W. Xiaoyue, K. Eamonn. // Proceedings of the VLDB Endowment. - 2008. - Vol. 1. - No. 2. - P 1542-1552. - URL: http://dx.doi.org/10.14778/1454159.1454226.
6. Jeffers J., Reinders J. Intel Xeon Phi Coprocessor High Performance Programming. 1st ed. - San Francisco, CA, USA : Morgan Kaufmann Publishers Inc., 2013.
7. Keogh E., Lin J. Clustering of time-series subsequences is meaningless: implications for previous and future research. // Knowledge and Information Systems. - 2005. - Aug. - Vol. 8. - No. 2. - P. 154-177. - URL: https://doi.org/10.1007/s10115-004-0172-7.
8. Keogh E.J., Ratanamahatana C.A. Exact indexing of dynamic time warping. //Knowl. Inf. Syst. - 2005. - Vol. 7. - No. 3. - P 358-386. - URL: http://www.springerlink.com/index/10.1007/s10115-004-0154-9.
9. Kim S., Park S., Chu W.W. An Index-Based Approach for Similarity Search Supporting Time Warping in Large Sequence Databases. // Proceedings of the 17th International Conference on Data Engineering, April 2-6, 2001, Heidelberg, Germany. - 2001. - P 607-614. - URL: https://doi.org/10.1109/ICDE.2001.914875.
10. Lemire D. Faster Retrieval with a Two-pass Dynamic-time-warping Lower Bound. // Pattern Recogn. - 2009. - Vol. 42. - No. 9. -
P 2169-2180. - URL: http://dx.doi.org/10.1016Zj.patcog.2008.11.030.
11. Movchan A., Zymbler M.L. Time Series Subsequence Similarity Search Under Dynamic Time Warping Distance on the Intel Many-core Accelerators. // Similarity Search and Applications - 8th International Conference, SISAP 2015, Glasgow, UK, October 12-14, 2015, Proceedings. - 2015. - P 295-306. - URL: https://doi.org/10.1007/978-3-319-25087-8_28.
12. Mueen A., Keogh E.J., Shamlo N.B. Finding Time Series Motifs in Disk-Resident Data. // ICDM 2009, The Ninth IEEE International Conference on Data Mining, Miami, Florida, USA, 6-9 December 2009. - 2009. -
P 367-376. - URL: https://doi.org/10.1109/ICDM.2009.15.
13. Rakthanmanon T. Searching and mining trillions of time series subsequences under dynamic time warping. / T. Rakthanmanon,
B.J.L. Campana, A. Mueen, G.E.A.P.A. Batista, M.B. Westover, et al. // The 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD’12, Beijing, China, August 12-16, 2012. - 2012. - P 262-270. - URL: http://doi.acm.org/10.1145/2339530.2339576.
14. Sakoe H., Chiba S. Readings in Speech Recognition. / Ed. by A. Waibel, K.F. Lee. - San Francisco, CA, USA : Morgan Kaufmann Publishers Inc., 1990. - P 159-165. - URL: http://dl.acm.org/citation.cfm7idM08235.108244.
15. Sart D. Accelerating Dynamic Time Warping Subsequence Search with GPUs and FPGAs. / D. Sart, A. Mueen, W.A. Najjar, E.J. Keogh,
V. Niennattrakul. // ICDM 2010, The 10th IEEE International Conference on Data Mining, Sydney, Australia, 14-17 December 2010. - 2010. - P 1001-1006. -
...25

🖼 Скриншоты

Содержание выпускной квалификационной работы

🛒 Оформить заказ

⚡ Работу высылаем в течении 5 минут после оплаты.

Имя

E-mail

Телефон

Дополнительная информация

С условиями приобретения работы согласен

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить ⬆️

Оценка стоимости

Предмет *

Тип работы *

Объем работы *

Срок выполнения *

Это краткая форма заказа. После ее заполнения вы перейдете на полную форму заказа работы

Каталог работ (209042)

Статьи

»» Все статьи

Вход в личный кабинет