Введение 3
1. Теоретике - методологические основы интерполяции и программно -
аппаратных архитектур параллельных вычислений в недропользовании 9
1.1. Пространственная интерполяция геоданных 9
1.2. Методы пространственной интерполяции 13
1.3. Идея распараллеливания алгоритмов интерполяции в системах
недропользования 20
2. Анализ существующих методов и инструментов для параллельных вычислений пространственной интерполяции в системе недропользования. 28
2.1. Ускоренный алгоритм интерполяции с адаптивным обратным расстояниям с применением параллельных технологий 28
2.2. Параллельные технологии в алгоритме интерполяции Кригинга.. 37
2.3. Определение принципов универсального алгоритма пространственной интерполяции Кригинга 44
3. Разработка алгоритма интерполяции на основе OpenCL 54
3.1. Определение путей интеграции с OpenCL для проведения гетерогенных вычислений 54
3.2. Реализация алгоритма последовательного универсального Кригинга. Разработка кода для стандарта разработки приложений OpenCL 63
3.3. Апробация программно - алгоритмического обеспечения систем недропользования 69
Заключение 79
Список использованных источников 82
Приложения 88
В цепи операций, включающей этапы от анализа исходных данных опробования до принятия решений, выполняются многочисленные расчеты в циклах статистической обработки первичных данных, интерполяции, оптимизации и планирования добычи, что требует значительных вычислительных мощностей. В этой связи, задача ускорения расчетов за счет распараллеливания вычислений на многоядерных компьютерах и GPU с интеграцией программных решений в программном коде системы моделирования недропользования является весьма актуальной.
Типичные примеры методов, основанные на геостатистических концепциях (Кригинг), локальность (ближайший сосед и конечные элементные методы), гладкость и напряжение (сплайны) или специальные функциональные формы (полиномы, мульти - полиномы). Выбор дополнительного условия зависит от характера моделируемого явления и типа применения.
Поиск подходящих методов интерполяции для задач географических информационных систем предполагает несколько проблем. Моделируемые объекты, как правило, очень сложны, пространственные данные неоднородны и часто основаны на оптимальной выборке и значительном шуме, также могут присутствовать разрывы. Кроме того, наборы данных очень большие.
Исходя из различных источников с различной точностью, надежные инструменты интерполяции, подходящие для ГИС-приложений, должны удовлетворять нескольким важным требованиям:
• точность и прогностическую мощность,
• надежность и гибкость в описании различных типов явлений,
• сглаживание для шумных данных,
• n-мерная формулировка,
• непосредственная оценка производных (градиенты, кривизна),
• применимость к крупным наборов данных,
• вычислительной эффективности и простоты использования.
В настоящее время трудно найти способ, который выполняет все вышеупомянутые требования для широкого диапазона данных с привязкой. Следовательно, выбор адекватного метода с соответствующими параметрами для конкретного приложения имеют решающее значение. Различные методы могут давать совершенно разные пространственные представления. Детальное знание всех нюансов горной добычи, а также опыт накопленный людьми необходимы для оценки метода и выбора самого точного и близкого к реальности. Использование непригодного метода или неуместных параметров могут привести к искаженной модели карьера, что приведет к потенциально неправильным решениям при добычи полезных ископаемых основанной на вводящей в заблуждение пространственной информации.
Неуместная интерполяция может иметь еще больше последствий, если результат используется как вход для симуляции, где небольшая ошибка или искажение могут создавать модели для основанные на ложных пространственных шаблонах.
Проблема исследования заключается в использовании эффективных технологий параллельного программирования, которые появились относительно недавно и еще не нашли широкого применения, для обработки больших объемов данных по методам пространственной интерполяции. Традиционно используемые библиотеки не используют параллельные технологии. Решение этой проблемы обозначило новый фронт работ.
Актуальность решения проблемы для науки и практики информационных систем недропользования состоит в решении задач текущего и стратегического планирования добычи и выполнения оперативного подсчета запасов сырья. При эксплуатации месторождений полезных ископаемых строятся масштабные сеточные и блочные горно-геологические модели.
Цель исследования состоит в том, чтобы повысить эффективность и быстродействие (производительность) систем управления запасами горнорудных предприятий при добыче и переработке путем интеграции новых технологий параллельного программирования в методы пространственной интерполяции.
Выдвижение данной цели обусловило постановку следующих исследовательских задач:
1. Рассмотреть процесс пространственной интерполяции в системах недропользования, определить механизмы реализации интерполяции и методы оценки ее эффективности;
2. Изучить два наиболее используемых в современной науке и практике метода пространственной интерполяции - метод обратных взвешенных расстояний и метод Кригинга;
3. Изучить возможности программно-аппаратных архитектур параллельного программирования OpenCL и CUDA;
4. Провести анализ методов интерполяции и обозначить подходы, принципы интеграции технологий параллельного программирования ;
5. Исследовать возможность применения технологий параллельного программирования для создания механизма увеличения производительности алгоритмов интерполяции при обработке больших данных;
6. Выполнить проектирование и реализацию алгоритма пространственной интерполяции Кригинга с применением технологии параллельного программирования;
7. Разработать программный код OpenCL для метода пространственной интерполяции Кригинга;
8. Проанализировать результаты выполненной работы и сделать выводы.
Предметом исследования является процесс распараллеливания алгоритмов интерполяции с целью повысить быстродействия. Объектом исследования являются методы моделирования карьеров.
Гипотеза исследования заключается в решении проблемы увеличения быстродействия путем внедрения технологий параллельного
программирования, которая использовала бы вычислительные ресурсы центрального процессора совместно с графическим. Классические методы осуществления распараллеливании программ на центральных процессорах не учитывают все нюансы работы с памятью графических процессоров. Поэтому возможность объединения вычислительных ресурсов центрального и графического процессора сможет дать увеличение производительности существующих алгоритмов. Кроме того, обладая кроссплатформенностью такая реализация сможет с легкостью портироваться на различные вариации платформ и аппаратных устройств.
Теоретико-методологическая основа исследования базируется на работах отечественных специалистов Васильева П.В., Петина А.Н., Каневского М.Ф., Демьянова В.В., а также на многочисленных научных работах западных специалистов Fang Huang, Shuanshuan Bu, Jian Tao, Xicheng Tan, Gisele Goulart Tavaresa, Leonardo Goliatta, Marcelo Lobosco и многих других ученых. Список научных трудов всех специалистов представлен в советующем разделе выпускной квалификационной работы, который называется «список используемой литературы».
Эмпирическую базу исследования составили результаты экспериментов на центральном процессоре от Intel и графических процессорах от NVIDIA и AMD, а также на центральных процессорах от Intel. Исходные данные были взяты с сайта http://github.com.
Научная новизна: впервые на основе анализа существующих примеров использования параллельных технологий был спроектирован и реализован алгоритм пространственной интерполяции Кригинга для обработки больших данных, который обладает кроссплатформенностью, одновременном использовании на разного рода процессорах и может быть встроен в системы подсчета запасов полезных ископаемых.
Научно-практическая значимость исследования. Материалы исследования, а также его общие выводы свидетельствуют о возможности использования технологий параллельного программирования в методах пространственной интерполяции для гетерогенных систем недропользования.
Материал, представленный в диссертации, может быть использован при преподавании и изучении ряда дисциплин посвященным математике и компьютерным наукам: геостатистика, компьютерное и математическое моделирование, вариационные и дифференциальные вычисления, математическая статистика, параллельное программирование.
Практическое значение диссертационного исследования заключено в возможности разработки библиотек для существующих приложений обработки и анализа запасов месторождений. Библиотеки, основанные на научных исследованиях и практической реализации пространственной интерполяции, которые приведены в выпускной квалификационной работе, позволят горнодобывающим предприятиям оптимизировать свою работу на этапах анализа и проектирования с точки зрения экономики, рабочего времени и использования ресурсов организации.
Структура диссертации состоит из введения, трех глав, каждая глава имеет три раздела и общий вывод, в которых решаются поставленные исследовательские задачи, заключения, списка источников и литературы, а также приложений, необходимо дополняющих основной текст.
Первая глава посвящена изучению теоретико - методологическим основам пространственной интерполяции и программно - аппаратным архитектурам параллельных вычислений. Так же собраны идеи и уже существующие на данный момент современные системы, в которых применена концепция распараллеливания методов пространственной
интерполяции.
Во второй главе проведен анализ двух методов пространственной интерполяции, к которым была применена технология параллельных вычислений OpenCL. На основе этих разработок происходит планирование разработки алгоритма пространственной интерполяции Кригинга для гетерогенных систем недропользования на основе технологии параллельных вычислений OpenCL.
В третьей главе приведено развернутое описание реализации последовательного универсального алгоритма пространственной
интерполяции Кригинга на кроссплатформенном стандарте OpenCL. Представлены сведения о проведенных исследовательских экспериментах с использованием аппаратных возможностей центрального вычислительного процессора Intel Xeon Phi, графических процессорах NVIDA GeForce 1080Ti и AMD Radeon RX 580.
В ходе исследования в выпускной квалификационной работе изучена возможность увеличения эффективности и быстродействия
(производительности) систем управления запасами горнорудных предприятий при добыче и переработке путем интеграции новых технологий параллельного программирования в методы пространственной интерполяции.
В некоторых цифровых инженерных приложениях для обработки и анализа больших объемов данных требуются алгоритмы пространственной интерполяции. В этом исследовании изучено проектирование и реализация алгоритма параллельной универсальной пространственной интерполяции Кригинга с использованием модуля программирования OpenCL на гетерогенных вычислительных платформах для массивной обработки геопространственных данных. В этом исследовании основное внимание уделяется преобразованию точек в последовательных алгоритмах, т.е. универсальной функции интерполяции Кригинга, в соответствующую функцию ядра в OpenCL. Также используются методы распараллеливания и оптимизации в реализации для улучшения производительности кода. Наконец, на основе результатов экспериментов, выполненных на двух разных высокопроизводительных гетерогенных платформах, то есть с графической системой NVIDIA, AMD и системой Intel Xeon Phi, показано, что алгоритм параллельного универсального Кригинга может достичь наивысшего ускорения в 4 раза на единичных вычислительных устройствах и ускорения в 8 раз с несколькими устройствами.
Результаты данного исследования можно свести к следующим основным положениям:
1. Применение технологий параллельного программирования к существующим алгоритмам пространственной интерполяции положительно влияет на быстродействие в процессах анализа и подсчета запасов полезных ископаемых;
2. Анализируя практические результаты можно понять, что полученное ускорение вычислений получилось далеко не идеальным. Оно не сможет тотально уменьшить время построения графических моделей, однако, рассматривая процесс интерполяции отдельно, ускорение в 8 раз можно считать отличным результатом;
3. Объединение вычислительных ресурсов центрального и графического процессоров в единые гетерогенные платформы экономически выгодное решение для предприятий. Использование по максимуму имеющихся аппаратных ресурсов без состояния простоя позволяет быстрее получать обработанные итоговые данные. Такая концепция развития предприятий в целом сможет существенно уменьшить этап вычислений и анализа в планировании горно-добывательных работ;
4. Этап компьютерного моделирования, а именно графическая обработки и визуализация, не затронуты данным исследованием. Основная задача была в произведении расчетов без графической обработки, но использование гетерогенных систем для визуализации сможет также ускорить этот процесс. Обработка изображений как правило ведется только на процессорах графических карт и зачастую число кадров в секунду проседает при развертывании крупномасштабных моделей. Использование центральных процессоров также повысит плавность графики и построения большей детализации.
Данные результаты исследования позволили сделать и обосновать следующие проектно-практические рекомендации:
1. Для использования описанных в выпускной квалификационной работе технологий и практического их применения следует подробно изучить все нюансы и специфику как самих методов пространственной интерполяции, так и технологий параллельного программирования OpenCL и CUDA;
2. Специалистам, занимающихся анализом и обработкой проб месторождений полезных ископаемых, которые выполняют данные работы находясь на аутсорсинге или в целях научных исследований, чтобы достичь результатов необходимо обладать достаточно мощными аппаратными ресурсами для сложных вычислений;
3. Исследования дают возможности масштабирования и кроссплатформенной разработки при условии, что будут соблюдены особенности интеграции в системы недропользования.
Перспективы исследования данной проблемы состоят в том, что современная горнодобывающая промышленность Российской Федерации не использует все имеющиеся новейшие технологии для экономической оптимизации процесса добычи. Мощнейшие ресурсы, которыми обладают ГОКи, как показывает практика, не дают ощутимого результата при обработке и анализе проб, потому как используются обособлено. Гетерогенные системы позволят выявить экономическую выгоду и сократить простой как оборудования, так и человеческих рабочих ресурсов. Научные исследования методов интерполяции с точки зрения параллельного программирования смогут обеспечить импульс к экономическому прорыву в области недропользовании. Оптимальное освоение огромных запасов полезных ископаемых, сосредоточенных на территории государства, глобально влияет на экономику Российской Федерации, которая добывает 18% сырья во всей мировой экономике. По оценкам экспертов страна обладает неосвоенными ресурсами на 2000 трлн. рублей.
Таким образом, поставленная во введении цель исследования в выпускной квалификационной работе достигнута, а исследовательские задачи выполнены. Их выполнение в итоге подтвердило и гипотезу о решении проблемы увеличения быстродействия путем внедрения технологий параллельного программирования, которая использовала бы вычислительные ресурсы центрального процессора совместно с графическим.
1. Li, J. Обзор пространственных методов интерполяции для ученых- экологов; Geoscience Australia: Канберра , Австралия, 2008.
2. Майерс, DE; Бегович К.Л. Буц, TR; Кейн, В. Е. Вариограммы для геохимических данных подземных вод. Математика Геол. 1982, 14, 629-644. [ CrossRef ]
3. Ozelkan, E .; Chen, G .; Устундаг, Б. Б. Пространственная оценка скорости ветра: новая интегративная модель с использованием коэффициента обратного расстояния и степенного закона. Int J Digit Earth. 2016. [ CrossRef ]
4. Bhattacharjee, S .; Mitra, P .; Ghosh, SK Spat ial интерполяция для прогнозирования отсутствующих атрибутов в ГИС с использованием семантического кригинга. IEEE Ttrans. Geosci. Удаленный датчик. 2014, 52, 4771-4780. [ CrossRef ]
5. Rossi, RE; Дунган, Дж. Beck, LR Кригинг в тени: геостатистическая интерполяция для дистанционного зондирования. Удаленный датчик. 1994, 49, 32-40. [ CrossRef ]
6. Zhang, X .; Jiang, H .; Zhou, G .; Xiao, Z .; Чжан, З. Геостатистическая интерполяция отсутствующих данных и уменьшение масштаба пространственного разрешения для концентрации зондовых концентраций метана в дистанционном зондировании. Int. J. Remote Sens., 2012, 33, 120-134. [ CrossRef ]
7. Carr, JR; Deng, ED; Применение дизъюнктивного кригинга для оценки земного землетрясения. Математика Геол. 1986, 18, 197-213. [CrossRef]
8. Dag, A .; Ozdemir, AC. Сравнительное исследование трехмерного поверхностного моделирования угольного месторождения с помощью пространственных интерполяционных подходов. Resour. Геол. 2013, 63, 394¬403. [ CrossRef ]
9. Рид, П .; Минскер, Б .; Valocchi, AJ C ost-эффективный долгосрочный мониторинг подземных вод с использованием генетического алгоритма и глобальной массовой интерполяции. Water Resour Res. Водный ресурс. Местожительство 2000, 36, 3731-3741. [ CrossRef ]
10. Cressie, N .; Kang, EL Цифровое почвенное картографирование высокого разрешения: кригинг для очень больших наборов данных. В проксимальном почве; Springer: Dordrecht, Нидерланды, 2010; С. 49-63.
11. Kao, CS Автоматизированная интерполяция двумерных сейсмических сеток в объем трехмерных данных. G eophysics 1990, 55, 433¬442. [ CrossRef ]
12. Sahlin, J .; Мостафави, Массачусетс; Forest, A .; Бабин М. Оценка трехмерных пространственных методов интерполяции для изучения морской пелагической среды. Мар. Геоды. 2014, 37, 238-266. [ CrossRef ]
13. Loubier, JC Оптимизация интерполяции температур с помощью
ГИС: подход к пространственному анализу. В пространственной
интерполяции для климатических данных; ISTE: Лондон, Великобритания, 2010; С. 97-107.
14. Ch ang, CL; Lo, SL; Ю., SL Оптимизация параметров методом обратного расстояния по генетическому алгоритму для оценки осадков. Environ. Монит. Оценка. 2006, 117, 145-155. [ CrossRef ] [ PubMed ]
15. Джеффри, SJ; Картер, Джо; Moodie, KB; Beswick, AR Использование пространственной интерполяции для построения всеобъемлющего архива австралийских климатических данных. Environ. Модель. Softw. 2001, 16, 309-330. [ CrossRef ]
16. Huang, F .; Liu, D .; Tan, X .; Wang, J .; Chen, Y .; Он, B. Исследования реализации параллельного алгоритма интерполяции IDW в параллельной ГИС на базе кластера Linux. Вычи. Geosci. 2011, 37, 426-434. [ CrossRef ]
17. Cressie, N .; Johannesson, G. Исправлен кригинг для очень больших пространственных наборов данных. JR Stati. Soc. 2008, 70, 209-226. [CrossRef]
18. Ingram, B .; Dan, C. Параллельная геостатистика для редких и плотных наборов данных. Quant. Геол. Geostat. 2010, 16, 371-381.
19. Армстронг, депутат; Марчиано, Р. Массовая параллельная обработка пространственных статистик. Int. J. Geogr. Inf. Sci. 1995, 9, 169-189. [ CrossRef ]
20. Gajraj, A.; Joubert, W .; Джонс, Дж. Параллельная реализация
Кригинга с трендом. Доступно в Интернете:
http://www.osti.gov/scitech/servlets/purl/544698-DhOroO/webviewable/ (доступ к нему осуществляется 10 июня 2017 года).
21. Hawick, KA; Coddington, PD; James, HA Распределенные структуры и параллельные алгоритмы обработки крупномасштабных географических данных. Parall. Вычи. 2003, 29, 1297-1333. [ CrossRef ]
22. Гуань, Х .; Wu, H. Использование мощностей многоядерных платформ для крупномасштабной обработки геопространственных данных: например, генерация DEM из массивных облачных точек LiDAR. Вычи. Geosci. 2010, 36, 1276-1282. [ CrossRef ]
23. Wang, S .; Армстронг, МП. Квадтритный подход к декомпозиции домена для пространственной интерполяции в средах грид-вычислений. Parall. Вычи. 2003, 29, 1481-1504. [ CrossRef ]
24. Керри, KE; Hawick, KA Kriging для высокопроизводительных компьютеров. В высокопроизводительных вычислениях и в сети; Springer: Берлин, Германия, 1998; С. 429-438.
25. Педели, Дж. А.; Morisette, JT; Smith, JA; Schnase, JL; Crosier, CS;
Stohlgren, TJ Высокоэффективное геостатистическое моделирование биосферных ресурсов. Доступно в Интернете: h ttps:
//esto.nasa.gov/conferences/ estc2003 / doc/ A4P4 (Schnase) .pdf (доступ к 10 июня 2017 г.).
26. Валентины, GL; Lassonde, W .; Khan, SU; Min-Allah, N .; Madani, SA; Li , J; Zhang, L .; Wang, L .; Ghani, N .; Kolodziej, J. Обзор методов энергоэффективности в кластерных вычислительных системах. Cluster Comput. 2011, 16, 1-13. [ CrossRef ]
27. Strzelczyk, J .; Porzycka, S .; Лесняк А. Анализ наземных деформаций на основе параллельных геостатистических вычислений данных PSInSAR. В Трудах Международной конференции по геоинформатике, Fairfax, VA, США, 12-14 августа 2009 года; С. 195-206.
28. Li, J; Jiang, Y .; Yang, C .; Hua ng, Q .; Рис, М. Визуализация данных об окружающей среде 3D / 4D с использованием многоядерных графических процессоров (GPU) и многоядерных центральных процессоров (ЦП). Вычи. Geosci. 2013, 59, 78-89. [ CrossRef ]
29. Liu, P .; Юань, Т .; Ян, Массачусетс; Wang, L .; Liu, D .; Yue, S .; Колодзей, Дж. Параллельная обработка массивных изображений дистанционного зондирования в архитектуре графического процессора. Вычи. Поставить в известность. 2014, 33, 197-217.
30. Xue, W .; Yang, C .; Fu, H .; Wang, X .; Xu, Y .; Liao, J .; Gan, L .; Lu, Y .; R anjan, R .; Wang, L. Ультра-масштабируемое ускорение CPU-MIC мезомасштабного атмосферного моделирования на Tianhe-2. IEEE Trans. Вычи. 2015, 64, 2382-2393. [ CrossRef ]
31. Chen, D .; Li, D; Xiong, M .; Bao, H .; Li, X. GPGPU-
аннигилированный эмпирический режим разложения для анализа ЭЭГ во время анестезии. IEEE Trans. Inf. Technol. Biomed. 2010, 14, 1417-1427. [
CrossRef ] [ PubMed ]
32. Cheng, T. Ускорение универсального алгоритма интерполяции Кригинга с использованием графического процессора с поддержкой CUDA. Вычи. Geosci. 2013, 54,178-183. [ CrossRef ]
33. Heinecke, A.; Klemm, M .; Bungartz, HJ От GPGPU к многоядерному: NVIDIA Fermi и Intel много интегрированной основной архитектуры. Вычи. Sci. Eng. 2012, 14, 78-83. [ CrossRef ]
34. Wang, Y .; Deng, G .; Zhiliang, XU Оптимизация производительности для ускорения параллельных вычислений на основе MIC.
J. Shenzhen Inst. Inf. Technol. 2013,11, 87-93.
35. Gaster, B .; Howes, L .; Kaeli, DR; Mistry, P .; Schaa, D. Неоднородные вычисления с OpenCL; Морган Кауфманн: Берлингтон, Массачусетс, США, 2011.
36. Бартье, премьер-министр; Келлер, CP Многомерная интерполяция для включения тематических данных поверхности с использованием инверсного взвешивания расстояний (IDW). Вычи. Geosci. 1996,22,795-799. [CrossRef ]
37. Lindholm, E .; Nickolls, J .; Oberman, S .; Montrym, J. NVIDIA Tesla: Единая графическая и вычислительная архитектура. IEEE Micro 2008, 28, 39¬55. [ CrossRef ]
38. Duran, A .; Klemm, M. В Intel® много интегрированной архитектуры ядра. В материалах Международной конференции 2012 года по высокопроизводительным вычислениям и симуляции (HPCS), Мадрид, Испания, 2-6 июля 2012 года; pp. 365-366.
39. Камень, JE; Gohara, D .; Shi, G. OpenCL: Параллельный стандарт программирования для гетерогенных вычислительных систем. Вычи. Sci. Eng. 2010, 12, 66-73. [ CrossRef ] [ PubMed ]
40. Чилес, JP; Delfiner, P. Геостатистика: M odeling Пространственная неопределенность; John Wiley & Sons, Inc .: Нью-Йорк, Нью-Йорк, США, 2012.
41. Горшич, ди-джей; Гентон, М. Г. Выбор модели вариограммы с помощью оценки непараметрических производных. Математика Геол. 2000 , 32, 249-270. [ CrossRef ]
42. Альтман Н.С. Введение в ядро и непараметрическую регрессию ближайших соседей. Am. Стат. 1992, 46, 175-185.
43. Кирк, БД; Hwu, программирование WMW Массивно параллельные процессоры: практический подход; Морган Кауфманн: Берлингтон, Массачусетс, США, 2012.
44. Tsuchiyama, R .; Nakamura, T .; Lizuka, T .; Asahara, A.; Miki, S .; Tagawa, S. Книга программирования OpenCL; Корпорация Fixstars: Токио, Япония, 2010 год.