Особенности применения технологий машинного обучения при моделировании геологических систем, прогнозировании в поиске месторождений полезных ископаемых
ВВЕДЕНИЕ 3
1 ГЛАВА. ТЕОРИТИЧЕСКИЕ ОСНОВЫ МАШИННОГО ОБУЧЕНИЯ 6
1.1 Основные понятия о машинном обучении 7
1.2 Типы реальных данных и способы их использования 10
1.2.1 Категории алгоритмов машинного обучения 12
1.2.2 Задачи и алгоритмы машинного обучения 15
1.2.3 Различие между алгоритмами кластеризации 18
1.3 Сферы использования машинного обучения 20
1.3.1 Машинное обучение в геологии 21
1.3.2 Преимущества машинного обучения (самообучающихся алгоритмов) 23
1.3.3 Недостатки и сложности машинного обучения 25
1.4 Пути развития технологий машинного обучения в поисках полезных ископаемых 27
2 ГЛАВА. ГЕОЛОГИЯ КАЙЭНМЫВААМСКОГО РУДОПРОЯВЛЕНИЯ 29
2.1 Физико-географические сведения о районе исследований 30
2.2 Рудопроявление Кайэнмываам 32
2.3 Магматизм и метаморфизм Кайэнмываам 35
2.4 Условия формирования золото-серебряной эпитермальной минерализации 37
2.5 Вмещающие породы Кайэнмываам 38
3 ГЛАВА. МЕТОДИКА СЕТИ КОХОНЕНА И СТАТИСТИЧЕСКИХ МЕТОДОВ ОБРАБОТКИ ГЕОХОМИЧЕСКИХ ДАННЫХ 41
3.1 Методика работы: Сеть Кохонена 42
3.1.1 Практическое применение сети Кохонена для моделирования геохимических данных 46
3.2 Статистический метод обработки геохимических данных 50
3.3 Интерпретация и сравнение полученных результатов на основе двух методов 57
ЗАКЛЮЧЕНИЕ 68
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 69
Приложение 1 74
Приложение 2 75
Приложение 3 76
Актуальность.
В условиях растущей конкуренции и уменьшения количества доступных месторождений, применение технологий машинного обучения может стать важным фактором для оптимизации производственных процессов и повышения эффективности поиска, моделировании и прогнозировании месторождений полезных ископаемых. Использование машинного обучения позволит сократить время, затрачиваемое на анализ и обработку больших объемов данных. Кроме того, применение технологий машинного обучения может помочь выявить неочевидные закономерности в геологических данных.
Цель.
Целью магистерской диссертационной работы является создание оптимизированного алгоритма, на основе самоорганизующихся карт Сети Кохонена для обработки геохимических данных.
Задачи:
1. Изучить актуальные направления применения технологий обработки больших данных (Big Data), машинного обучения (Machine Learning), глубокого обучения (Deep Learning), а также рассмотреть современные методы хранения больших объемов данных.
2. Исследовать применение методов машинного обучения в геологии и других отраслях, проанализировать опыт применения этих методов и оценить их эффективность.
3. Выполнить многомерный статистический анализ и выделить перспективные зоны на участке.
4. Обработать полученные данные с помощью алгоритма кластеризации - сети Кохонена для выявления особенностей распределения полезных ископаемых и прогнозирования месторождений.
5. Сравнить результаты, полученные с помощью искусственных нейронных сетей (ИНС), с данными, полученными с помощью статистических методов, и оценить точность прогнозирования месторождений.
6.Описать алгоритм кластеризации - сети Кохонена, используемый в данной работе, с приведением подробных формул и описаний.
Объект исследования.
Объектом исследования является участок Кайэнмываам расположен в пределах Центрально-Чукотского сектора Охотско-Чукотского вулканогенного пояса и имеет размеры 20 на 53 км. Для изучения геохимических характеристик данного участка были собраны и проанализированы геохимические пробы методом индуктивно-связанной плазмы с использованием масс-спектрометрии.
Фактический материал.
Фактическим материалом, полученным в ходе исследования, являются данные Масс- спектрометрия с индуктивно-связанной плазмой. Также использовались карты предшественников для получения дополнительных данных об изучаемом участке.
Методика исследования.
Методика исследования включает в себя многомерный статистический анализ и машинное обучение на основе алгоритма кластеризации сети Кохонена, которые были применены для обработки и анализа геохимических данных и поиска возможных признаков наличия эпитермальных золото-серебряных месторождений на участке.
Предмет исследования.
Являются алгоритмы машинного обучения, в частности, сети Кохонена, которые будут использованы для интерпретации данных и создания точных и геологически значимых прогнозов.
Практическая значимость исследования.
Практическая значимость исследования заключается в потенциале повышения эффективности и точности геологического моделирования, прогнозирования и разведки месторождений полезных ископаемых. Используя алгоритмы машинного обучения, можно лучше понять геологические процессы и делать прогнозы с более высокой точностью. Результаты этого исследования могут привести к принятию более обоснованных решений в горнодобывающей промышленности, что имеет решающее значение для устойчивого управления ресурсами и экономического роста. Кроме того, применение машинного обучения в геологии может служить моделью для применения этих технологий в смежных областях.
Алгоритмы машинного обучения предназначены для точного и эффективного прогнозирования многомерных данных. Данные предоставляются аналитикам для моделирования и прогнозирования взаимодействия между данными и изучаемыми объектами. Таким образом, анализ больших объемов разрозненных, многомерных, геопространственных данных с использованием алгоритмов машинного обучения открывает большие перспективы для промышленности и исследований в области наук о Земле.
В данной работе я тестирую новый подход к интерпретации данных при помощи алгоритмов машинного обучения. Работа выполняется на основе геохимических данных полученных с перспективного участка золото-серебряной минерализации на территории Чукотского вулканического пояса. Практическое применение алгоритмов машинного обучения требует реализации трех ключевых этапов: предварительная обработка данных; обучение алгоритму; и оценка прогноза. Эта методология обеспечивает основу для создания точных и геологически значимых прогнозов с минимальным вмешательством пользователя...
В работе была рассмотрена проблема прогнозирования месторождений полезных ископаемых, и были описаны основные этапы геологического моделирования и поиска месторождений.
Были проанализированы существующие методы обработки геохимических данных и использованы стандартные статистические методы для их обработки.
Для решения задачи кластеризации геохимических данных была использована сеть Кохонена, которая позволяет определить закономерности в данных и классифицировать их по категориям.
Были проведены эксперименты с использованием различных параметров сети Кохонена и геохимических данных для оценки качества моделирования.
Результаты экспериментов показали, что сеть Кохонена может успешно использоваться для кластеризации геохимических данных и предсказания месторождений полезных ископаемых.
Были предложены рекомендации по улучшению качества моделирования, включая использование дополнительных данных и уточнение параметров сети Кохонена.
Таким образом, результаты исследования подтверждают эффективность применения сети Кохонена и стандартных статистических методов при моделировании геологических систем, прогнозировании и поиске месторождений полезных ископаемых. Однако, для улучшения точности прогнозирования необходимо проводить дополнительные исследования и использовать дополнительные данные.
1. A density-based algorithm for discovering clusters in large spatial databases with noise / M. Ester et al. // In Kdd. - 1996. - Vol. 96, №. 34. - P. 226-231.
2. Active learning of rock typing models from multiscale measurements / Y. Zhao // IEEE Transactions on Geoscience and Remote Sensing. - 2018. - № 56(5). - P. 2994-3004.
3. Bishop C. M. Pattern Recognition and Machine Learning / C. M. Bishop. Information Science and Statistics. - 2nd ed. Springer, 2006. - 758 p.
4. Cao L. Data science: a comprehensive overview / L. Cao // ACM Comput Surv (CSUR). - 2017. -. № 50(3):43. -P. 1-40
5. Data mining: concepts and techniques / Han J et al. -3th ed. -Amsterdam: Elsevier, 2011. - 740 p.
6. Friedman J. H. Greedy function approximation: a gradient boosting machine / J. H. Friedman // Annals of Statistics. - 2001. - № 29(5). - P. 1189-1232.
7. Haykin S. Neural networks: a comprehensive foundation / S. Haykin, Pearson. - 2nd ed. Prentice Hall, 1999. - 842p.
8. Iqbal H. Machine Learning: Algorithms, Real World Applications and Research Directions / H. Iqbal, S.N. Sarker// Computer Science. - 2021. - P. 4.
9. Jing M. Application of machine learning in predicting coal and gas outburst danger: a review / M. Jing, Z. Chong // Journal of Natural Gas Science and Engineering. - 2020. -№ 103329. - P.78.
10. Jurafsky D. Speech and language processing. An introduction to natural language processing, computational linguistics, and speech recognition / Jurafsky D. et al. -3rd ed. Prentice Hall, 2019. -636 p.
11. Kaelbling L. P. Reinforcement learning: a survey / L.P. Kaelbling, M.L. Littman, A.W. Moore// J Artif Intell Res. - 1996. - № 4:237. - P. 85.
12. Kohonen T. Self-organized formation of topologically correct feature maps / T. Kohonen // Biological cybernetics. - 1982. - № 43(1), - P. 59-69.
13. Kohonen, T. Self-organizing maps / T. Kohonen. // Springer-Verlag, 1995. - P. 7-12
14. Kohonen, T. The self-organizing map / T. Kohonen. // Proceedings of the IEEE. - 1990. - № 78(9). - P. 1464-1480.
15. Levitt J. Using Surfer Software in Geomorphology / J. Levitt // In Geomorphological Techniques. - Springer, Dordrecht. - 2014. - P. 177-189...(59)