Тип работы:
Предмет:
Язык работы:


Кластеризация данных с использованием моделирования эволюционных вычислений

Работа №120287

Тип работы

Магистерская диссертация

Предмет

математическое моделирование

Объем работы70
Год сдачи2019
Стоимость5350 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
102
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
1 АНАЛИЗ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ ДАННЫХ 6
1.1 Сравнение алгоритмов кластеризации данных 6
1.2 Основные элементы задачи оптимизации 8
2 РАЗРАБОТКА ПРИНЦИПОВ КЛАСТЕРИЗАЦИИ ДАННЫХ НА ОСНОВЕ ЭВОЛЮЦИОННЫХ ВЫЧИСЛЕНИЙ 13
2.1 Анализ математического аппарата эволюционных вычислений 13
2.2 Функции для тестирования работы генетических алгоритмов 35
2.3 Результаты анализа принципов работы генетического алгоритма 41
2.4 Синтез алгоритма кластеризации на основе эволюционных вычислений 44
3 МОДЕЛИРОВАНИЕ АЛГОРИТМА КЛАСТЕРИЗАЦИИ 49
3.1 Программное моделирование предложенного алгоритма кластеризации 49
3.2 Вычислительный эксперимент 51
3.3 Обсуждение результатов 59
ЗАКЛЮЧЕНИЕ 60
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 62

Актуальность исследования определена необходимостью совершенствования алгоритмов кластеризации данных для повышения их точности работы.
Использование алгоритмов кластеризации данных связано с решением различных практических задач, таких, например, как сегментация изображения, которая связана с кластеризацией его составных элементов - пикселей. Другой пример - подготовка обучающей выборки при создании классификатора, которая связана с предварительной кластеризацией данных для оценки их состава.
Алгоритмы машинного обучения в настоящее время активно развиваются. К ним относятся генетические алгоритмы (подобласть - «обучение с подкреплением»). Однако в настоящее время не изучена возможность применения генетических алгоритмов для решения задач кластеризации данных.
Цель исследования - разработка способа кластеризации данных, основанного на применении эволюционных вычислений.
Объектом исследования является кластеризация данных, предметом исследования - разработка методики использования генетического алгоритма для кластеризации данных.
Гипотезой исследования является предположение, что генетические алгоритмы, предназначенные для решения задач оптимизации, можно адаптировать для выполнения кластеризации данных.
Поставленная цель достигалась путем последовательного решения следующих задач:
1. Проведение анализа состояния вопроса по теме исследования.
2. Разработка методики по использования генетического алгоритма для кластеризации данных.
3. Разработка программной реализации для моделирования работы генетического алгоритма, основанного на предложенных подходах.
4. Проведение вычислительных экспериментов для оценки эффективности применения генетического алгоритма при кластеризации данных.
Исследованиями в области совершенствования алгоритмов кластеризации занимаются такие современники как: Kanzawa Y., Bao L., Oshio S., Chaimontree S., Yan Q., Ryazanov V., LaPlante F., Handl J., Yang X., Araujo D., Aszalos L., Almutairi N., Zhang Y., Zhu Q., Jin H., Vega-Pons S., Bhattacharyya D., Daliri M., Castellani U., Boryczka U. и др.
В ходе выполнения работы применялись такие методы теоретического исследования, как изучение и анализ научной литературы по проблемам кластеризации данных и вопросам практического использования генетических алгоритмов.
Также в ходе выполнения работы применялись практические методы исследования, такие как проведение вычислительных экспериментов, обработка статистических данных, программное моделирование работы генетических алгоритмов.
Научная новизна исследования - доказано, что генетические алгоритмы можно адаптировать под решение задачи кластеризации данных. При этом возможность генетического алгоритма выходить из локальных решений позволяет получать кластерные структуры лучше (с точки зрения плотности), чем при использовании алгоритма k-means.
Практическая значимость работы заключается в разработке методики применения генетических алгоритмов для решения задач кластеризации данных.
Апробация результатов исследования проходила на базе V Международной научно-практической конференции (школы-семинара) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук».
На защиту выносятся:
1. Методика применения генетического алгоритма для кластеризации данных.
2. Результаты апробации предложенной методики.
В рамках написания магистерской диссертации были опубликованы следующие статьи:
1. Перспективы использования эволюционных вычислений при кластеризации данных [41].
2. Кластеризация изображения на основе оценки геометрической формы объектов [42].
В рамках выполнения магистерской диссертации разработано программное обеспечение для моделирования генетических алгоритмов и для кластеризации данных с использованием предложенных подходов. Результаты тестирование программного обеспечения показали состоятельность предложенной в диссертации методики кластеризации данных с использованием эволюционных вычислений.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


1. В обзор литературных источников по теме исследования позволил установить, что при решении практических задач из различных областей науки техники требуется выполнение кластеризации данных (например, при сегментации изображений кластеризации подвергаются его пиксели). По этой причине актуальной задачей остается развитие методов кластеризации данных.
2. Генетические алгоритмы предназначены для решения задач оптимизации. В исследовании предложены подходы, позволяющие представить задачу кластеризации, как задачу оптимизации кластерной структуры. Данные подходы включают в себя использования в качестве целевой функции сумму квадратов расстояний от объектов кластеризации до центра ближайшего кластера (при этом решается задача минимизации значения функции). В качестве входных параметров функции предложено использовать координаты центров кластеров. Данные подходы позволяют применять различные методы оптимизации, но уже для кластеризации данных.
3. Проведено исследования математического аппарата генетических алгоритмов, по результатам которого был сделан вывод о возможности его использования при кластеризации данных (раздел 2.3). Также произведен синтез конфигурации генетического алгоритма, направленный на решения задачи кластеризации данных (раздел 2.4).
4. Разработано программное обеспечение для моделирования генетических алгоритмов и для кластеризации данных с использованием предложенных подходов (раздел 3.1).
5. Для апробации предложенной конфигурации генетического алгоритма в рамках решения задачи кластеризации данных были проведены вычислительные эксперименты (раздел 3.2). Результаты экспериментов (см. раздел 3.3) показывают состоятельность предложенных подходов.
Основные результаты работы были доложены на V Международной научно-практической конференции (школы-семинара) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук».
Также в рамках написания магистерской диссертации были опубликованы следующие статьи:
1. Перспективы использования эволюционных вычислений при кластеризации данных [41].
2. Кластеризация изображения на основе оценки геометрической формы объектов [42].


1. Kanzawa, Y. On Bezdek-Type Possibilistic Clustering for Spherical Data, Its Kernelization, and Spectral Clustering [Text] / Yuchi Kanzawa // Approach International Conference on Modeling Decisions for Artificial Intelligence - 13th International Conference, MDAI 2016, Sant Julia de Loria, Andorra, September 19-21, 2016. Proceedings: Modeling Decisions for Artificial Intelligence. - Springer International Publishing Switzerland 2016. - pp. 178-190
2. Bao, L. Document Clustering Based on Spectral Clustering and Non­negative Matrix Factorization [Text] / Lei Bao, Sheng Tang, Jintao Li, Yongdong Zhang, Wei-ping Ye // International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems - 21st International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2008 Wroclaw, Poland, June 18-20, 2008. Proceedings: New Frontiers in Applied Artificial Intelligence. - Springer-Verlag Berlin Heidelberg 2008. - pp. 149-158
3. Oshio, S. A Deterministic Clustering Framework in MMMs-Induced Fuzzy Co-clustering [Text] / Shunnya Oshio, Katsuhiro Honda, Seiki Ubukata, Akira Notsu // International Symposium on Integrated Uncertainty in Knowledge Modelling and Decision Making - 4th International Symposium, IUKM 2015, Nha Trang, Vietnam, October 15-17, 2015, Proceedings: Integrated Uncertainty in Knowledge Modelling and Decision Making. - Springer International Publishing Switzerland 2015. - pp. 204-213
4. Chaimontree, S. Best Clustering Configuration Metrics: Towards Multiagent Based Clustering [Text] / Santhana Chaimontree, Katie Atkinson, Frans Coenen // International Conference on Advanced Data Mining and Applications - 6th International Conference, ADMA 2010, Chongqing, China, November 19-21, 2010, Proceedings, Part I: Advanced Data Mining and Applications. - Springer-Verlag Berlin Heidelberg 2010. - pp. 48-59
5. Yan, Q. Similarity Matrix Construction Methods in Sparse Subspace Clustering Algorithm for Hyperspectral Imagery Clustering [Text] / Qing Yan, Yun Ding, Jing-Jing Zhang, Li-Na Xun, Chun-Hou Zheng // International Conference on Intelligent Computing - 13th International Conference, ICIC 2017, Liverpool, UK, August 7-10, 2017, Proceedings, Part I: Intelligent Computing Theories and Application. - Springer International Publishing AG 2017. - pp. 695-700
6. Ryazanov, V. Clustering of Incomplete Data and Evaluation of Clustering Quality [Text] / Vladimir V. Ryazanov // Iberoamerican Congress on Pattern Recognition - 17th Iberoamerican Congress, CIARP 2012, Buenos Aires, Argentina, September 3-6, 2012. Proceedings: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications. - Springer-Verlag Berlin Heidelberg 2012. - pp. 146-153
7. LaPlante, F. A Heuristic Automatic Clustering Method Based on Hierarchical Clustering [Text] / Francois LaPlante, Nabil Belacel, Mustapha Kardouchi // International Conference on Agents and Artificial Intelligence - 6th International Conference, ICAART 2014, Angers, France, March 6-8, 2014, Revised Selected Papers: Agents and Artificial Intelligence. - Springer International Publishing Switzerland 2015. - pp. 312-328
8. Handl, J. Clustering Criteria in Multiobjective Data Clustering [Text] / Julia Handl, Joshua Knowles // International Conference on Parallel Problem Solving from Nature - 12th International Conference, Taormina, Italy, September 1-5, 2012, Proceedings, Part II: Parallel Problem Solving from Nature - PPSN XII. - Springer-Verlag Berlin Heidelberg 2012. - pp. 32-41
9. Yang, X. Research on Domain-Specific Features Clustering Based Spectral Clustering [Text] / Xiquan Yang, Meijia Wang, Lin Fang, Lin Yue, Yinghua Lv // International Conference in Swarm Intelligence - Third International Conference, ICSI 2012, Shenzhen, China, June 17-20, 2012 Proceedings, Part II: Advances in Swarm Intelligence. - Springer-Verlag Berlin Heidelberg 2012. - pp. 84-92
10. Araujo, D. Comparative Study on Information Theoretic Clustering and Classical Clustering Algorithms [Text] / Daniel Araujo, Adriao Doria Neto, Allan Martins // International Conference on Artificial Neural Networks - 22nd International Conference on Artificial Neural Networks, Lausanne, Switzerland, September 11-14, 2012, Proceedings, Part II: Artificial Neural Networks and Machine Learning - ICANN 2012. - Springer-Verlag Berlin Heidelberg 2012. - pp. 459-466
11. Aszalos, L. Rough Clustering Generated by Correlation Clustering [Text] / Laszlo Aszalos, Tamas Mihalydeak // International Workshop on Rough Sets, Fuzzy Sets, Data Mining, and Granular-Soft Computing - 14th International Conference, RSFDGrC 2013, Halifax, NS, Canada, October 11-14, 2013. Proceedings: Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing. - Springer-Verlag Berlin Heidelberg 2013. - pp. 315-324
12. Almutairi, N. K-Means Clustering Using Homomorphic Encryption and an Updatable Distance Matrix: Secure Third Party Data Clustering with Limited Data Owner Interaction [Text] / Nawal Almutairi, Frans Coenen, Keith Dures // International Conference on Big Data Analytics and Knowledge Discovery - 19th International Conference, DaWaK 2017, Lyon, France, August 28-31, 2017, Proceedings: Big Data Analytics and Knowledge Discovery. - Springer International Publishing AG 2017. - pp. 274-285
13. Zhang, Y. A Novel Clustering and Verification Based Microarray Data Bi-clustering Method [Text] / Yanjie Zhang, Hong Wang, Zhanyi Hu // International Conference in Swarm Intelligence - First International Conference, ICSI 2010, Beijing, China, June 12-15, 2010, Proceedings, Part II: Advances in Swarm Intelligence. - Springer-Verlag Berlin Heidelberg 2010. - pp. 611-618
14. Zhu, Q. Semi-supervised Affinity Propagation Clustering Based on Subtractive Clustering for Large-Scale Data Sets [Text] / Qi Zhu, Huifu Zhang, Quanqin Yang // International Conference of Young Computer Scientists, Engineers and Educators - International Conference of Young Computer Scientists, Engineers and Educators, ICYCSEE 2015, Harbin, China, January 10­-12, 2015. Proceedings: Intelligent Computation in Big Data Era. - Springer-Verlag Berlin Heidelberg 2015. - pp. 258-265
15. Jin, H. Scaling-Up Model-Based Clustering Algorithm by Working on Clustering Features [Text] / Huidong Jin, Kwong-Sak Leung, Man-Leung Wong // International Conference on Intelligent Data Engineering and Automated Learning - Third International Conference Manchester, UK, August 12-14, 2002 Proceedings: Intelligent Data Engineering and Automated Learning — IDEAL 2002. - Springer-Verlag Berlin Heidelberg 2002. - pp. 569-575.
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ