Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА ГЕНЕТИЧЕСКОГО АЛГОРИТМА КЛАСТЕРИЗАЦИИ МНОГОМЕРНЫХ ДАННЫХ

Работа №17740

Тип работы

Бакалаврская работа

Предмет

математика

Объем работы53
Год сдачи2017
Стоимость5750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
801
Не подходит работа?

Узнай цену на написание


Введение 4
1 Задача кластеризации данных 6
1.1 Понятие кластеризации 6
1.2 Постановка задачи кластеризации 8
1.3 Метрики для задания кластеров 11
1.4 Критерии качества кластеризации 12
1.5 Типы кластерных структур 15
2 Классические методы решения задачи кластеризации данных 19
2.1 Обзор методов кластеризации 19
2.2 Метод k-средних 23
3 Генетические алгоритмы 27
3.1 Основные понятия генетических алгоритмов 27
3.2 Классический генетический алгоритм 28
3.3 Генетический алгоритм кластеризации с детерминированным числом кластером 34
3.4 Сравнение предложенного генетического алгоритма с методом k-средних 36
4 Исследование влияния параметров генетического алгоритма на скорость
его работы 37
5 Решение практической задачи кластеризации 40
5.1 Описание статистики 40
5.2 Решение задачи кластеризации методом k-средних и генетическим
алгоритмом кластеризации с детерминированным числом кластеров 40
5.3 Сравнение полученных результатов 43
5.4 Визуализация результатов 45
Заключение 47
Список использованных источников 48
Приложение А 50


Целью бакалаврской работы является разработка генетического алгоритма, решающего задачу кластеризации многомерных статистических данных.
Задача кластеризации данных [14] является одной из наиболее актуальных и сложных задач анализа данных. Кластерный анализ [15] представляет собой раздел статистического анализа, объединяющий методы разбиения совокупности объектов на однородные группы, называемые кластерами. Его методы имеют широкий спектр применений практически во всех областях человеческой деятельности, связанных с изучением объектов и процессов: медицине, биологии, психологии, социологии, менеджменте, маркетинге, банковском деле, актуарной математике и других.
В первой главе работы приводятся основные понятия и постановка за-дачи кластеризации данных. Перечисляются виды наиболее часто выделяемых кластерных структур и критерии качества кластеризации. Во второй главе проводится обзор существующих методов кластеризации данных. Особое внимание в работе уделяется наиболее популярному методу кластеризации данных: методу k-средних [6]. Дается подробное описание данного алгоритма, и указываются особенности его работы.
В третьей главе излагаются принципы работы генетических алгоритмов [7], являющихся эвристическими алгоритмами поиска, широко используемыми для решения задач оптимизации и моделирования путём случайного подбора и вариации параметров с использованием механизмов, аналогичных естественному отбору в природе. В работе рассматриваются назначение и виды основных операторов генетических алгоритмов, в том числе операторы скрещивания, мутации и селекции. Приводится общий вид схемы этапов работы генетического алгоритма.
В работе предлагается генетический алгоритм, позволяющий решать задачу кластеризации многомерных данных с заранее заданным числом кластеров. Приводится подробное описание вида операторов инициализации, скрещивания, мутации и селекции, а также последовательность этапов работы предложенного генетического алгоритма кластеризации.
Было разработано программное приложение, реализующее работу предложенного генетического алгоритма кластеризации и классического алгоритма k-средних. Выполняется серия численных экспериментов, позволяющих оценить работу разработанного алгоритма на ряде тестовых примеров.
В работе проводится сравнение предложенного генетического алгоритма и классического алгоритма k-средних по их вычислительной сложности.
Проводится исследование влияния параметров операторов скрещивания и мутации на скорость работы генетического алгоритма.
В работе решается практический пример кластеризации данных- кластеризация 57 муниципальных районов Красноярского края по четырём экономическим показателям. Данная задача решается с помощью разработанных генетических алгоритмов и классического алгоритма k-средних. Исследование основывается на реальных статистических данных. Проводится сравнение результатов, полученных обоими методами.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В работе получены следующие результаты:
• Изучена задача кластеризации данных типа и основные алгоритмы кластеризации многомерных данных.
• Разработан генетический алгоритм для решения задачи кластеризации многомерных данных с заданным количеством кластеров.
• Создано программное приложение, реализующее работу предложенного алгоритма, а также алгоритма кластеризации k-средних.
• Проведено сравнение изученного и предложенного методов по их вы-числительной сложности и результатам работы.
• Проведено исследование влияния параметров генетического алгоритма на скорость его работы.
• Решена практическая задача кластеризации 57 муниципальных районов Красноярского края по четырём экономическим показателям
• Проведено сравнение результатов, полученных в результате работы каждого метода.



1. Батищев, Д.И. Генетические алгоритмы решения экстремальных задач / Д.И. Батищев. - Воронеж: ВГТУ 1995. — 62с.
2. Батыршин, И.З. Нечеткие гибридные системы. Теория и практика / И. 3. Батыршищподред. Н.Г. Ярушкиной. - М.: ФИЗМАТЛИТ, 2007. - 208 с.
3. Вороновский, Г.К. Генетические алгоритмы, искусственные нейронные се¬ти и проблемы виртуальной реальности / Г.К. Вороновский. - Харь- ков:ОСНОВА, 1997. - 112с.
4. Дарвин, Ч. О происхождении видов путём естественного отбора или со-хранении благоприятствуемых пород в борьбе за жизнь / Ч. Дарвин. -М.: АН СССР, 1939. - 322 с.
5. Еремеев, А.В. Генетические алгоритмы и оптимизация: учебное пособие/ А.В. Ермеев. - Омск: Издательство «Омский государственный университет», 2008. - 48 с.
6. Загоруйко, Н.Г. Прикладные методы анализа данных и знаний / Н.Г. Загоруйко. - Новосибирск: ИМ СО РАН, 1999. -270 с.
7. Мандель, И.Д. Кластерный анализ/ И.Д. Мандель. - М.: Финансы и статистика, 1988. - 176 с.
8. Панченко, Т. В. Генетические алгоритмы: учебно-методическое пособие / Т.В. Панченко; под ред. Ю. Ю. Тарасевича. - Астрахань: Издательский дом «Астраханский университет», 2007. - 87 с.
9. Рутковская, Д. Нейронные сети, генетические алгоритмы и нечеткие си¬стемы / Д.Рутковскаящер. с польского И.Д. Рудинского. - М.: Горячая линия -Телеком, 2006. - 452с.
10. Воронцов, К. В. Лекции по алгоритмам кластеризации и многомерного шкалирования /К. В. Воронцов. - М.: МГУ, 2007. - 18 с.
11. Миркин, Б. Г. Методы кластер - анализа для поддержки принятия решений: Б.Г. Миркин. — М.: Изд. ДомНационального исследовательского университета «Высшая школа экономики», 2011. — 88 с.
12. Дюран, Б. Кластерный анализ: пер. с англ. Е. 3. Демиденко под ред. А.Я.
Боярского / Б. Дюран, — П. Одел. М.: «Статистика», 1977. — 128 с.
13. Местецкий, Л. М. Математические методы распознавания образов / Л. М. Местецкий. — М.: МГУ, 2002. — 139 с.
14. Потапов, А. С. Распознавание образов и машинное восприятие / А. С. Потапов. — М.: "Политехника", 2007. — 552 с.
15. Аксенов, С.В. Организация и использование нейронных сетей (методы и технологии) / под общ. ред. В.Б. Новосельцева. - Томск : Изд-во НТЛ,2006. - 128 с.
16. Гладков, Л.А. Генетические алгоритмы / Л.А. Гладков, В.В. Курейчик, В.М. Курейчик. - М. : ФИЗМАТЛИТ, 2006. - 320 с.
17. Лепский, А. Е. Математические методы распознавания образов / А.Е. Лепский, А.Г. Броневич. — Таганрог: Изд-во ТТИ ЮФУ, 2009. - 155 с.
18. Мищенко, В.А. Использование генетических алгоритмов в обучении нейронных сетей // В.А Мищенко, А.А. Коробкин Современные проблемы науки и образования, 2011. - № 6;
19. Олдендерфер, М.К. Кластерный анализ / М.К. Олдендерфер, М.С. Блэшфилд - М.: Финансы и статистика, 1985г. - 227 с.
20. Уиллиамс, У. Т., Ланс Д. Н. Методы иерархической классификации // Статистические методы для ЭВМ / Под ред. М. Б. Малютов. - М.: Наука, 1986.-С. 269-301с.
21. Шуметов, В. Г., Кластерный анализ: подход с применением ЭВМ / В. Г. Шуметов, Л.В. Шуметов. - Орел :ОрелГТУ, 2000. - 119 с.
22. Muhlenbein H., Voigt H.-M. Gene Pool Recombination in Genetic Algorithms.
In Proc. Of the Metaheuristics Inter. Conf., 1995. - 238 c.
23. Гладков, Л.А., Курейчик B.B., Курейчик ВМ. Генетические алгоритмы / Под ред. В.М. Курейчика. — 2-е изд., испр. и доп. — М.: ФИЗМАТЛИТ, 2006. — 320 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ