Введение 3
1 Модель данных 4
1.1 Дескрипторы изображений 4
1.1.1 Усредненные значения по каналам RGB 5
1.2.2 Гистограммы 6
1.2 Описание БД ирисы Фишера 7
2 Методы классификации объектов 9
2.1 Постановка задача многомерной классификации 9
2.2 Задача кластеризации 9
2.3 Функционалы качества разбиения 10
2.4 Метод Forel 11
2.5 Метод k-means 12
2.6 Классификатор Байеса 13
2.7 Простейшая нейронная сеть 16
3 Анализ результатов классификации методами k-means, классификатора Байеса и
нейронной сети 24
4 Создание социальной сети 25
Заключение 27
Список использованной литературы 28
Приложение А 29
Приложение B 30
Приложение C 33
Приложение D 34
Решение проблем возникающих во многих научных и научно-практических исследованиях приводит к необходимости решения задачи классификации, например: в торговле, в сфере телекоммуникаций, в медицине, здравоохранении, биологии, в банковской сфере. Таким образом, исследования методов классификации и выявление методов ее эффективного решения актуальна и практически значима.
Постановки задач классификации и методы их решения являются составной частью машинного обучения.
Целью настоящей работы является освоение фундаментальных понятий, математических моделей и методов применяемых для решения задач классификации в различных научных и научно-практических областях, а также проведения сравнительного анализа некоторых методов на модельных примерах.
Наша работа включает:
• Изложение основных теоретических понятий некоторых методов классификации.
• Описание алгоритмов некоторых методов классификации.
• Решения практических задач.
• Оравнение ряда методов классификации.
Для реализации алгоритмов и выполнения расчетов можно использовать языки программирования или программных системы: Matlab, Statistica, Excel и так далее. В настоящей работе используется язык Python. Преимущества, благодаря которым Python лучше всего подходит для машинного обучения (ML) и проектов основаны на ИИ. Включают возможность и простоту доступа к различным библиотекам (например Numpy, Pandas, Matplotlib, Sklearn, TensorFlow,...), объекты, функции и методы которых используются для реализации алгоритмов машинного обучения и ИИ, гибкость, независимость от платформы. Это постоянно увеличивается популярность этого языка. В работе[7] приведен обзор методов классификации в машинном обучении с помощью Scikit-Learn.
В этой работе рассмотрена задача классификации, различные подход к решению и алгоритмы классификации : k-means, Forel, классификатора Байеса нейронная сеть.
Составлен комплекс программ реализации методов: k-means, Forel, классификатора Байеса и нейронной сети на языке программирования Python.
На примере классификации объектов базы данных ирисов Фишера проведено сравнение значений функции потерь методов k-means, классификатора Байеса и нейронной сети. Показано что классификация с помощью нейронной сети обеспечивает минимальные потери.
Результаты ВКР будут использованы в совершенствовании методического обеспечения курса «Математическое моделирование» и «Современные методы анализа и визуализации» на ММФ ТГУ
Изученные методы и составленный программный комплекс можно использовать в дальнейшем при проведении исследований и реализации различных практических проектов, а также при развитии социальной сети создаваемой автором.