Тип работы:
Предмет:
Язык работы:


Задача медицинской диагностики по выборке без учителя

Работа №25682

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы55
Год сдачи2016
Стоимость5600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
217
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 Общая постановка задачи кластеризации 6
1.1 Задача машинного обучения 6
1.2 Постановка задачи классификации 11
1.3 Задача кластеризации. Методы решения задачи 13
1.4 Задача из репозитория данных 15
1.5 Выводы 20
2 Решение задачи кластеризации 21
2.1 FOREL 21
2.2 Нейронная сеть Кохонена 26
2.3 Алгоритм минимального покрывающего дерева 30
2.4 Алгоритм минимальной выборки 35
2.5 Выводы 37
3 Практическое применение 38
3.1 Выборка - Iris Data Set 38
3.2 Выборка - Breast Cancer Wisconsin (Original) Data Set 41
3.3 Выборка - Breast Cancer Wisconsin (Diagnostic) Data Set 43
3.4 Выводы 46
ЗАКЛЮЧЕНИЕ 47
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 48
ПРИЛОЖЕНИЕ А Техническое задание 49


Современному обществу трудно представить свою жизнь без техники и информационных технологий, можно сказать, что информационные технологии стали неотъемлемой частью жизни человека во всех сферах его деятельности. На сегодняшний день наблюдается большой объем информационных потоков. Именно поэтому очень важным вопросом становится обработка данных и машинное обучение.
Одним из методов машинного обучения является кластерный анализ. Этот метод имеет широкое применение в различных дисциплинах: психологии, археологии, химия, медицине и многих других дисциплинах. Кластеризацию определяют как разбиение выборки объектов на неопределенное количество непересекающихся подмножеств, называющиеся кластерами, так что бы каждый кластер состоял из объектов по схожим признакам, а объекты разных кластеров имели существенные отличительные признаки. Разбиение выборки объектов на группы по схожести признаков упрощает дальнейшую работу с таким группами и позволяет применять к каждому кластеру свой метод анализа, что способствует ускорению обработки данных.
На сегодняшний день машинное обучение встречается во многих задачах, одной из таких задач является медицинская диагностика. Эта задача подразумевает под собой выявление заболеваний и степени инвалидностей, распознавание болезней через изменение характеристик пациента с целью выявления и прогнозирования болезни на ранних стадиях. Данная задача является очень важной, так как от точности решения такой задача зависит очень многое. Если для технической диагностики ошибка в 2% считается допустимой, то для задачи, в которой исследуется человеческое здоровье, это непозволительно.
Для задач медицинской диагностики используются данные большой размерности, которые представлены различными характеристиками пациентов. Эти данные имеют ряд особенностей:
• качественный характер информации;
• наличие пропусков данных;
• большое число переменных при небольшом наблюдении;
• ограниченное число наблюдений.
Для работы из репозитория данных был выбран набор медицинских данных «Диагностика рака молочной железы Висконсин». Этот набор данных представляет собой 569 экземпляров и 32 атрибута реальных данных.
В выборке имеются пропуски: в 17 экземплярах отсутствует по одному различному атрибуту.
В последние годы для задачи медицинской диагностики разработано множество различных решений, методов и алгоритмов, которые включают в себя изучение выбранной задачи, сбор данных и различных характеристик, написание алгоритма или метода, а так же проверку правильности его работы.
Целью работы является повышение точности решения задачи медицинской диагностики с помощью методов кластеризации.
Для достижения поставленной цели необходимо выполнить следующие задачи:
• изучить существующие методы кластеризации;
• реализовать и исследовать алгоритмы кластеризации: FOREL, алгоритм минимальной выборки, алгоритм минимального покрывающего дерева;
• исследовать работу алгоритма нейронная сеть Кохонена с использованием аналитической платформы Deductor Academic 5.3;
• проанализировать особенности работы алгоритмов на модельных и реальных данных;
Данная работа является исследовательской и может быть полезна при решении задачи медицинской диагностики.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Для достижения повышения точности решения задачи медицинской диагностики в работе были исследованы следующие алгоритмы: FOREL, алгоритм минимальной выборки, алгоритм минимального покрывающего дерева и алгоритм нейронные сети Кохонена при использовании аналитической платформы Deductor Academic 5.3.
Алгоритмы FOREL и минимального покрывающего дерева показали не способность работать с выборкой больших данных или близко расположенных кластеров. Алгоритм минимальной выборки, верно определив 524 из 569 объектов, показал удовлетворительный результат. Нейронные сетей Кохонена показал лучший результат, но присутствие ошибок первого и второго рода снижает качество его работы.
Для задачи медицинской диагностики очень важно не только правильно распределить выборку по кластерам, но и не допустить ошибок первого и второго рода.



1. СТО 4.2-07-2014 Система менеджмента качества. Общие требования к построению, изложению и оформлению документов учебной деятельности. - введ. 09.01.2014. - Красноярск: СФУ, 2014. - 60 с.
2. Кураленок, И. GPU в задачах машинного обучения / И. Кураленок, А. Щекалев // Открытые системы. СУБД. - 2013. - №8. - С. 44-46.
3. Лафоре, Р. Объектно-ориентированное программирование в С++. Классика Computer Science. 4-е изд. / Р. Лафоре. - СПб.: Питер, 2014. - 928 с.
4. Матвеев, Ю. Н. Анализ возможности применения методов машинного обучения на основе многообразий в задачах распознования дикторов / Ю. Н. Матвеев, А. К. Шулипа // Известия вузов. Приборостроение. - 2014. - Т. 57, №2. - С. 70-76.
5. Орлов, С. А. Теория и практика языков программирования: учебник для вузов. Стандарт 3-го поколения. / С. А. Орлов. - СПб.: Питер, 2013. - 688 с.
6. Павловская, Т. А. С/С++. Программирование на языке высокого уровня / Т. А. Павловская. - СПб.: Питер, 2012. - 461 с.
7. Попова, О. А. Модели и методы интеллектуального анализа данных: учебно-методическое пособие [Электронный курс] / О. А. Попова. - Красноярск: Сиб. федер. ун-т, 2012.
8. Сараев, В. Отдайтесь большой цифре / В. Сараев // Эксперт. - 2015. - №9. - С. 51-55.
9. Удалова, Ю. В. Математические и алгоритмические основы объектно-ориентированного программирования [Электронный курс]: учеб.- метод. пособие / Ю. В. Удалова. - Красноярск: Сиб. федер. ун-т, 2013.
10. Царев, Р. Ю. Алгоритмы и структуры данных: учеб. пособие. / Р. Ю. Царев. - Красноярск: Сиб. федер. ун-т, 2013. - 160 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ