📄Работа №25682

Тема: Задача медицинской диагностики по выборке без учителя

Характеристики работы

Тип работы Бакалаврская работа
Информатика и вычислительная техника
Предмет Информатика и вычислительная техника
📄
Объем: 55 листов
📅
Год: 2016
👁️
Просмотров: 267
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ВВЕДЕНИЕ 4
1 Общая постановка задачи кластеризации 6
1.1 Задача машинного обучения 6
1.2 Постановка задачи классификации 11
1.3 Задача кластеризации. Методы решения задачи 13
1.4 Задача из репозитория данных 15
1.5 Выводы 20
2 Решение задачи кластеризации 21
2.1 FOREL 21
2.2 Нейронная сеть Кохонена 26
2.3 Алгоритм минимального покрывающего дерева 30
2.4 Алгоритм минимальной выборки 35
2.5 Выводы 37
3 Практическое применение 38
3.1 Выборка - Iris Data Set 38
3.2 Выборка - Breast Cancer Wisconsin (Original) Data Set 41
3.3 Выборка - Breast Cancer Wisconsin (Diagnostic) Data Set 43
3.4 Выводы 46
ЗАКЛЮЧЕНИЕ 47
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 48
ПРИЛОЖЕНИЕ А Техническое задание 49

📖 Введение

Современному обществу трудно представить свою жизнь без техники и информационных технологий, можно сказать, что информационные технологии стали неотъемлемой частью жизни человека во всех сферах его деятельности. На сегодняшний день наблюдается большой объем информационных потоков. Именно поэтому очень важным вопросом становится обработка данных и машинное обучение.
Одним из методов машинного обучения является кластерный анализ. Этот метод имеет широкое применение в различных дисциплинах: психологии, археологии, химия, медицине и многих других дисциплинах. Кластеризацию определяют как разбиение выборки объектов на неопределенное количество непересекающихся подмножеств, называющиеся кластерами, так что бы каждый кластер состоял из объектов по схожим признакам, а объекты разных кластеров имели существенные отличительные признаки. Разбиение выборки объектов на группы по схожести признаков упрощает дальнейшую работу с таким группами и позволяет применять к каждому кластеру свой метод анализа, что способствует ускорению обработки данных.
На сегодняшний день машинное обучение встречается во многих задачах, одной из таких задач является медицинская диагностика. Эта задача подразумевает под собой выявление заболеваний и степени инвалидностей, распознавание болезней через изменение характеристик пациента с целью выявления и прогнозирования болезни на ранних стадиях. Данная задача является очень важной, так как от точности решения такой задача зависит очень многое. Если для технической диагностики ошибка в 2% считается допустимой, то для задачи, в которой исследуется человеческое здоровье, это непозволительно.
Для задач медицинской диагностики используются данные большой размерности, которые представлены различными характеристиками пациентов. Эти данные имеют ряд особенностей:
• качественный характер информации;
• наличие пропусков данных;
• большое число переменных при небольшом наблюдении;
• ограниченное число наблюдений.
Для работы из репозитория данных был выбран набор медицинских данных «Диагностика рака молочной железы Висконсин». Этот набор данных представляет собой 569 экземпляров и 32 атрибута реальных данных.
В выборке имеются пропуски: в 17 экземплярах отсутствует по одному различному атрибуту.
В последние годы для задачи медицинской диагностики разработано множество различных решений, методов и алгоритмов, которые включают в себя изучение выбранной задачи, сбор данных и различных характеристик, написание алгоритма или метода, а так же проверку правильности его работы.
Целью работы является повышение точности решения задачи медицинской диагностики с помощью методов кластеризации.
Для достижения поставленной цели необходимо выполнить следующие задачи:
• изучить существующие методы кластеризации;
• реализовать и исследовать алгоритмы кластеризации: FOREL, алгоритм минимальной выборки, алгоритм минимального покрывающего дерева;
• исследовать работу алгоритма нейронная сеть Кохонена с использованием аналитической платформы Deductor Academic 5.3;
• проанализировать особенности работы алгоритмов на модельных и реальных данных;
Данная работа является исследовательской и может быть полезна при решении задачи медицинской диагностики.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Для достижения повышения точности решения задачи медицинской диагностики в работе были исследованы следующие алгоритмы: FOREL, алгоритм минимальной выборки, алгоритм минимального покрывающего дерева и алгоритм нейронные сети Кохонена при использовании аналитической платформы Deductor Academic 5.3.
Алгоритмы FOREL и минимального покрывающего дерева показали не способность работать с выборкой больших данных или близко расположенных кластеров. Алгоритм минимальной выборки, верно определив 524 из 569 объектов, показал удовлетворительный результат. Нейронные сетей Кохонена показал лучший результат, но присутствие ошибок первого и второго рода снижает качество его работы.
Для задачи медицинской диагностики очень важно не только правильно распределить выборку по кластерам, но и не допустить ошибок первого и второго рода.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. СТО 4.2-07-2014 Система менеджмента качества. Общие требования к построению, изложению и оформлению документов учебной деятельности. - введ. 09.01.2014. - Красноярск: СФУ, 2014. - 60 с.
2. Кураленок, И. GPU в задачах машинного обучения / И. Кураленок, А. Щекалев // Открытые системы. СУБД. - 2013. - №8. - С. 44-46.
3. Лафоре, Р. Объектно-ориентированное программирование в С++. Классика Computer Science. 4-е изд. / Р. Лафоре. - СПб.: Питер, 2014. - 928 с.
4. Матвеев, Ю. Н. Анализ возможности применения методов машинного обучения на основе многообразий в задачах распознования дикторов / Ю. Н. Матвеев, А. К. Шулипа // Известия вузов. Приборостроение. - 2014. - Т. 57, №2. - С. 70-76.
5. Орлов, С. А. Теория и практика языков программирования: учебник для вузов. Стандарт 3-го поколения. / С. А. Орлов. - СПб.: Питер, 2013. - 688 с.
6. Павловская, Т. А. С/С++. Программирование на языке высокого уровня / Т. А. Павловская. - СПб.: Питер, 2012. - 461 с.
7. Попова, О. А. Модели и методы интеллектуального анализа данных: учебно-методическое пособие [Электронный курс] / О. А. Попова. - Красноярск: Сиб. федер. ун-т, 2012.
8. Сараев, В. Отдайтесь большой цифре / В. Сараев // Эксперт. - 2015. - №9. - С. 51-55.
9. Удалова, Ю. В. Математические и алгоритмические основы объектно-ориентированного программирования [Электронный курс]: учеб.- метод. пособие / Ю. В. Удалова. - Красноярск: Сиб. федер. ун-т, 2013.
10. Царев, Р. Ю. Алгоритмы и структуры данных: учеб. пособие. / Р. Ю. Царев. - Красноярск: Сиб. федер. ун-т, 2013. - 160 с.

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ