Тип работы:
Предмет:
Язык работы:


Программные пакеты и статистические методы в постановке медицинского диагноза

Работа №65682

Тип работы

Бакалаврская работа

Предмет

математика

Объем работы77
Год сдачи2020
Стоимость3850 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
284
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1. СОВРЕМЕННЫЕ ПРОГРАММНЫЕ ПАКЕТЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ
РЕШЕНИЯ ЗАДАЧ В МЕДИЦИНЫ 7
1.1. MSEXCEL 7
1.2. STATISTICA 9
1.3. SPSS STATISTICS 10
1.4. SAS VISUAL ANALYTICS 12
1 .5. STATA 13
1 .6. RAPIDMINER 14
1.7. ВЫВОД К ПЕРВОЙ ГЛАВЕ 16
2. ТЕХНОЛОГИЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСКИ С ИСПОЛЬЗОВАНИЕМ
RAPIDMINER 17
2.1. ЗАДАЧА КЛАССИФИКАЦИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА 17
2.2. КЛАСТЕРНЫЙ АНАЛИЗ 21
2.3. ПОСТРОЕНИЕ ДЕРЕВА РЕШЕНИЙ 24
2.4. ВЫВОД К ВТОРОЙ ГЛАВЕ 28
3. ЧИСЛЕННЫЙ ЭКСПЕРИМЕНТ С ИСПОЛЬЗОВАНИЕМ
ПРОГРАММНОГО ПАКЕТА RAPIDMINER 30
3.1. ИСХОДНЫЕ ДАННЫЕ И ИХ ЗАГРУЗКА 30
3.2. ТЕХНОЛОГИЯ РЕШЕНИЯ ЗАДАЧИ КЛАСТЕРНОГО АНАЛИЗА 32
a) K-medoids 32
b) K-means 37
c) X-means 41
d) Сравнение алгоритмов 45
3.3. ТЕХНОЛОГИЯ ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ 46
3.4. ВЫВОД К ТРЕТЬЕЙ ГЛАВЕ 53
ЗАКЛЮЧЕНИЕ 55
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 58
ПРИЛОЖЕНИЕ A 62


Принятие правильного решения становится ключевым фактором для успешного достижения наших целей во всех областях практической деятельности. Способов найти правильное решение столько же, сколько и людей, которые должны его принять. Можно ожидать, что вновь принятые решения станут лучше и надежнее, но для отдельных лиц и групп, которые должны принимать решения, это на самом деле становится все более и более сложным, поскольку они просто не могут обрабатывать огромные объемы данных. И там возникает необходимость в хорошей технике поддержки принятия решений. Она должна иметь возможность обрабатывать эти огромные объемы данных и помогать экспертам принимать решения легче и надежнее. Таким образом, эксперт может решить, является ли предложенное решение подходящим или нет.
Потребность в системе анализа совпала с появлением интеллектуального анализа данных - процесса обнаружения знаний, который представлял собой смесь машинного обучения, экспертных систем, статистики и т. д. Такая система показала лучшее понимание процесса и предсказания будущего. Основной целью интеллектуального анализа данных является извлечение скрытых знаний из очень больших наборов данных, которые невозможно наблюдать с помощью простого статистического анализа.
Интеллектуальный анализ данных, также называемый обнаружением знаний в базах данных, в области 4
компьютерных наук, представляет собой процесс обнаружения интересных и полезных моделей и взаимосвязей в больших объемах данных, а также предоставляет лучше понять зависимость между атрибутами выборки в большом наборе данных и интерпретировать процессы подсистемы, создавать законы и предсказания поведения соответствующей подсистемы. Эта область объединяет инструменты из статистики и искусственного интеллекта (такие как нейронные сети и машинное обучение) с управлением баз данных для анализа больших цифровых коллекций, известных как наборы данных. Процесс извлекает информацию высокого качества, которую можно использовать для выработки выводов на основе отношений или структуры данных.
Интеллектуальный анализ данных является результатом использования реализованных алгоритмов в программном обеспечении для удовлетворения потребностей медицинской науки в каждом разделе с построением аналитических моделей, категоризации, информационного прогноза (прогнозирования) и представления.
В настоящее время все интенсивнее развиваются статистические методы и программные пакеты в биологии и экологии [10], географии [12, 15], психологии [8], социологии [3], бизнесе (страхование, банковское дело, розничная торговля), государственной безопасности (обнаружение преступников и террористов) и т.д.
На актуальность темы указывают такие факторы, как сокращение времени, необходимого для постановки диагноза, который позволяет медицинским работникам лучше расставить приоритеты в случае пациента. Интеллектуальный анализ данных и глубокое обучение могут анализировать гораздо больше факторов и случаев, чем работник. Чтобы быть более точным, мы можем использовать его для исследования генома, разработки лекарств, медицинской визуализации. Устройства на основе интеллектуального анализа данных могут изучать, анализировать большие объемы информации и принимать решения гораздо быстрее, чем люди.
Важной целью исследований в области диагностической медицины является оценка и сравнение точности диагностических тестов, которые служат двум целям:
1) предоставление достоверной информации о состоянии пациента и
2) формированию плана лечение пациента на основе установленного диагноза.
Как следует из вышеизложенного, здесь существенные продвижения могут быть получены именно за счет применения интеллектуального анализа данных, осуществляемого с помощью современных программных средств.
Целью данного исследования является оценка возможности эффективного использования алгоритмов для прогнозирования пациентов при поступлении в больницу, что, в свою очередь, открывает и возможности прогнозировать необходимое лечение для пациентов, а также обеспечить необходимые меры для пациентов с травмами, которые находятся до входа в критическую ситуацию. Для реализации цели должны быть решены следующие задачи:

статистического методакластерного анализа
• исследование возможности применения алгоритма построения дерева решений
Объектом исследования являются медицинские данные пациентов одной из поликлиник г. Котлас.
Предметом исследования являются статистические
программные пакеты.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


С быстрым увеличением численности населения, существует значительное количество роста заболеваний, связанных со здоровьем. Некоторые заболевания тесно связаны с симптомами, которые создают врачам сложность прогнозировать точные заболевания сразу. Вот где появляется техника интеллектуального анализа данных, которая помогает в прогнозировании заболевания. Это исследование сосредоточено на
исследованиинесколькихметодах и их алгоритмов.
В результате проделанной работы проведено исследованиенаиболее известных, и получивших широкое распространение, статистических программных
пакетов.Рассмотрены пакеты программного обеспечения для статистического анализа данных, такие как: MSExcel, STATISTICA, SPSS Statistics, SAS VisualAnalytics, Stata и RapidMinerStudio.
В результате проведенного анализа имеющихся на настоящий момент программных средств, для решения задач прикладной математической статистики для целей медицины можно сделать следующие выводы:
1. Предлагаемая линейка программных пакетов решает практически весь спектр задач прикладной статистики, возникающих в практической медицинской деятельности.
2. Программный пакет RAPIDMINER,несомненно, является наиболее эффективным средством решения задачоперативной медицинской практики - диагностики и прогнозирования.
Рассмотрены задачи классификации интеллектуального анализа. Эти задачи позволяют построить модели, которые могут использоваться для прогнозирования поведения анализируемой системы в ситуации, которая ранее не наблюдалась; использовать поиск скрытых закономерностей в данных, их описание и вывод правил, которые могут быть использованы в будущем для повышения эффективности работы медицинских учреждений.
Более подробно рассмотрены и описаны кластерный анализ и построение дерева решений.
В ходе работы выполнены поставленные задачи, а именно:
• исследование возможности применения статистического метода кластерного анализа.В исследованиях кластерного анализа были использованы k-means, k-medoids и x-means алгоритмы с использованием инструмента RapidMiner. Эти три алгоритма были применены для оценки производительности каждого алгоритма с точки зрения кластеризации медицинских данных. Результаты сравнивались с каждым алгоритмом с точки зрения среднего значения и совпадения объектов. В результате исследования мы получили, что алгоритм x-means показал лучший результат по сравнению с другими двумя алгоритмами, он кластеризовал данные с -4.031 средним расстоянием в каждом кластере и совпадение объектов кластера больше 70%, что считается признаком хорошей кластеризации.
• исследование возможности применения алгоритма построения дерева решений. Это исследование является попыткой использовать функции инструмента RapidMiner для анализа данных и представить некоторые из возможностей, которые предлагаются для анализа данных и было создано для того, чтобы представить деревья решений как один из инструментов современных возможностей машинного обучения (интеллектуального анализа данных). Следуя из таблицы точности, мы получаем оптимальное дерево решений с критерием gain_index, где точность построения дерева 90%. Проведя анализ, видно, что диагноз гипертонии прогнозируется у 44 пациентов, не точно поставлена степень у 5 пациентов из них 3 пациента имеют предполагаемый диагноз, но не распознаются методом классификации дерево решений.
На основании проведенного исследования можно заключить, что на настоящий момент RapidMinerявляется наиболее эффективным продуктом в решении задач оперативной медицинской практики.


Литература
1. Дресвянский Д.В. О применении методов интеллектуального анализа данных в задаче обнаружения спама / Д.В. Дресвянский, Е.С. Семёнкин // Электронный сборник материалов международной конференции студентов, аспирантов и молодых ученых «Проспект свободный - 2015» посвященной 70-летию великой победы. -2015.-С.22-24.
2. Корсунова Е.С. Применение пакета STATISTICA и MS EXCEL для обработки биомедицинской информации/ Е.С. Корсунова, К.Д. Тишакова // Технические науки: тенденции, перспективы и технологии развития. / Сборник научных трудов по итогам международной научно-практической конференции. № 4. г. Волгоград, 2017. -64 с.
3. Крыштановский А.О.Анализ социологических данных с помощью пакета SPSS [Текст]: учеб, пособие для вузов / А. О. Крыштановский- Москва: ВШЭ, 2006.-с. 225— 281.
4. Мальцева А.А. Классификация регионов по уровню инновационного развития на основе кластеризации / А.А. Мальцева, А.Л. Баскакова // Вестник Тверского государственного университета. Серия: Экономика и управление. 2015.- № 4. -С. 167-176.
5. Мамонтов Д.Ю. Применение методов интеллектуального анализа данных для задачи классификации повреждений стальных пластин / Д.Ю. Мамонтов, Е.С. Семёнкин //Электронный сборник материалов международной конференции студентов, аспирантов и молодых ученых «Проспект свободный - 2015» посвященной 70-летию великой победы. 2015.-С.36-38.
6. Неслухов Д.С. Использование кластерного и регрессионного анализа в изучении экономической деятельности судостроительных и судоремонтных предприятий / Д.С. Неслухов // Интернет-журнал «НАУКОВЕДЕНИЕ», 2016-Том 8, №4.
7. Овсянников А.О. Анализ внутренних затрат на научные исследования и разработки по субъектам Российской Федерации при помощи кластерного анализа RapidMiner / А.О. Овсянников // Научно-практический электронный журнал Аллея Науки. 2018.- №6(22).
8. Орестова В.Р., Применение статистического пакета анализа данных SPSS Statistics в психологических исследованиях на примере факторного анализа / В. Р. Орестова, А. А. Бастрон // История и архивы. - 2017. - №2.- С. 38-51.
9. Пичугин Ю.А. О классификации летних режимов погоды в Санкт-Петербурге / Ю.А. Пичугин // Метеорология и гидрология. 2000.- № 5. -С. 31-39.
10. Сиделев, С. И. Математические методы в биологии и экологии: введение в элементарную биометрию: учебное пособие / С. И. Сиделев; Яросл. гос. ун-т им. П. Г. Демидова. - Ярославль: ЯрГУ, 2012. - 140 с.
11. Сылова С.Д. Создание групп для маркетинговых целей из данных использования веб-сайта / С.Д. Сылова // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки- 2017.- Т. 27, вып. 3.- С. 470-478.
12. Третьяков А.С. Статистические методы в прикладных географических исследованиях: Учебно¬методическое пособие / А.С. Третьяков; науч. ред. проф. И.Г. Черванев - Х.: Шрифт, 2004. - 96 с.
13. Трухачева Н. В. Математическая статистика в медико-биологических исследованиях с применением пакета Statistica. / Н.В. Трухачева. - М.: ГЭОТАР-Медиа, 2012.-384 с.
14. Ульянов Е.А. Кластеризация паевых инвестиционных фондов по прибыльности/ Е.А. Ульянов, Д.Ш. Бесаев // Научно-практический электронный журнал Аллея Науки. - 2018.-№6.
15. Филандышева Л. Б. Статистические методы в
географии: учебно-методическое пособие / Л. Б.
Филандышева, Е. С. Сапьян; отв. ред. А.В. Пучкин; Том. гос. ун-т. - Томск : Издательский Дом Томского государственного университета, 2015. - 164 с.
16. Чернышова Г.Ю. Применение методов
интеллектуального анализа данных для кластеризации текстовых документов. / Г.Ю. Чернышова, А.Н. Овчинников // Информационная безопасность регионов: научно¬
практический журнал. 2015. -№4 (21). - С. 5-12.
17. Шеламова, М. А. Использование программы Excel в работе с базой медико-биологических данных: учеб.-метод. пособие / М. А. Шеламова // Минск : БГМУ, 2011. -С.56.
18. Шубат О. М. Кластерный анализ в исследовании социально-экономических процессов: опыт критического анализа / О. М. Шубат, А. П. Караева // Проблемы моделирования социальных процессов: Россия и страны АТР : материалы Второй всероссийской научно-практической конференции с международным участием — Владивосток : Дальневост. федерал. ун-т, 2016. — С. 325-328.
19. Эльрих Ю. Применение метода «дерево решений» в целях оптимизации ремонтных программ предприятий электроэнергетики РФ/ Ю. Эльрих, Э. Петровский // РИСК: Ресурсы, информация, снабжение, конкуренция, 2012. - № 1. - С. 385-388.
Интернет-ресурсы
20. Википедия - свободная энциклопедия [Электронный
ресурс]. - НШэБ://ги.ш1к1ресНа.огд/ш1к1/Дерево решений . -
(дата обращения: 21.03.2020).
21. RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 17.03.2020).
Иностранные источники
22. Lloyd GER. Hippocratic Writings. / J. Chadwick, N.W. Mann, Trans // London: Penguin Books, 1983.-pp. 223.
23. Exarchos TP. Mining sequential patterns for protein fold recognition. / T.P. Exarchos, C. Papaloukas, C. Lampros, D.I. Fotiadis // Biomed Inform. 2008.-pp.165-179.
24. Jones J.K. The role of data mining technology in the identification of signals of possible adverse drug reactions: value and limitations, current therapeutic research-clinical and experimental. / J.K. Jones // 2001-vol. 62, num. 9.-pp. 664-672.
25. Kakimoto M. Data Mining from Functional Brain Image / M. Kakimoto, C. Morita, H. Tsukimoto // Proceedings of the International Workshop on Multimedia Data Mining (MDM/KDD'2000), in conjunction with ACM SIGKDD Conference. Boston, 2000.-pp. 91-97.
26. Kuo W.J. Data mining with decision trees for diagnosis of breast tumor in medical ultrasonic images. / W.J. Kuo, R.F. Chang, D.R. Chen, C.C. Lee //Breast Cancer Res Treat, 2001. -66(1) - pp.51-57.
27. Laura J. van’t Veer. Gene expression profiling predicts clinical outcome of breast cancer / Laura J. van’t Veer, Hongyue Dai, Marc J. Van De Vijver et al. // Nature. 2002.-V. 415. № 6871. -pp. 530-536.
28. Ohno-Machado L. Decision trees and fuzzy logic: A comparison of models for the selection of measles vaccination strategies in Brazil. / L. Ohno-Machado, R. Lacson, E. Massad // Journal of the American medical informatics association: Suppl., 2000.- pp. 625-629.
29. Pelleg Dan. Accelerating Exact k-means Algorithms with Geometric Reasoning / Dan Pelleg, Andrew Moore // Carnegie Mellon University, Pittsburgh, 1999 - pp. 277-281.



Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ