Тип работы:
Предмет:
Язык работы:


Применение методов глубокого обучения в медицинской диагностике

Работа №142013

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы52
Год сдачи2021
Стоимость4385 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
10
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 5
Обзор литературы 8
Используемые методы 10
Линейные модели 10
Логистическая регрессия 10
K ближайших соседей 11
Деревья решений 12
Ансамбли деревьев решений 14
Случайный лес 14
Градиентный бустинг деревьев 15
Полносвязные нейронные сети прямого распространения 18
SuperTML 20
NODE Нейронные ансамбли небрежных решающих деревьев 21
Методы борьбы с несбалансированностью классов 25
SMOTE 25
Undersampling 26
Отбор наиболее информативных признаков 26
Отбор на основе модели случайного леса 26
Вычислительная часть 28
Используемый язык программирования 28
Предобработка данных 28
Распределение классов 30
Применение методов машинного обучения 31
Анализ результатов 43
Выводы 45
Интерфейс 46
Заключение 48
Список литературы 49


Инфаркт миокарда – это острое сердечно-сосудистое заболевание, обусловленное резким прекращением кровотока в одной или нескольких корональных артериях, что приводит к гибели части сердечной ткани. Это одна из основных причин инвалидности во взрослом возрасте.
Основными осложнениями после инфаркта миокарда являются кардиогенный шок, острая левожелудочковая недостаточность вплоть до отека легких, жизнеугрожающие нарушения ритма сердца, снижение артериального давления, внезапная смерть.
К факторам риска развития инфаркта миокарда относятся курение, ожирение, недостаток двигательной активности, наследственность. Смертность от инфаркта миокарда среди всех заболевших составляет 10-12%.
Как известно, прогноз пациентов, переносящих инфаркт миокарда, неодинаков и зависит от множества факторов. Прогнозирование исхода для таких пациентов, а также выявление важнейших из признаков, достоверно влияющих на развитие в дальнейшем осложнений и на летальный исход, являются одними из важнейших задач кардиологии.
Задачу прогнозирования летального исхода после инфаркта миокарда можно решать с помощью машинного обучения. Это научная область, находящаяся на пересечении статистики, искусственного интеллекта и компьютерных наук. Для применения методов машинного обучения необходим некоторый набор данных, с помощью которого можно обучить различные алгоритмы и, сравнив результаты, полученные разными моделями, выбрать наилучший из алгоритмов для решения задачи.
Для обучения моделей машинного обучения имеется база данных, предоставленная военно-медицинской академией имени С. М. Кирова. В базе имеются сведения о 1040 пациентах, перенёсших инфаркт миокарда. Задача состоит в выявлении наиболее значимых в плане прогноза переменных и построении прогностической модели, оценивающей влияние различных факторов на исход при инфаркте миокарда.
Для решения этой задачи использовались различные методы машинного обучения, такие как, например, алгоритм случайного леса [1], градиентный бустинг деревьев решений [2], логистическая регрессия [3], а также некоторые алгоритмы глубокого обучения. Затем с помощью различных метрик эффективности выбиралась наилучшая в плане прогноза модель. Кроме того, проводился анализ на выявление наиболее информативных факторов. В связи с несбалансированностью классов в имеющемся наборе данных применялись разные методы борьбы с данной проблемой. [4, 5]


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе произведен сравнительный анализ методов машинного обучения для задачи прогнозирования исхода после инфаркта миокарда. Были использованы как классические методы, такие как, например, логистическая регрессия и градиентный бустинг деревьев решений, так и недавние разработки, связанные с применением глубокого обучения для прогнозирования на табличных данных. Кроме того, решалась проблема несбалансированности классов путем применения методов undersample и SMOTE.
Результатом данной работы является программа [33]с реализованным интерфейсом, способная помогать врачам в предсказании исхода для пациентов, перенесших инфаркт миокарда.



[1] Breiman L. Random forests // Mach. Learn. 2001. Т. 45. № 1. С. 5–32.
[2] Mason L. идр. Boosting Algorithms as Gradient Descent // 2000.
[3]Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин).
[4]Chawla N. V и др. SMOTE: Synthetic Minority Over-sampling Technique. , 2002. 321–357 с.
[5]Кузьмишкина А. и др. Выбор объектов для обучения в условиях сильной несбалансированности классов.
[6]Sun B. идр. SuperTML: Two-Dimensional Word Embedding for the Precognition on Structured Tabular Data. , 2019.
[7]Popov S., Morozov S., Babenko A. Neural Oblivious Decision Ensembles for Deep Learning on Tabular Data // 2019.
[8] Lee H. C. идр. Prediction of 1-Year Mortality from Acute Myocardial Infarction Using Machine Learning // Am. J. Cardiol. 2020. Т. 133. С. 23–31.
[9]Shouval R. идр. Machine learning for prediction of 30-day mortality after ST elevation myocardial infraction: An Acute Coronary Syndrome Israeli Survey data mining study // Int. J. Cardiol. 2017. Т. 246. С. 7–13.
[10]Piros P. идр. Comparing machine learning and regression models for mortality prediction based on the Hungarian Myocardial Infarction Registry // Knowledge-Based Syst. 2019. Т. 179. С. 1–7.
[11]Mansoor H. идр. Risk prediction model for in-hospital mortality in women with ST-elevation myocardial infarction: A machine learning approach // Hear. Lung J. Acute Crit. Care. 2017. Т. 46. № 6. С. 405–411.
[12]Bansal A. идр. MACHINE LEARNING TECHNIQUES TO PREDICT IN-HOSPITAL CARDIOVASCULAR OUTCOMES IN ELDERLY PATIENTS PRESENTING WITH ACUTE MYOCARDIAL INFARCTION // J. Am. Coll. Cardiol. 2020. Т. 75. № 11. С. 3603.
[13]Ibrahim K. S. идр. Preliminary Study on Application of Machine Learning Method in Predicting Survival Versus Non-Survival after Myocardial Infarction in Malaysian Population // Int. J. Cardiol. 2018. Т. 273. С. 8.
[14] Documentation scikit-learn: machine learning in Python — scikit-learn 0.21.3 documentation [Электронный ресурс]. URL: https://scikit-learn.org/0.21/documentation.html (дата обращения: 26.09.2020).
[15] imbalanced-learn documentation — Version 0.8.0 [Электронный ресурс]. URL: https://imbalanced-learn.org/stable/ (дата обращения: 13.01.2021).
[16] Keras: the Python deep learning API [Электронный ресурс]. URL: https://keras.io/ (дата обращения: 12.12.2020).
[17] pytorch-tabular • PyPI [Электронный ресурс]. URL: https://pypi.org/project/pytorch-tabular/ (дата обращения: 10.05.2021).
[18] PyTorch documentation — PyTorch 1.8.1 documentation [Электронный ресурс]. URL: https://pytorch.org/docs/stable/index.html (дата обращения: 12.03.2021).
[19] Pillow — Pillow (PIL Fork) 8.2.0 documentation [Электронный ресурс]. URL: https://pillow.readthedocs.io/en/stable/ (дата обращения: 29.04.2021).
[20] Quinlan J. R. Simplifying decision trees // Int. J. Man. Mach. Stud. 1987. Т. 27. № 3. С. 221–234.
[21] Pan S. J., Yang Q. A survey on transfer learning // IEEE Trans. Knowl. Data Eng. 2010. Т. 22. № 10. С. 1345–1359.
[22] He K. идр. Deep Residual Learning for Image Recognition.
[23] Peters B., Niculae V., Martins A. F. T. Sparse Sequence-to-Sequence Models. : Association for Computational Linguistics. 1504–1519 с.
[24] pandas documentation — pandas 1.2.4 documentation [Электронный ресурс]. URL: https://pandas.pydata.org/docs/ (дата обращения: 01.11.2020).
[25] sklearn.impute.SimpleImputer — scikit-learn 0.24.2 documentation [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html (дата обращения: 24.03.2021).
[26] sklearn.preprocessing.OneHotEncoder — scikit-learn 0.24.2 documentation [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html (дата обращения: 13.01.2021).
[27] sklearn.preprocessing.StandardScaler — scikit-learn 0.24.2 documentation [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html (дата обращения: 22.02.2021).
[28] sklearn.ensemble.ExtraTreesClassifier — scikit-learn 0.24.2 documentation [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesClassifier.html#sklearn.ensemble.ExtraTreesClassifier (дата обращения: 22.02.2021).
[29] Geurts P., Ernst D., Wehenkel L. Extremely randomized trees // Mach. Learn. 2006. Т. 63. № 1. С. 3–42.
[30] Kingma D. P., Ba J. L. Adam: A method for stochastic optimization // 3rd International Conference on Learning Representations, ICLR 2015 - Conference Track Proceedings.
[31] F-Score Definition | DeepAI [Электронный ресурс]. URL: https://deepai.org/machine-learning-glossary-and-terms/f-score (дата обращения: 13.01.2021).
[32] XGBoost Documentation — xgboost 1.5.0-SNAPSHOT documentation [Электронный ресурс]. URL: https://xgboost.readthedocs.io/en/latest/ (дата обращения: 22.02.2021).
[33] ovopilova/Predicting-outcome-after-myocardial-infarction-using-machine-learning [Электронный ресурс]. URL: https://github.com/ovopilova/Predicting-outcome-after-myocardial-infarction-using-machine-learning.





Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ