Тип работы:
Предмет:
Язык работы:


Прогнозирование рисков кардиальных патологий на основе массивов данных результатов взятых анализов (проектная работа)

Работа №128401

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы42
Год сдачи2021
Стоимость4370 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
53
Не подходит работа?

Узнай цену на написание


Введение 4
Глава 1. Описание предметной области 6
1.1. Введение 6
1.2. Методы машинного обучения 7
1.3. Цели и задачи 8
Глава 2. Используемые подходы и решения 9
2.1. Релевантные работы 9
2.2. Используемые теоретические методы 10
2.2.1 Логистическая регрессия 11
2.2.2 Метод опорных векторов 11
2.2.3 Дерево решений 13
2.2.4 Случайный лес 15
2.3. Кроссвалидация 16
2.4. Метрики 16
2.4.1 Матрица неточностей 16
2.4.2 Precision, Recall, F-мера 17
2.4.3 ROC-анализ 18
Глава 3. Теоретическая часть 19
3.1. Описание данных 19
3.2. Подготовка данных 22
3.3. Результаты применения моделей 22
3.3.1 Логистическая регрессия 23
3.3.2 Метод опорных векторов 23
3.3.3 Дерево решений 24
3.3.4 Случайный лес 25
3.4. Анализ результатов 26
3.5. Метрики 27
3.6. Критерий 28
3.7. Комбинирование моделей 30
Глава 4. Программная реализация 31
4.1. Описание используемых программных средств 31
4.2. Реализация 32
4.2.1 Программный комплекс 32
4.2.2 Комбинирование моделей 32
4.2.3 Кроссвалидация 33
4.3. Архитектура приложения 33
4.3.1 Kernel 34
4.3.2 Компоненты методов 35
4.3.3 PredictingClass 35
4.3.4 Patient 35
4.3.5 Logic 35
4.3.6 UI 36
Заключение 37
Список литературы 38

Актуальность темы. Ежегодно от сердечно-сосудистых заболеваний(ССЗ) умирает больше людей, чем от любой другой болезни, что подтверждается информацией, приведенной на сайте Всемирной организации здравоохранения(ВОЗ) [24]. По оценкам ВОЗ, в 2016 году от ССЗ умерло 17,9 миллиона человек, что составило 31% всех случаев смерти в мире. 85% этих смертей произошло в результате сердечного приступа и инсульта [1].
Данная работа основана на информации, полученной от «Всероссийского центра экстренной и радиационной медицины им. А.М.Никифорова» МЧС России (ВЦЭРМ). При поступлении у некоторых пациентов были обнаружены симптомы ССЗ. Впоследствии у них произошло резкое ухудшение состояния здоровья. И у части из них эти осложнения привели к гибели. Требуется заблаговременно определять такие случаи, чтобы у докторов была возможность предотвратить смерти людей. Результаты данной работы позволят врачам понять, каким пациентам стоит уделять больше внимания, а также выделить статистически значимые признаки, которые имеют наибольшее значение при постановке диагноза пациенту.
Целью данного проекта является автоматизация оценки риска смерти пациента с симптомами ССЗ на основе его личных данных и данных медицинских исследований с применением методов машинного обучения.
Для выполнения обозначенной цели были выделены следующие задачи:
1. исследовать существующие методы машинного обучения и их использование в сфере сердечно-сосудистых заболеваний;
2. реализовать несколько моделей предсказания, произвести их сравнительный анализ;
3. разработать критерий с целью использования показателей ЭКГ для обучения моделей;
4. разработать архитектуру прототипа программного модуля для визуализации оценки предсказания моделей и реализовать полученные методы в данном прототипе.
Объектом исследования являются личные данные пациентов и сведения об изменении их сердечного ритма во время наблюдения, полученные от ВЦЭРМ.
Предметом исследования являются алгоритмы и методы предсказания смерти человека на основе этих данных.
Научная новизна. Все результаты, выносимые на защиту, являются новыми. Впервые был получен программный комплекс на Python, позволяющий по вводимым пользователем медицинским показателям пациента, поступившего с симптомами ССЗ, получить вероятностную оценку итога ухудшения его состояния.
Теоретическая и практическая значимость исследования. Реализация приложения на языке Python позволит врачам получить вероятность смерти человека, и, как следствие, уделить внимание пациентам, чья жизнь находится под угрозой. А также обратить внимание на признаки, которые являются наиболее значимыми при постановке диагноза.
Методология работы заключается в разработке архитектуры и реализации программы, описании реализуемых методов и алгоритмов, создании графического интерфейса для получения данных о пациенте, их обработке с последующей интерпретацией и выведением результата.
Методы. Для программной реализации приложения были использованы методы объектно-ориентированного программирования. Программная реализация осуществлялась в среде разработки PyCharm на языке программирования Python с использованием фреймворка PyQT для визуализации.
Структура и объём работы. Текст работы включает в себя введение, четыре главы, заключение и список литературы. Общий объём ВКР — 41 страница.
В главе 1 обосновывается актуальность задачи и приводится описание целей и задач данной работы
В главе 2 приведен обзор существующих решений похожих задач в данной области, а также представлено описание алгоритмов, используемых для поставленной задачи.
В главе 3 представлены результаты работы алгоритмов, которые были реализованы для решения поставленной задачи, а также сравнительный анализ моделей.
Глава 4 посвящена программной реализации моделей предсказания, а также описанию программного комплекса.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Данная выпускная работа бакалавра была посвящена реализации методов машинного обучения для прогнозирования итога ухудшения состояния пациента с симптомами ССЗ, а также созданию приложения для визуализации результата. Что имеет большое значение для работы врачей, так как поможет им предотвратить смерти людей, уделив большее внимание пациентам, которым угрожает опасность. Полученные результаты формируют задел для дальнейшей работы по улучшению точности предсказательных моделей и нахождению новых статистически значимых критериев.
В ходе выполнения данной работы были получены следующие результаты:
1. исследованы существующие методы машинного обучения, проведен анализ релевантных работ с целью выбрать наиболее подходящие в рамках задачи модели;
2. реализовано несколько моделей предсказания, произведен их сравнительный анализ;
3. разработан критерий с целью использования показателей ЭКГ для обучения моделей, улучшающий их точность;
4. разработана архитектура прототипа программного модуля для визуализации оценки предсказания моделей и все полученные методы реализованы в данном прототипе.



[1] Всемирная организация здравохранения, https://www.who.int/cardiovascular_diseases/ru(дата обращения
10.11.2020)
[2] Pedregosa, F. and Varoquaux, G. and Gramfort, A. and Michel, V.and Thirion, B. and Grisel, O. and Blondel, M. and Prettenhofer, P.and Weiss, R. and Dubourg, V. and Vanderplas, J. and Passos, A. andCournapeau, D. and Brucher, M. and Perrot, M. and Duchesnay, E.// «Scikit-learn: Machine Learning in Python». //Journal of Machine Learning Research - 2011, pp. 2825-2830.
[3] Charles R. Harris and K. Jarrod Millman and St’efan J. van der Walt and Ralf Gommers and Pauli Virtanen and David Cournapeau and Eric Wieser and Julian Taylor and Sebastian Berg and Nathaniel J. Smith and Robert Kern and Mattihttps://ru.overleaf.com/project/5fac3e9c7bd15b0c37d94b23 Picus and Stephan Hoyer and Marten H. van Kerkwijk and Matthew Brett and Allan Haldane and Jaime Fern’andez del R’IO and Mark Wiebe and Pearu Peterson and Pierre G’erard-Marchant and Kevin Sheppard and Tyler Reddy and Warren Weckesser and Hameer Abbasi and Christoph Gohlke and Travis E. Oliphant // «Array programming with NumPy».// Nature.- 2020. -№7825. pp. 357-362 //
[4] Hunter, John D// «Matplotlib: среда 2D-графики».//Computing in science engineering. -2007. -№3. pp. 90-95
[5] Zhu, F, Xu, D., Liu, Y., Lou, K., He, Z., Zhang, H., Sheng, Y., Yang, R., Li, X., Kong, X., Zhang, H.// «Machine learning for the diagnosis of pulmonary hypertension».// Kardiologiya. -2020. -№6. pp. 96-101
[6] Su, X., Xu, Y., Tan, Z., Wang, X., Yang, P., Su, Y., Jiang, Y., Qin, S., Shang, L.// «Prediction for cardiovascular diseases based on laboratory data: An analysis of random forest model».// Journal of Clinical Laboratory Analysis. -2020. -№9. e23421
[7] Priyanga, P., Pattankar, VV, Sridevi, S (// «A hybrid recurrent neural network-logistic chaos-based whale optimization framework for heart disease prediction with electronic health records».// COMPUTATIONAL INTELLIGENCE. -2021. -№1. pp.315-343.
[8] Siddiqui SY, Athar Л, Khan MA, Abbas S, Saeed Y, Khan MF, Hussain M // «Modelling, Simulation and Optimization of Diagnosis Cardiovascular Disease Using Computational Intelligence Approaches».//JOURNAL OF MEDICAL IMAGING AND HEALTH INFORMATICS. -2019. -№5. pp.1005-1022
[9] Li, P., Hu, Y. Author, Liu, Z.-P.// «Prediction of cardiovascular diseases by integrating multi-modal features with machine learning methods».//Biomedical Signal Processing and Control. -2021. -№66. 102474
[10] Yang CX, Aranoff ND, Green P, Tavassolian N// «Classification of Aortic Stenosis Using Time-Frequency Features From Chest Cardio-Mechanical Signals».//TRANSACTIONS ON BIOMEDICAL ENGINEERING. -2020. -№6. pp. 1672-1683
[11] Tasnim, F., Habiba, S.U.// «A Comparative Study on Heart Disease Prediction Using Data Mining Techniques and Feature Selection».//ICREST 2021 - 2nd International Conference on Robotics, Electrical and Signal Processing Techniques. -2021. pp. 338-341
[12] Komal Kumar, N., Lakshmi Tulasi, R., Vigneswari, D.// «Performance Analysis of Classification Methods for Cardio Vascular Disease (CVD)».//Lecture Notes in Electrical Engineering. -2021. Volume 668. pp. 1231-1238
[13] Rajalakshmi, V., Sasikala, D., Kala, A// «A Predictive Analysis for Heart Disease Using Machine Learning».//Advances in Intelligent Systems and Computing. -2021. -№1172. pp. 473-479
[14] Zhijun Wu, Zhe Huang, Yuntao Wu, Yao Jin, Yanxiu Wang, Haiyan Zhao, Shuohua Chen, Shouling Wu, Xiang Gao// «Risk stratification for mortality in cardiovascular disease survivors: A survival conditional inference tree analysis.».//Nutr Metab Cardiovasc Dis. -2021. pp. 420-428
[15] Matthieu Brucher, Matthieu Perrot, Edouard Duchesnay, David Cournapeau, Alexandre Passos, Jake Vanderplas, Vincent Dubourg, Ron Weiss, Peter Prettenhofer, Mathieu Blondel, Olivier Grisel, Fabian Pedregosa, Gael Varoquaux, Alexandre Gramfort, Vincent Michel, Bertrand Thirion // «Scikit-learn: Machine Learning in Python.>>.//Journal of Machine Learning Research. -2011. pp. 2825-2830
[16] Max Kuhn, Kjell Johnson.// «Applied Predictive Modeling». -2013. doi:10.1007/978-1-4614-6849-3
[17] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani.// «An Introduction to Statistical Learning». -2015. doi:10.1007/978-1-4614-7138-7
[18] Федеральное государственное бюджетное учреждение «Всероссийский центр экстренной и радиационной медицины им. А.М.Никифорова» МЧС России [Электронный ресурс]
https://nrcerm.ru/(дата обращения 10.11.2020)
[19] PyQT [Электронный ресурс]
https://www.qt.io/(дата обращения 10.11.2020)
[20] Tkinkter [Электронный ресурс]
https://tkdocs.com/(дата обращения 10.11.2020)
[21] Kivy [Электронный ресурс] https://kivy.org/(дата обращения 10.11.2020)
[22] Python [Электронный ресурс]
https://www.python.org/(дата обращения 10.11.2020)
[23] PyCharm [Электронный ресурс] https://www.jetbrains.com/ru-ru/pycharm/(дата обращения
10.11.2020)
[24] Всемирная организация здравоохранения, статистика о ведущих причинах смертности [Электронный ресурс] https://www.who.int/ru/news/item/ 09-12-2020-who-reveals-leading-causes-of-death-and-disability- worldwide-2000-2019 (дата обращения 10.11.2020)
[25] What to do with “small” data? [Электронный ресурс] https://medium.com/rants-on-machine-learning/what-to-do-with-small-data-d253254d1a89 (дата обращения
10.11.2020)
[26] Руководство по измерению QT при проведении ЭКГ мониторинга в рамках внедрения новых лекарственных препаратов и краткосрочных схем лечения лекарственно-устойчивого туберкулёза [Электронный ресурс]
https://www.challengetb.org/publications/tools/pmdt/Guidance_on_ECG_monitoring_in_NDR_RUS.pdf (дата обращения 10.11.2020)
[27] Как выбрать метрики для валидации результата Machine Learning [Электронный ресурс]
http://blog.datalytica.ru/2018/05/blog-post.html7mM (дата обращения 10.11.2020)
[28] Кросс-валидация (Cross-validation) [Электронный ресурс]
https://long-short.pro/post/kross-validatsiya-cross-validation-304(дата обращения 10.11.2020)


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ