Введение 3
Постановка задачи 5
Существующие методы решения задачи 6
1. Исходные данные 8
2. Подготовка данных 9
2.1. Выявление факторов, значимых для прогнозирования 9
2.1.1. Количественные переменные 10
2.1.2. Качественные переменные 11
2.2. Разбиение базы на обучающую и тестовую выборки 12
2.3. Преобразование количественных данных в бинарные 14
2.4. Подсчет частот 16
3. Прогностические модели 18
3.1. Модели, построенные по всем данным 18
3.1.1. Байесовский классификатор 18
3.1.2. Логистическая регрессия 21
3.2. Модели, построенные по параметрам CURB-65 24
3.2.1. Шкала CURB-65 и ее модификация 24
3.2.2. Байесовский классификатор 28
3.2.3. Логистическая регрессия 29
Выводы 32
Заключение 33
Список использованных источников 35
Для корректной постановки диагноза врачу необходимо обработать большой объем информации о пациенте, включающий в себя данные о жалобах и анализах, сопутствующих заболеваниях, результатах медицинских исследований и другие. К тому же медицина стремительно развивается, появляются новые методики исследований, растет объем знаний, но время, отведенное на прием одного пациента, остается неизменным. Обработка такого количества информации в ограниченное время - это сложная задача даже для опытных врачей, не говоря о молодых специалистах. В связи с этим растет число врачебных ошибок, которые приводят к различным негативным явлениям - от снижения эффективности работы систем здравоохранения до роста смертности [1]. Помочь предотвращать такие ошибки может система поддержки принятия решений.
В общем виде под термином «система поддержки принятия решений» понимается компьютерная система, которая путем сбора и анализа информации может влиять на процессы принятия решений в различных областях человеческой деятельности, в том числе - в медицине. В здравоохранении такие системы называются уточненным термином «системы поддержки принятия врачебных решений» (СППВР) [2].
Основываясь на результатах, полученных с помощью СППВР, врачами могут приниматься решения о госпитализации или помещении пациента в отделение интенсивной терапии, также с помощью них можно оценивать риски развития осложнений.
Некоторые компании занимаются разработкой таких систем. Например, компания «К-скай» на основе анализа данных о пациенте строит прогнозы развития некоторых заболеваний [3]. Аналогичный продукт реализован в компании «Соцмедика». В проекте «Медицинские скрининг системы» реализована СППВР в радиологии - с помощью нее можно детектировать малозаметные признаки различных патологий.
Также в 2019-м году был издан указ президента Российской Федерации «О развитии искусственного интеллекта» с целью обеспечения его ускоренного развития. Согласно указу, должны быть созданы условия для эффективного взаимодействия государства, организаций и граждан в сфере развития искусственного интеллекта (ИИ), что может позволить российским технологиям ИИ занять значительную долю мирового рынка [4].
Таким образом, можно отметить, что процесс реализации систем поддержки принятия решений в медицине не стоит на месте, с каждым годом появляются новые данные, на основе которых можно разрабатывать новые продукты или дополнять уже имеющиеся.
В основе каждой С1111ВР лежит некоторая прогностическая модель. Прогностические модели играют важную роль в медицине. С помощью них можно прогнозировать тяжесть заболевания, осложнения, исход и некоторые другие параметры.
1одходов к построению прогностических моделей существует огромное множество, у всех есть свои преимущества и недостатки и пределы применимости. Также в медицинских исследованиях важны не только оценки прогноза, но и параметры, значимые для прогнозирования, так как они показывают, на что стоит обращать особенное внимание.
Цель данной работы - провести сравнительный анализ прогностических моделей для поддержки принятия врачебных решений.
Системы поддержки принятия решений играют важную роль в различных областях человеческой деятельности, особенно в медицине. Опираясь на результаты, полученные с помощью таких систем, можно выбирать подходы к дальнейшему лечению пациентов, ставить предварительные диагнозы, прогнозировать исходы болезней.
Существует множество подходов к построению систем, в разных задачах одни и те же подходы могут давать разные результаты. Также каждый подход имеет свои преимущества и недостатки.
В данной работе было проведено сравнение прогностических моделей на базе данных по всем пациентам, госпитализированным с внебольничной пневмонией во все стационары Томской области в 2017 году. Прогнозируемой переменной являлся летальный исход.
На первом этапе были отобраны параметры, значимые для прогнозирования исхода. Все пациенты были разбиты на две группы (умершие и выжившие), были выделены параметры, по которым наблюдались статистически значимые различия. Для реализации этапа использовался программный пакет STATISTICA 10.
Следующим этапом для сравнения моделей база была разбита на тестовую и обучающую выборки. Все модели применялись к тестовой выборке.
Так как для некоторых моделей требуются бинарные данные, все количественные параметры были переведены в бинарный вид с использованием точек разделения, полученных с помощью ROC-анализа. ROC-анализ проводился в пакетах MedCalc и MATLAB R2020a.
Затем были реализованы несколько моделей на разных наборах данных: байесовский классификатор, логистическая регрессия, шкала CURB- 65 и ее модификация. Модели были реализованы в пакетах STATISTICA и MATLAB. Лучший результат показала логистическая регрессия с измененным пороговым значением, построенная на параметрах, входящих в шкалу CURB-65. С помощью нее удалось добиться чувствительности 1,0 - то есть правильно классифицировать всех умерших пациентов.
Результаты работы были представлены на следующих конференциях:
• LI Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS’20) (статья «Сравнение способов преобразования количественных данных в бинарные при предсказании рисков осложнений внебольничной пневмонии»), апрель 2020 г.
• IV Международная конференция "Устойчивость и процессы управления", посвященная 90-летию со дня рождения чл.-корр. РАН В.И. Зубова: памяти профессора В.И. Зубова (доклад «Detection of the Community- Acquired Pneumonia Factors Leading to Death»), октябрь 2020 г.
• LII Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS'21) (доклад «Сравнительный анализ прогностических моделей для поддержки принятия врачебных решений»), апрель 2021 г.
В дальнейшем можно рассмотреть другие подходы, например, нейронные сети или системы, построенные на нечеткой логике.
1. Гусев А. В., Зарубина Т. В. Поддержка принятия врачебных решений в медицинских информационных системах медицинской организации // Врач и информационные технологии. 2017. - № 2. - С. 60-72.
2. Greenes R.A. Clinical decision support: the road ahead / R.A. Greenes. - Boston: Elsevier Academic Press, 2007. - 581 p.
3. Система поддержки принятия врачебных решений
Webiomed.DHRA [Электронный ресурс]. - Режим доступа: https://webiomed.ai/products/webiomed-dhra/_(дата обращения: 20.03.20).
4. Указ Президента Российской Федерации от 10.10.2019 г. № 490 «О
развитии искусственного интеллекта в Российской Федерации» [Электронный ресурс]. - Режим доступа:
http://www.kremlin.ru/acts/bank/44731(дата обращения: 20.03.20).
5. R. M. Anjana. Prevalence of diabetes and prediabetes (impaired fasting glucose and/or impaired glucose tolerance) in urban and rural India: Phase I results of the Indian Council of Medical Research-INdia DIABetes (ICMR-INDIAB) study. Diabetologia (2011) 54:3022-3027 DOI: 10.1007/s00125-011-2291-5.
6. Gau JT, Acharya U, Khan S, Heh V, Mody L, Kao TC. Pharmacotherapy and the risk for community-acquired pneumonia. BMC Geriatr. 2010 Jul 6;10:45. DOI: 10.1186/1471-2318-10-45.
7. Дарвин В.В., Егоров А.А., Микшина В.С., Суровов А.А. Интеллектуальная информационная система поддержки принятия решений хирурга по выбору способа завершения операции // Современные проблемы науки и образования. - 2011. - № 5.
8. Sousa Rafael, Marques Oge, Soares Fabrizzio, Sene Iwens, Oliveira,
Leandro, Spoto Edmundo. (2013). Comparative Performance Analysis of Machine Learning Classifiers in Detection of Childhood Pneumonia Using Chest Radiographs. Procedia Computer Science. 18. 2579-2582.
DOI: 10.1016/j.procs.2013.05.444.
9. Rother A-K, Schwerk N, Brinkmann F, Klawonn F, Lechner W, Grigull L (2015) Diagnostic Support for Selected Paediatric Pulmonary Diseases Using Answer-Pattern Recognition in Questionnaires Based on Combined Data Mining Applications—A Monocentric Observational Pilot Study. PLoS ONE 10(8): DOI: 10.1371/journal.pone.0135180.
10. M.R.K. Mookiah, U. Rajendra Acharya, Roshan Joy Martis, Chua Kuang Chua, C.M. Lim, E.Y.K. Ng, Augustinus Laude, Evolutionary algorithm based classifier parameter tuning for automatic diabetic retinopathy grading: A hybrid feature extraction approach, Knowledge-Based Systems, Volume 39, 2013, Pages 9-22, ISSN 0950-7051, DOI: 10.1016/j.knosys.2012.09.008.
11. Ance Kancere, Ieva Markovica, Zigurds Markovics. Computer system for diagnosis in medicine domain //Technologies of Computer Control. 2013. p. 44-72.
12. Разводин Р.А. Интеллектуальная система поддержки принятия врачебных решений в дерматовенерологии // Проблемы медицинской микологии. 2014. Т. 16. № 3. С. 59-65.
13. Коробова Л.А., Гладких Т.В. Разработка модели принятия решения для постановки диагноза заболеваний на основе нечеткой логики // Вестник ВГУИТ. 2018. Т. 80. № 4. С. 80-89. DOI: 10.20914/2310- 1202-2018-4-80-89.
14. Локтюхин В.Н., Черепнин A.A. Поддержка принятия решений на основе нейро-нечеткой технологии при диагностике патологий желудочно-кишечного тракта // Биотехносфера. №2. С-Пб.: Политехника. 2009. С. 20-23.
15. Гуляев Ю.В., Никитов Д.С., Пономарев Н.В. Исследование возможности создания и применения системы поддержки принятия решений при постановке диагноза в области онкопатологии // Радиотехника и электроника. 2006. - №11. - С. 1387-1397.
16. Егоров А. А. Модель принятия решения хирурга / А. А. Егоров, B. C. Микшина // Вестн. новых мед. Технологий, 2011. - Т. 7, № 4. - С. 178 - 181.
17. Мокина Е.Е., Марухина О.В., Шагарова М.Д., Дубинина И.А. Использование методов Data mining при принятии медицинских диагностических решений // Fundamental research. 2016. - № 5. - С. 269-274.
18. 10 ведущих причин смерти в мире [Электронный ресурс]. - Режим доступа:https://www.who.int/ru/news-room/fact-sheets/detail/the-top-10-causes-of-death(дата обращения: 10.12.2019).
19. Сидоренко Е.В. Методы математической обработки в психологии / Е.В. Сидоренко. - СПб.: Речь, 2003. - 350 с.
20. Критерий Хи-квадрат Пирсона [Электронный ресурс]. - Режим
доступа: https: //medstatistic.ru/methods/methods4. html(дата обращения:
06.12.2020).
21. Анализы: референсные значения = норма? [Электронный ресурс]. - Режим доступа:http://www.laboratorii.ru/reference-range/(дата обращения: 20.01.20).
22. Фесенко О.В., Синопальников А.И. Тяжелая внебольничная пневмония и шкалы оценки прогноза. Практическая пульмонология. 2014; 2: 20-26 / Fesenko O., Sinopalnikov A. Severe community-acquired pneumonia and prognostic scores. Practical pulmonology. 2014, 2: 20-26.
23. Королюк И.П.. Медицинская информатика: Учебник / - 2 изд., перераб. и доп. - Самара : ООО «Офорт» : ГБОУ ВПО «СамГМУ».2012.- 244 с. 2012.
24. Анализ с помощью характеристической кривой [Электронный
ресурс]. - Режим доступа: https://wiki.loginom.ru/articles/roc-analysis.html
(дата обращения: 05.01.2020).
25. Бейли Н. Т. Дж. Математика в биологии и медицине: Пер. с англ. - М.: Мир, 1970. - 326 с.
26. Наивный байесовский классификатор [Электронный ресурс]. - Режим доступа: http://bazhenov.me/blog/2012/06/11/naive-bayes.html(дата обращения: 06.12.2020).
27. Красько О. Статистический анализ данных в медицинских исследованиях: учеб. метод. пособие. Минск 2014. - 127 с.
28. Логистическая регрессия [Электронный ресурс]. - Режим доступа:
http://statistica.ru/theory/logisticheskaya-regressiya/ (дата обращения:
10.01.2021).
29. Министерство здравоохранения Российской Федерации
Клинические рекомендации. Внебольничная пневмония (МКБ 10: J13-J18) 2018 г. [Электронный ресурс] http://spulmo.ru>(дата обращения: 05.01.2020).
30. Lim W.S., van der Eerden M.M., Laing R. et al. Defining community
acquired pneumonia severity on presentation to hospital: an international derivation and validation study. Thorax. 2003; 58(5): 377-82.
DOI: 10.1136/thorax.58.5.377.
31. Falcone M, Corrao S, Venditti M, Serra P, Licata G. Performance of PSI,
CURB-65, and SCAP scores in predicting the outcome of patients with community-acquired and healthcare-associated pneumonia [published correction appears in Intern Emerg Med. 2013 Sep;8(6):549]. Internal and Emergency
Medicine. 2011;6(5):431-436. DOI: 10.1007/s11739-011-0521-y.
32. Aronsky, Dominik & Dean, Nathan. (2004). Admission Decision For Pneumonia: A Validation Study of the CURB-65 Criteria. CHEST Journal. DOI: 10.1378/chest.126.4_MeetingAbstracts.738S-a.
33. Ananda-Rajah MR, Charles PG, Melvani S, Burrell LL, Johnson PD, Grayson ML. Comparing the pneumonia severity index with CURB-65 in patients admitted with community acquired pneumonia. Scandinavian Journal of Infectious Diseases. 2008; 40(4):293-300. DOI: 10.1080/00365540701663381.
34. Ilg A., Moskowitz A., Konanki V., et al. Performance of the CURB-65
Score in Predicting Critical Care Interventions in Patients Admitted With Community-Acquired Pneumonia. Ann Emerg Med. 2019; 74(1): 60-68.
DOI: 10.1016/j.annemergmed.2018.06.017.