Сравнительный анализ прогностических моделей для поддержки принятия врачебных решений
|
Введение 3
Постановка задачи 5
Существующие методы решения задачи 6
1. Исходные данные 8
2. Подготовка данных 9
2.1. Выявление факторов, значимых для прогнозирования 9
2.1.1. Количественные переменные 10
2.1.2. Качественные переменные 11
2.2. Разбиение базы на обучающую и тестовую выборки 12
2.3. Преобразование количественных данных в бинарные 14
2.4. Подсчет частот 16
3. Прогностические модели 18
3.1. Модели, построенные по всем данным 18
3.1.1. Байесовский классификатор 18
3.1.2. Логистическая регрессия 21
3.2. Модели, построенные по параметрам CURB-65 24
3.2.1. Шкала CURB-65 и ее модификация 24
3.2.2. Байесовский классификатор 28
3.2.3. Логистическая регрессия 29
Выводы 32
Заключение 33
Список использованных источников 35
Постановка задачи 5
Существующие методы решения задачи 6
1. Исходные данные 8
2. Подготовка данных 9
2.1. Выявление факторов, значимых для прогнозирования 9
2.1.1. Количественные переменные 10
2.1.2. Качественные переменные 11
2.2. Разбиение базы на обучающую и тестовую выборки 12
2.3. Преобразование количественных данных в бинарные 14
2.4. Подсчет частот 16
3. Прогностические модели 18
3.1. Модели, построенные по всем данным 18
3.1.1. Байесовский классификатор 18
3.1.2. Логистическая регрессия 21
3.2. Модели, построенные по параметрам CURB-65 24
3.2.1. Шкала CURB-65 и ее модификация 24
3.2.2. Байесовский классификатор 28
3.2.3. Логистическая регрессия 29
Выводы 32
Заключение 33
Список использованных источников 35
Для корректной постановки диагноза врачу необходимо обработать большой объем информации о пациенте, включающий в себя данные о жалобах и анализах, сопутствующих заболеваниях, результатах медицинских исследований и другие. К тому же медицина стремительно развивается, появляются новые методики исследований, растет объем знаний, но время, отведенное на прием одного пациента, остается неизменным. Обработка такого количества информации в ограниченное время - это сложная задача даже для опытных врачей, не говоря о молодых специалистах. В связи с этим растет число врачебных ошибок, которые приводят к различным негативным явлениям - от снижения эффективности работы систем здравоохранения до роста смертности [1]. Помочь предотвращать такие ошибки может система поддержки принятия решений.
В общем виде под термином «система поддержки принятия решений» понимается компьютерная система, которая путем сбора и анализа информации может влиять на процессы принятия решений в различных областях человеческой деятельности, в том числе - в медицине. В здравоохранении такие системы называются уточненным термином «системы поддержки принятия врачебных решений» (СППВР) [2].
Основываясь на результатах, полученных с помощью СППВР, врачами могут приниматься решения о госпитализации или помещении пациента в отделение интенсивной терапии, также с помощью них можно оценивать риски развития осложнений.
Некоторые компании занимаются разработкой таких систем. Например, компания «К-скай» на основе анализа данных о пациенте строит прогнозы развития некоторых заболеваний [3]. Аналогичный продукт реализован в компании «Соцмедика». В проекте «Медицинские скрининг системы» реализована СППВР в радиологии - с помощью нее можно детектировать малозаметные признаки различных патологий.
Также в 2019-м году был издан указ президента Российской Федерации «О развитии искусственного интеллекта» с целью обеспечения его ускоренного развития. Согласно указу, должны быть созданы условия для эффективного взаимодействия государства, организаций и граждан в сфере развития искусственного интеллекта (ИИ), что может позволить российским технологиям ИИ занять значительную долю мирового рынка [4].
Таким образом, можно отметить, что процесс реализации систем поддержки принятия решений в медицине не стоит на месте, с каждым годом появляются новые данные, на основе которых можно разрабатывать новые продукты или дополнять уже имеющиеся.
В основе каждой С1111ВР лежит некоторая прогностическая модель. Прогностические модели играют важную роль в медицине. С помощью них можно прогнозировать тяжесть заболевания, осложнения, исход и некоторые другие параметры.
1одходов к построению прогностических моделей существует огромное множество, у всех есть свои преимущества и недостатки и пределы применимости. Также в медицинских исследованиях важны не только оценки прогноза, но и параметры, значимые для прогнозирования, так как они показывают, на что стоит обращать особенное внимание.
Цель данной работы - провести сравнительный анализ прогностических моделей для поддержки принятия врачебных решений.
В общем виде под термином «система поддержки принятия решений» понимается компьютерная система, которая путем сбора и анализа информации может влиять на процессы принятия решений в различных областях человеческой деятельности, в том числе - в медицине. В здравоохранении такие системы называются уточненным термином «системы поддержки принятия врачебных решений» (СППВР) [2].
Основываясь на результатах, полученных с помощью СППВР, врачами могут приниматься решения о госпитализации или помещении пациента в отделение интенсивной терапии, также с помощью них можно оценивать риски развития осложнений.
Некоторые компании занимаются разработкой таких систем. Например, компания «К-скай» на основе анализа данных о пациенте строит прогнозы развития некоторых заболеваний [3]. Аналогичный продукт реализован в компании «Соцмедика». В проекте «Медицинские скрининг системы» реализована СППВР в радиологии - с помощью нее можно детектировать малозаметные признаки различных патологий.
Также в 2019-м году был издан указ президента Российской Федерации «О развитии искусственного интеллекта» с целью обеспечения его ускоренного развития. Согласно указу, должны быть созданы условия для эффективного взаимодействия государства, организаций и граждан в сфере развития искусственного интеллекта (ИИ), что может позволить российским технологиям ИИ занять значительную долю мирового рынка [4].
Таким образом, можно отметить, что процесс реализации систем поддержки принятия решений в медицине не стоит на месте, с каждым годом появляются новые данные, на основе которых можно разрабатывать новые продукты или дополнять уже имеющиеся.
В основе каждой С1111ВР лежит некоторая прогностическая модель. Прогностические модели играют важную роль в медицине. С помощью них можно прогнозировать тяжесть заболевания, осложнения, исход и некоторые другие параметры.
1одходов к построению прогностических моделей существует огромное множество, у всех есть свои преимущества и недостатки и пределы применимости. Также в медицинских исследованиях важны не только оценки прогноза, но и параметры, значимые для прогнозирования, так как они показывают, на что стоит обращать особенное внимание.
Цель данной работы - провести сравнительный анализ прогностических моделей для поддержки принятия врачебных решений.
Системы поддержки принятия решений играют важную роль в различных областях человеческой деятельности, особенно в медицине. Опираясь на результаты, полученные с помощью таких систем, можно выбирать подходы к дальнейшему лечению пациентов, ставить предварительные диагнозы, прогнозировать исходы болезней.
Существует множество подходов к построению систем, в разных задачах одни и те же подходы могут давать разные результаты. Также каждый подход имеет свои преимущества и недостатки.
В данной работе было проведено сравнение прогностических моделей на базе данных по всем пациентам, госпитализированным с внебольничной пневмонией во все стационары Томской области в 2017 году. Прогнозируемой переменной являлся летальный исход.
На первом этапе были отобраны параметры, значимые для прогнозирования исхода. Все пациенты были разбиты на две группы (умершие и выжившие), были выделены параметры, по которым наблюдались статистически значимые различия. Для реализации этапа использовался программный пакет STATISTICA 10.
Следующим этапом для сравнения моделей база была разбита на тестовую и обучающую выборки. Все модели применялись к тестовой выборке.
Так как для некоторых моделей требуются бинарные данные, все количественные параметры были переведены в бинарный вид с использованием точек разделения, полученных с помощью ROC-анализа. ROC-анализ проводился в пакетах MedCalc и MATLAB R2020a.
Затем были реализованы несколько моделей на разных наборах данных: байесовский классификатор, логистическая регрессия, шкала CURB- 65 и ее модификация. Модели были реализованы в пакетах STATISTICA и MATLAB. Лучший результат показала логистическая регрессия с измененным пороговым значением, построенная на параметрах, входящих в шкалу CURB-65. С помощью нее удалось добиться чувствительности 1,0 - то есть правильно классифицировать всех умерших пациентов.
Результаты работы были представлены на следующих конференциях:
• LI Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS’20) (статья «Сравнение способов преобразования количественных данных в бинарные при предсказании рисков осложнений внебольничной пневмонии»), апрель 2020 г.
• IV Международная конференция "Устойчивость и процессы управления", посвященная 90-летию со дня рождения чл.-корр. РАН В.И. Зубова: памяти профессора В.И. Зубова (доклад «Detection of the Community- Acquired Pneumonia Factors Leading to Death»), октябрь 2020 г.
• LII Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS'21) (доклад «Сравнительный анализ прогностических моделей для поддержки принятия врачебных решений»), апрель 2021 г.
В дальнейшем можно рассмотреть другие подходы, например, нейронные сети или системы, построенные на нечеткой логике.
Существует множество подходов к построению систем, в разных задачах одни и те же подходы могут давать разные результаты. Также каждый подход имеет свои преимущества и недостатки.
В данной работе было проведено сравнение прогностических моделей на базе данных по всем пациентам, госпитализированным с внебольничной пневмонией во все стационары Томской области в 2017 году. Прогнозируемой переменной являлся летальный исход.
На первом этапе были отобраны параметры, значимые для прогнозирования исхода. Все пациенты были разбиты на две группы (умершие и выжившие), были выделены параметры, по которым наблюдались статистически значимые различия. Для реализации этапа использовался программный пакет STATISTICA 10.
Следующим этапом для сравнения моделей база была разбита на тестовую и обучающую выборки. Все модели применялись к тестовой выборке.
Так как для некоторых моделей требуются бинарные данные, все количественные параметры были переведены в бинарный вид с использованием точек разделения, полученных с помощью ROC-анализа. ROC-анализ проводился в пакетах MedCalc и MATLAB R2020a.
Затем были реализованы несколько моделей на разных наборах данных: байесовский классификатор, логистическая регрессия, шкала CURB- 65 и ее модификация. Модели были реализованы в пакетах STATISTICA и MATLAB. Лучший результат показала логистическая регрессия с измененным пороговым значением, построенная на параметрах, входящих в шкалу CURB-65. С помощью нее удалось добиться чувствительности 1,0 - то есть правильно классифицировать всех умерших пациентов.
Результаты работы были представлены на следующих конференциях:
• LI Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS’20) (статья «Сравнение способов преобразования количественных данных в бинарные при предсказании рисков осложнений внебольничной пневмонии»), апрель 2020 г.
• IV Международная конференция "Устойчивость и процессы управления", посвященная 90-летию со дня рождения чл.-корр. РАН В.И. Зубова: памяти профессора В.И. Зубова (доклад «Detection of the Community- Acquired Pneumonia Factors Leading to Death»), октябрь 2020 г.
• LII Международная научная конференция аспирантов и студентов «Процессы управления и устойчивость» Control Processes and Stability (CPS'21) (доклад «Сравнительный анализ прогностических моделей для поддержки принятия врачебных решений»), апрель 2021 г.
В дальнейшем можно рассмотреть другие подходы, например, нейронные сети или системы, построенные на нечеткой логике.



