ВВЕДЕНИЕ 3
1 ДИАГНОСТИКА БОЛЕЗНЕЙ ПОЧЕК 6
1.1 Эпидемиология болезней почек 6
1.2 Этиология болезней почек 10
1.3 Патогенез болезней почек 12
1.4 Диагностические признаки болезней 16
1.5 Методика распознавания болезней почек (обоснование
потребности в информационной системе) 21
1.6 Основные результаты и выводы по разделу 1 23
2 ИНФОРМАЦИОННАЯ СИСТЕМА РАСПОЗНАВАНИЯ БОЛЕЗНЕЙ ПОЧЕК 25
2.1 Классификация и структура информационных систем
распознавания болезней 25
2.2 Информационные системы распознавания болезней (примеры).... 30
2.3 Структура информационной системы распознавания болезней
почек 34
2.4 База данных пациентов с болезнями почек 36
2.5 Пользовательский интерфейс базы данных 41
2.6 Основные результаты и выводы по разделу 2 43
3 ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ РЕЗУЛЬТАТОВ ОБСЛЕДОВАНИЯ В EXCEL 46
3.1 Методика обработки статистических данных 46
3.2 Построение вариационных рядов значений признаков 49
3.3 Вычисление характеристик распределений 53
3.4 Расчёт корреляции значений признаков 61
3.5 Вычисление вероятностей интервалов значений признаков 62
3.6 Основные результаты и выводы по разделу 3 65
4 МЕТОДИКА РАСПОЗНАВАНИЯ БОЛЕЗНЕЙ ПОЧЕК 67
4.1 Методы распознавания болезней 67
4.2 Диагностические модели болезней почек 70
4.3 Программный комплекс формирования диагностической модели 73
4.4 Программный комплекс распознавания болезней почек 76
4.5 Интерфейс пользователя 79
4.6 Вычислительный эксперимент по распознаванию болезней почек 83
4.7 Основные результаты и выводы по разделу 4 85
ЗАКЛЮЧЕНИЕ 88
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 92
ПРИЛОЖЕНИЕ А._ ПРОГРАММНЫЙ КОМПЕКС ФОРМИРОВАНИЯ ДИАГНОСТИЧЕСКОЙ МОДЕЛИ И РАСПОЗНОВАНИЯ БОЛЕЗНЕЙ ПОЧЕК МЕТОДОМ БАЙЕСА
Одной из значимых проблем современной медицины являются заболевания почек, которые относятся к группе болезней мочеполовой системы. По данным Росстата заболеваемость болезнями почек на 100000 человек населения Пензенской области в 2011 году составляло 337,9 человек, а в 2016 году показатель снизился до 255 человек [1]. Заболеваемость населения жителей Пензенской области гломерулярными и тубулоинтерстициальными болезнями почек за 2014 год составляла 522432 человек.
Следовательно, меры по борьбе с болезнями мочеполовой системы, принимаемые государством, дают свои результаты. Но, несмотря на тенденцию к снижению заболеваемости, на данный момент она остается на достаточно высоком уровне.
Заболевания почек имеют тяжелые осложнения со стороны сердечно - сосудистой системы, а также требуют дорогостоящих методов лечения и поддержания жизни пациента в терминальной стадии, таких как гемодиализ и пересадка почки.
Поэтому заболевания почек необходимо своевременно диагностировать и лечить.
Диагностика заболеваний почек является трудоёмким процессом, что в условиях массового обращения пациентов, требует привлечения к диагностике большого числа квалифицированных специалистов. Совокупность данных факторов не исключает возникновения диагностических ошибок. Снижение трудоёмкости и повышение достоверности постановки диагноза, достигается разработкой и внедрением информационных систем дифференциальной диагностики заболеваний.
Проблема
Снижение трудоёмкости постановки диагноза достигается за счет автоматизации принятия решений. Повышение достоверности диагноза достигается за счёт принятия решений на основе опыта высококвалифицированных специалистов. Данный опыт собран и хранится в базе данных информационной системы, содержащей результаты обследований и достоверные диагнозы пациентов.
На данный момент достаточно большое количество разработчиков занимается исследованием и созданием информационных систем. Однако результаты исследований не доведены до методик проектирования систем распознавания заболеваний, в части проектирования базы данных диагнозов и результатов обследования пациентов, формирования вероятностной диагностической модели на основе базы данных, статистических методов распознавания.
Объект исследования - информационные технологии и системы распознавания болезней почек.
Предмет исследования - модели, методы и алгоритмы статистического распознавания болезней почек.
Цель работы - разработка элементов информационной системы дифференциальной диагностики болезней почек на основе статистических методов, обеспечивающих увеличение достоверности, снижение трудоемкости постановки диагноза и помощь специалисту в постановке правильного диагноза.
Задачи:
1) произвести нозологический анализ заболеваний почек;
2) произвести анализ историй болезней пациентов с заболеваниями почек, систематизировать полученные данные и создать базу данных пациентов с болезнями почек;
3) произвести обработку полученных данных в Excel и сформировать достоверную диагностическую модель;
4) реализовать методику распознавания заболеваний с использованием статистического метода Байеса, разработать необходимые алгоритмы и создать программный комплекс распознавания заболеваний почек.
1 Несмотря на тенденцию к снижению заболеваемости населения болезнями почек, на данный момент она остается на достаточно высоком уровне (таблица 1.2). Большая распространенность этого заболевания приводит к увеличению нагрузки на медицинский персонал, за счет массового обращения пациентов. Основным этиологическим фактором развития пиелонефрита и гломерулонефрита являются микроорганизмы. (таблица 1.5, 1.6). Развитие заболеваний болезней почек происходит в три периода: период максимальной активности, период стихания, период ремиссии. Острые формы обоих заболеваний характеризуются увеличением проницаемости почечного фильтра и появлением в моче лейкоцитов, эритроцитов. Нарушение работы почечного фильтра также сопровождается накоплением в крови азотистых шлаков, в том числе и креатинина. Основными методами диагностики острого пиелонефрита и гломерулонефрита являются лабораторные методы. Так как общий анализ мочи входит в перечень исследований общей диагностики и позволяет быстро получить результаты, то в создании информационной системы мы количество лейкоцитов и эритроцитов, а также биохимический анализ крови, в частности, уровень креатинина (таблица 1.13). Эти показатели удобны для создания информационной системы, так как являются количественными признаками и появляются при обоих заболеваниях. При анализе литературы для данных показателей законы распределения и их характеристики выявлены не были. Следовательно, требуется провести анализ историй болезней пациентов с заболеваниями почек с целью выявления распределения и его параметров, а также зависимости между диагностическими признаками. Распознавание болезней почек является трудоемким процессом, который происходит в условиях дефицита времени и зависит от опыта и квалификации врача - специалиста. Все эти факторы не исключают возможности возникновения диагностических ошибок.
Уменьшение трудоёмкости и увеличение достоверности постановки диагноза, может быть достигнуто путем разработки и внедрения информационных систем дифференциальной диагностики заболеваний.
2 Разрабатываемая информационная система по области применения относится к медицинским системам, используемым для диагностики заболеваний почек и обучения студентов медицинских ВУЗов, а по назначению к системам вычислительной диагностики. В существующих экспертных системах входными данными чаще всего являются субъективные жалобы пациентов, что имеет более низкую информативность по сравнению с данными лабораторных анализов. В рассматриваемых системах не заложена методика построения вероятностной диагностической модели на основе базы данных. В связи с этим разработка информационной системы, содержащей базу данных, а также решатель для формирования диагностической модели является актуальной задачей. Структура информационной системы распознавания болезней почек состоит из трех основных элементов: базы данных, решателя и интерфейса пользователя Сформированная база данных, содержит результаты обследования и диагнозы пациентов с заболеваниями почек, собранные на базе нефрологического отделения ПОКБ им. Н.Н. Бурденко и урологического отделения ГБУЗ КМРБ. Принятие диагностических решений на основе опыта высококвалифицированных специалистов ведет к повышению достоверности постановки диагноза. Простота и доступность интерфейса созданной базы данных, обеспечивается за счет кнопочных форм MS Access (рисунок 2.21, 2.22). Простой пользовательский интерфейс позволяет снизить требования к квалификации медицинских работников в области информационных технологий.
3 Методика статистической обработки данных включает в себя экспорт результатов анализов, группировку данных, построение гистограммы распределения частот, расчет общих статистических характеристик, определение законов распределения, оценку корреляции диагностических признаков, вычисление вероятностей интервалов значений признаков экспорт данных статистической обработки из MS Excel в MS Access (рисунок 3.1). Значения количества лейкоцитов и эритроцитов в моче, а также уровень креатинина в крови подчиняются нормальному распределению (таблица 3.7). Произведено вычисление обобщающих статистических характеристик (таблица 3.4). Наибольшей изменчивостью из рассматриваемых признаков обладает уровень креатинина у больных гломерулонефритом (198 мкмоль/л). Между рассматриваемыми диагностическими признаками наблюдается слабая теснота связи (коэффициент парной корреляции находится в пределах от 0,1 до 0,3). Следовательно, связь между диагностическими признаками незначительная и не представляет практического интереса. Каждый количественный признак был разделен на 8 классовых интервалов. В результате получены необходимые данные для формирования вероятностной диагностической модели.
4 Среди вероятностных методов наиболее подходящим является метод Байеса. При достаточном объеме статистических данных он является наиболее надежным и эффективным. Методика распознавания болезней почек, основанная на методе Байеса, предусматривает сбор статистических данных из карт пациентов с болезнями почек, выбор наиболее информативных количественных признаков заболеваний, проектирование базы данных, статистическую обработку данных обследований и диагнозов, формирование диагностической модели, применение метода Байеса для распознавания состояния здоровья (рисунок 4.2). Вероятностная диагностическая модель представляет собой таблицу, содержащую результаты вычислений статистических оценок вероятностей диагнозов и условных вероятностей интервалов значений признаков. Формирование диагностической модели включает в себя вычисление условных вероятностей значений признака и оценку вероятностей диагнозов (рисунок 4.5). Методика распознавания болезней почек методом Байеса состоит из ввода значения признака, определения интервала к которому относится введенный признак, определения апостериорных вероятностей трех возможных диагнозов по формуле Байеса, сравнение вероятностей и принятие диагностического решения (таблица 4.4). Использование нескольких диагностических признаков дает более высокую вероятность и, как следствие, более достоверные результаты. Наличие интерфейса позволяет упростить взаимодействие пользователя с программой и минимизировать время необходимое для его обучения (таблица 4.15). Анализ результатов вычислительного эксперимента (таблица 4.6) позволяет утверждать об эффективности информационной системы распознавания болезней почек. В связи с чем, может быть внедрена в медицинские Вузы с целью обучения студентов, а также в лечебно-профилактические учреждения в качестве «помощника» начинающим специалистам. Повышение достоверности распознавания болезней почек возможно за счет увеличения количества используемых в системе диагностических признаков.
1 Суринов, А.Е. Федеральная служба государственной статистики
(Росстат). Российский статистический ежегодник за 2017 год.
Статистический сборник / А.Е. Суринов, Э.Ф. Баранов, Т.С. Безбородова, Н.С. Бугакова, М.И. Гальвановский. Москва, 2017. 688 с.
2 Кокорина, Е.П. Заболеваемость всего населения России в 2014 году. Статистические материалы / Е.П.Кокорина, В.И. Стародубов. Москва, 2015. 142 с.
3 Тареева, И.Е. Нефрология. Руководство для врачей / И.Е. Тареева. - Москва. Медицина, 2000. 688 с.
4 Мухина, Н.А. Внутренние болезни. Том 1 / Н.А. Мухина - Москва. Медицина, 2008. 671 с.
5 Князева Л.И. Внутренние болезни / Л.И. Князева, Л.А. Князева, И.И. Горяйнов. КГМУ, 2013. 624 с.
6 Мухин Н.А. Пропедевтика внутренних болезней /Н.А. Мухин, В.С. Моисеев. - Москва. ГЭОТАР - Медиа, 2008. 857 с.
7 Батюшин, М.М. Нефрология. Ключи к трудному диагнозу / М.М. Батюшин. - Элиста. ЗАОр НЛП «Джангар», 2009. 168 с.
8 Козлов, А. Н. Интеллектуальные информационные системы / А.Н. Козлов. — Пермь. ФГБУО Пермская ГСХА, 2013. — 278 с.
9 Научный портал о проблемах биомедицинской инженерии. Классификация информационных систем в медицине: [Электронный ресурс] // URL: http://labdata.ru/node/13(дата обращения: 19.03.2018)
10 Каталог статей по основным направлениям исследований в области
искусственного интеллекта: [Электронный ресурс] // URL:
http: //www.aiportal .ru/articles/(дата обращения: 19.03.2018).
11 EasyDiagnosis: Электронный ресурс] // URL:
http: //www. easydiagnosis. com/(дата обращения 20.03.2018).
Экспертные системы для классификации болезней в медицинской диагностике [Электронный ресурс] // URL: https: //cyberleninka.ru/article/v/ekspertnye-sistemy-dlya-klassifikatsii-bolezney-v-meditsinskoy-diagnostike (дата
обращения 20.03.2018).
13 Аверьянова, Н.И. Пиелонефрит и гломерулонефрит у детей / Н.И. Аверьянова, И.А. Шипулина, А.Е. Жуйков, Н.Ю. Зарницына, Л.А. Кичигина, Е.А. Вельдер - Ухта: УГТУ, 2001. 179 с.
14 Жариков О. Г., Литвин А. А.,. Ковалёв В. А. Экспертные системы в медицине: [Электронный ресурс] // URL:http://mednovosti.by/journal.aspx?artic le=4013 (дата обращения: 22.03.2018).
15 DXplain - система поддержки принятия решений: [Электронный ресурс] // URL:http://www.mghlcs.org/projects/dxplain(дата обращения 2.04.2018).
16 Экспертные системы. Классификация экспертных систем. Разработка простейшей экспертной системы: [Электронный ресурс] // URL: http://ref.by/refs/67/14877/Lhtml(дата обращения: 2.04.2018).
17 AIMedica - интернет-услуга по компьютерной диагностике заболеваний: [Электронный ресурс] // URL:http: //aimedica.ru/about/aimedica(дата обращения: 2.04.2018).
18 Сиделев С. И. Математические методы в биологии и экологии: введение в элементарную биометрию: учебное пособие / С.И. Сиделев. - Ярославль. ЯрГУ, 2012. - 140 с.
19 Лакин Г. Ф. Биометрия: учебное пособие для биологических специальных вузов / Г.Ф.Лакин. Москва. Высшая школа, 2009. - 352 с.
20 Государственный стандарт Российской Федерации. Статистические
методы. Проверк URL:
http://docs.cntd.ru/document/gost-r-iso-5479-2002(дата обращения: 4.02.2018).
21 Гиниятуллин К.Г. Статистическая обработка результатов научных исследований. Краткий конспект лекций / К.Г. Гиниятуллин. Казань. 2014, 218 с.
22 Библиотека методов и моделей; описательные статистики и
статистические характеристики; критерии качества; критерий согласия Пирсона: [Электронный ресурс] // URL:
http://help.prognoz.com/ru/mergedProjects/Lib/05 statistics/uimodelling chitest.htm(дата обращения: 7.04.2018).
23 Портал знаний. Критерий Колмогорова - Смирнова: [Электронный
ресурс] // URL: http://statistica.ru/glossary/general/kriteriy-kolmogorova-
smirnova/(дата обращения 8.04.2018).
24 Приказ Министерства здравоохранения Российской Федерации от
19.12.2016 г. № 973н "Об утверждении типовых отраслевых норм времени на выполнение работ, связанных с посещением одним пациентом врача- кардиолога, врача-эндокринолога, врача-стоматолога-терапевта":
[Электронный ресурс] // URL:
http://www.consultant.ru/cons/cgi/online.cgi?req=doc&base=LAW&n=210955&fld=134&dst=100001,0&rnd=0.3568275418827398#0 (дата обращения
18.04.2018).
25 Фандеев В.П. Статистические методы распознавания состояния
здоровья: метод. указания к практическим занятиям по дисциплине
«Теоретические основы кибернетики» / В.П. Фандеев. Пенза. ПГУ, 2016. 44 с.
26 Дмитриенко А.Г. Диагностика. Оценка состояния и прогнозирование остаточного ресурса технически сложных объектов / А. Г. Дмитриенко, А. В. Блинов, Д.В. Волков. Пенза, 2013. 62 с.
27 Лепский А.Е. Математические методы распознавания образов: курс лекций / А.Е. Лепский, А.Г. Броневич. Таганрог: ТТИ ЮФУ, 2009. 155 с.