Информационная система распознавания сахарного диабета
|
ВВЕДЕНИЕ 8
1 ДИАГНОСТИКА САХАРНОГО ДИАБЕТА 11
1.1 Эпидемиология болезни 11
1.2 Этиология болезни 18
1.3 Патогенез болезни 22
1.4 Диагностические признаки болезни 29
1.5 Методика распознавания болезни (обоснование потребности в
информационной системе) 34
1.6 Основные результаты и выводы 36
2 ИНФОРМАЦИОННАЯ СИСТЕМА РАСПОЗНАВАНИЯ САХАРНОГО
ДИАБЕТА 40
2.1 Назначение, классификация и структура информационных систем
распознавания болезней 40
2.2 Информационные системы распознавания болезней (примеры) .... 46
2.3 Структура информационной системы распознавания сахарного
диабета 49
2.4 База данных пациентов с заболеванием сахарным диабетом 54
2.5 Пользовательский интерфейс базы данных 63
2.6 Основные результаты и выводы 66
3 ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ РЕЗУЛЬТАТОВ
ОБСЛЕДОВАНИЯ В EXCEL 70
3.1 Построение вариационных рядов значений признаков 70
3.2 Вычисление характеристик распределений 78
3.3 Расчёт корреляции значений признаков 86
3.4 Вычисление вероятностей интервалов значений признаков 88
3.5 Основные результаты и выводы 91
4 МЕТОДИКА РАСПОЗНАВАНИЯ САХАРНОГО ДИАБЕТА 93
4.1 Методы распознавания болезней 93
4.2 Диагностические модели сахарного диабета 99
4.3 Методика формирования диагностической модели 102
4.4 Методика распознавания сахарного диабета методом Байеса 106
4.5 Интерфейс пользователя 111
4.6 Вычислительный эксперимент по распознаванию
сахарного диабета 120
4.7 Основные результаты и выводы 122
ЗАКЛЮЧЕНИЕ 126
ПРИЛОЖЕНИЕ А.РЕЗУЛЬТАТЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ВЫБОРОК 135
ПРИЛОЖЕНИЕ Б.1 ПРОГРАММНЫЙ КОМПЕКС ФОРМИРОВАНИЯ ДИАГНОСТИЧЕСКОЙ МОДЕЛИ И РАСПОЗНОВАНИЯ САХАРНОГО ДИАБЕТА МЕТОДОМ БАЙЕСА
1 ДИАГНОСТИКА САХАРНОГО ДИАБЕТА 11
1.1 Эпидемиология болезни 11
1.2 Этиология болезни 18
1.3 Патогенез болезни 22
1.4 Диагностические признаки болезни 29
1.5 Методика распознавания болезни (обоснование потребности в
информационной системе) 34
1.6 Основные результаты и выводы 36
2 ИНФОРМАЦИОННАЯ СИСТЕМА РАСПОЗНАВАНИЯ САХАРНОГО
ДИАБЕТА 40
2.1 Назначение, классификация и структура информационных систем
распознавания болезней 40
2.2 Информационные системы распознавания болезней (примеры) .... 46
2.3 Структура информационной системы распознавания сахарного
диабета 49
2.4 База данных пациентов с заболеванием сахарным диабетом 54
2.5 Пользовательский интерфейс базы данных 63
2.6 Основные результаты и выводы 66
3 ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ РЕЗУЛЬТАТОВ
ОБСЛЕДОВАНИЯ В EXCEL 70
3.1 Построение вариационных рядов значений признаков 70
3.2 Вычисление характеристик распределений 78
3.3 Расчёт корреляции значений признаков 86
3.4 Вычисление вероятностей интервалов значений признаков 88
3.5 Основные результаты и выводы 91
4 МЕТОДИКА РАСПОЗНАВАНИЯ САХАРНОГО ДИАБЕТА 93
4.1 Методы распознавания болезней 93
4.2 Диагностические модели сахарного диабета 99
4.3 Методика формирования диагностической модели 102
4.4 Методика распознавания сахарного диабета методом Байеса 106
4.5 Интерфейс пользователя 111
4.6 Вычислительный эксперимент по распознаванию
сахарного диабета 120
4.7 Основные результаты и выводы 122
ЗАКЛЮЧЕНИЕ 126
ПРИЛОЖЕНИЕ А.РЕЗУЛЬТАТЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ВЫБОРОК 135
ПРИЛОЖЕНИЕ Б.1 ПРОГРАММНЫЙ КОМПЕКС ФОРМИРОВАНИЯ ДИАГНОСТИЧЕСКОЙ МОДЕЛИ И РАСПОЗНОВАНИЯ САХАРНОГО ДИАБЕТА МЕТОДОМ БАЙЕСА
Среди всего разнообразия задач, возникающих перед практическими врачами, остро стоит вопрос о качественной диагностике сахарного диабета (СД), т. к. среди болезней эндокринных органов по частоте СД занимает первое место.
Согласно последним данным IDF 8,3% взрослого населения - 382 млн. человек - страдают СД. По прогнозам, менее чем через 25 лет количество людей с этим заболеванием достигнет 592 млн. Распространенность сахарного диабета - существенный фактор роста числа сердечно-сосудистых болезней, которые развиваются у большинства больных сахарным диабетом. Сахарный диабет в настоящее время является главной причиной слепоты. В группе больных диабетом гангрена встречается в 20-30 раз чаще, чем среди лиц, не страдающих этим заболеванием. Среди причин смерти сахарный диабет занимает третье место после сердечно-сосудистых и онкологических заболеваний (в 2013 г. СД стал причиной 5,1 млн. смертей). Человеческие и финансовые потери от СД непомерно высоки, затраты здравоохранения на это заболевание в 2013 г. составили 548 млрд. долларов США (11% от общемировых затрат) [1]. Ежегодные прямые расходы Российской Федерации, связанные с сахарным диабетом, составляют 375 миллиардов рублей (12,4 миллиардов долларов).
Диагностика сахарного диабета является трудоёмким процессом, в условиях массового распространения требующим привлечения большого числа высококвалифицированных специалистов, не исключающим ошибки. Снижение трудоёмкости и повышение достоверности постановки диагноза, ограничение требований к квалификации специалистов, достигается разработкой и внедрением информационных технологий распознавания заболеваний.
Повышение достоверности диагноза достигается, прежде всего, за счёт принятия решений на основе опыта постановки диагноза высококвалифицированных специалистов, накопленного в базе данных, содержащей результаты обследований и достоверные диагнозы пациентов, и обучения информационной системы, применения методов распознавания образов. Снижение трудоёмкости постановки диагноза достигается оптимизацией обследования (выбора состава диагностических признаков и очерёдности обследования) пациентов, автоматизацией принятия решений. Ограничение требований к опыту специалистов достигается за счёт принятия решений, основанных на опыте высококвалифицированных специалистов. Ограничение требований к квалификации специалистов в области компьютерных технологий достигается за счёт применения «дружественного» к специалисту графического интерфейса пользователя.
Ведущими учеными в области ИС являются С.А. Гаспарян, Г.А. Хай, Г.С. Лебедев, Ю.Ю. Мухин, А.П. Столбов, Б.А. Кобринский и др. в работах которых подробно рассматриваются вопросы, касающиеся ИС распознавания болезней [2,3,4,5]. Созданием медицинских информационных систем занимаются в настоящее время довольно большое количество разработчиков (СП.АРМ, БАРС-групп, КОРУС-Консалтинг, «Акросс-Инжиниринг») [5,6].
Однако результаты исследований не доведены до методик проектирования систем распознавания заболеваний, в части проектирования базы данных диагнозов и результатов обследования пациентов, формирования вероятностной диагностической модели на основе базы данных, статистических методов распознавания.
Объектом исследования являются информационные технологии и системы распознавания сахарного диабета.
Предмет исследования - модели, методы и алгоритмы статистического распознавания сахарного диабета.
Цель работы - разработка элементов информационной системы, реализующей информационную технологию распознавания сахарного диабета статистическими методами, обеспечивающей снижение трудоёмкости, повышение достоверности постановки диагноза и ограничение требований к квалификации специалиста.
Для достижения поставленной цели необходимо решить следующие задачи:
1) осуществить нозологический анализ сахарного диабета;
2) осуществить разработку элементов базы данных, позволяющей накопить опыт квалифицированных специалистов, систематизировать достоверные факты о сахарном диабете, упорядочить результаты обследований для удобства их обработки;
3) на основе данных, содержащихся в базе данных, сформировать достоверную диагностическую модель;
4) реализовать методику распознавания заболеваний с использованием статистического метода Байеса, разработать необходимые алгоритмы и создать программный комплекс распознавания сахарного диабета.
Согласно последним данным IDF 8,3% взрослого населения - 382 млн. человек - страдают СД. По прогнозам, менее чем через 25 лет количество людей с этим заболеванием достигнет 592 млн. Распространенность сахарного диабета - существенный фактор роста числа сердечно-сосудистых болезней, которые развиваются у большинства больных сахарным диабетом. Сахарный диабет в настоящее время является главной причиной слепоты. В группе больных диабетом гангрена встречается в 20-30 раз чаще, чем среди лиц, не страдающих этим заболеванием. Среди причин смерти сахарный диабет занимает третье место после сердечно-сосудистых и онкологических заболеваний (в 2013 г. СД стал причиной 5,1 млн. смертей). Человеческие и финансовые потери от СД непомерно высоки, затраты здравоохранения на это заболевание в 2013 г. составили 548 млрд. долларов США (11% от общемировых затрат) [1]. Ежегодные прямые расходы Российской Федерации, связанные с сахарным диабетом, составляют 375 миллиардов рублей (12,4 миллиардов долларов).
Диагностика сахарного диабета является трудоёмким процессом, в условиях массового распространения требующим привлечения большого числа высококвалифицированных специалистов, не исключающим ошибки. Снижение трудоёмкости и повышение достоверности постановки диагноза, ограничение требований к квалификации специалистов, достигается разработкой и внедрением информационных технологий распознавания заболеваний.
Повышение достоверности диагноза достигается, прежде всего, за счёт принятия решений на основе опыта постановки диагноза высококвалифицированных специалистов, накопленного в базе данных, содержащей результаты обследований и достоверные диагнозы пациентов, и обучения информационной системы, применения методов распознавания образов. Снижение трудоёмкости постановки диагноза достигается оптимизацией обследования (выбора состава диагностических признаков и очерёдности обследования) пациентов, автоматизацией принятия решений. Ограничение требований к опыту специалистов достигается за счёт принятия решений, основанных на опыте высококвалифицированных специалистов. Ограничение требований к квалификации специалистов в области компьютерных технологий достигается за счёт применения «дружественного» к специалисту графического интерфейса пользователя.
Ведущими учеными в области ИС являются С.А. Гаспарян, Г.А. Хай, Г.С. Лебедев, Ю.Ю. Мухин, А.П. Столбов, Б.А. Кобринский и др. в работах которых подробно рассматриваются вопросы, касающиеся ИС распознавания болезней [2,3,4,5]. Созданием медицинских информационных систем занимаются в настоящее время довольно большое количество разработчиков (СП.АРМ, БАРС-групп, КОРУС-Консалтинг, «Акросс-Инжиниринг») [5,6].
Однако результаты исследований не доведены до методик проектирования систем распознавания заболеваний, в части проектирования базы данных диагнозов и результатов обследования пациентов, формирования вероятностной диагностической модели на основе базы данных, статистических методов распознавания.
Объектом исследования являются информационные технологии и системы распознавания сахарного диабета.
Предмет исследования - модели, методы и алгоритмы статистического распознавания сахарного диабета.
Цель работы - разработка элементов информационной системы, реализующей информационную технологию распознавания сахарного диабета статистическими методами, обеспечивающей снижение трудоёмкости, повышение достоверности постановки диагноза и ограничение требований к квалификации специалиста.
Для достижения поставленной цели необходимо решить следующие задачи:
1) осуществить нозологический анализ сахарного диабета;
2) осуществить разработку элементов базы данных, позволяющей накопить опыт квалифицированных специалистов, систематизировать достоверные факты о сахарном диабете, упорядочить результаты обследований для удобства их обработки;
3) на основе данных, содержащихся в базе данных, сформировать достоверную диагностическую модель;
4) реализовать методику распознавания заболеваний с использованием статистического метода Байеса, разработать необходимые алгоритмы и создать программный комплекс распознавания сахарного диабета.
1 Сахарный диабет является социально-значимым заболеванием, которое, получило статус неинфекционной эпидемии XXI века. Заболеваемость сахарным диабетом в Российской Федерации имеет тенденцию к увеличению (рисунок 1.2), при этом в Пензенской области она превышает среднюю величину по РФ (рисунок 1.4). К тому же для Пензенского региона характерны высокие показатели смертности при СД, в рейтинге субъектов область занимает пятое место (рисунок 1.4). Распознавание сахарного диабета трудоемко, поскольку является коллективным интеллектуально сложным процессом принятия решений в условиях неопределённости и ограничений по времени, достоверность которого зависит от квалификации и опыта специалистов.
2 Одним из путей упрощения задач распознавания заболеваний является применение информационных систем. Однако результаты исследований по разработке ИС не доведены до методик проектирования систем распознавания заболеваний, в части проектирования базы данных диагнозов и результатов обследования пациентов, формирования вероятностной диагностической модели на основе базы данных, статистических методов распознавания. Поэтому в дипломной работе представлена задача разработки методики проектирования базы данных пациентов, методики статистической обработки результатов обследования пациентов, методики формирования вероятностной диагностической модели, методики распознавания сахарного диабета методом Байеса. Перечисленные методики необходимы для проектирования информационной системы распознавания сахарного диабета, которая бы позволила обеспечить снижение трудоёмкости и повышение достоверности постановки диагноза, ограничение требований к квалификации специалистов. Методики, представленные в дипломной работе могут применяться для задач распознавания не только сахарного диабета, но и других заболеваний.
3 Проведённый анализ литературы и историй болезней пациентов за 2016 год на базе эндокринологического отделения ПОКБ им. Н.Н. Бурденко с установленным диагнозом сахарного диабета, позволил обосновать выбор четырех наиболее информативных признаков сахарного диабета первого и второго типа: постпрадиальной гликемии, уровня гликозилированного гемоглобина и триглицеридов, наличия ацетонурии. Данные признаки заложены в диагностическую модель.
4 В дипломной работе предлагается информационная система распознавания сахарного диабета, составными частями которой являются: база данных, решатель, пользовательский интерфейс (рисунок 2.5). База данных предназначена для хранения, накопления и обработки результатов обследований и диагнозов пациентов с сахарным диабетом 1 и 2 типа. Применение базы данных, содержащей результаты обследований и достоверные диагнозы пациентов, позволяет повысить достоверность диагноза и ограничить требования к опыту специалистов, за счёт принятия решений на основе опыта постановки диагноза высококвалифицированных специалистов, накопленного в базе данных. Благодаря базе данных ИС относится к системам с обучением.
5 Методика статистической обработки данных лабораторных анализов по малым выборкам, основанная на сочетании критерия согласия Пирсона и критерия Шапиро-Уилка подтвердила гипотезу о нормальном распределения количественных признаков сахарного диабета (рисунок 3.8. - 3.11). В результате получены оригинальные данные о распределениях значений диагностических признаков сахарного диабета. Выявлено наличие слабой тесноты связи (коэффициент парной корреляции находится в пределах от 0,1 до 0,3), за исключением пары признаков Hb и ППГ у пациентов с сахарным диабетом. Между Hb и ППГ обнаружена умеренная теснота связи (коэффициент парной корреляции находится в пределах от 0,3 до 0,5). Следовательно, связь между диагностическими признаками незначительная и может не учитываться при разработке диагностической модели (таблица 3.5).
6 Решатель MatLab представляет собой программный комплекс формирования диагностической модели и распознавания сахарного диабета методом Байеса по одному и сочетанию диагностических признаков.
7 Дружественный визуальный интерфейс ИС (рисунок 2.26 - 2.27, 4.11) делают работу пользователя с программой удобной и простой. Пользовательский интерфейс ИС позволяет освоить работу с программой даже начинающему пользователю персонального компьютера. Работа с программой не требует от пользователя знаний математического аппарата, заложенного в ней.
8 Оценка эффективности предложенной методики распознавания сахарного диабета показала высокую предсказующую точность (88,23%) программно-методического комплекса (таблица 4.5). В связи с чем, информационная система может быть внедрена в учебный процесс для обучения молодых специалистов в области эндокринологии, а также в лечебно-профилактические учреждения в качестве «помощника» начинающим специалистам. Наличие расхождений в диагнозах, объясняется тем, что для принятия диагноза недостаточно рассматриваемых диагностических признаков. Повышение достоверности распознавания возможно благодаря увеличению количества диагностических признаков в вероятностной диагностической модели и за счет обучения информационной системы (пополнения базы данных пациентов с сахарным диабетом новыми сведениями).
9 Результаты в полной мере соответствуют поставленным задачам дипломной работы. Перспективами применения данных методик, алгоритмов и программных комплексов является создание медицинских информационных систем, позволяющих осуществить дифференциальную диагностику болезней других органов и систем; дополнение существующих диагностических моделей другими диагностическими признаками.
2 Одним из путей упрощения задач распознавания заболеваний является применение информационных систем. Однако результаты исследований по разработке ИС не доведены до методик проектирования систем распознавания заболеваний, в части проектирования базы данных диагнозов и результатов обследования пациентов, формирования вероятностной диагностической модели на основе базы данных, статистических методов распознавания. Поэтому в дипломной работе представлена задача разработки методики проектирования базы данных пациентов, методики статистической обработки результатов обследования пациентов, методики формирования вероятностной диагностической модели, методики распознавания сахарного диабета методом Байеса. Перечисленные методики необходимы для проектирования информационной системы распознавания сахарного диабета, которая бы позволила обеспечить снижение трудоёмкости и повышение достоверности постановки диагноза, ограничение требований к квалификации специалистов. Методики, представленные в дипломной работе могут применяться для задач распознавания не только сахарного диабета, но и других заболеваний.
3 Проведённый анализ литературы и историй болезней пациентов за 2016 год на базе эндокринологического отделения ПОКБ им. Н.Н. Бурденко с установленным диагнозом сахарного диабета, позволил обосновать выбор четырех наиболее информативных признаков сахарного диабета первого и второго типа: постпрадиальной гликемии, уровня гликозилированного гемоглобина и триглицеридов, наличия ацетонурии. Данные признаки заложены в диагностическую модель.
4 В дипломной работе предлагается информационная система распознавания сахарного диабета, составными частями которой являются: база данных, решатель, пользовательский интерфейс (рисунок 2.5). База данных предназначена для хранения, накопления и обработки результатов обследований и диагнозов пациентов с сахарным диабетом 1 и 2 типа. Применение базы данных, содержащей результаты обследований и достоверные диагнозы пациентов, позволяет повысить достоверность диагноза и ограничить требования к опыту специалистов, за счёт принятия решений на основе опыта постановки диагноза высококвалифицированных специалистов, накопленного в базе данных. Благодаря базе данных ИС относится к системам с обучением.
5 Методика статистической обработки данных лабораторных анализов по малым выборкам, основанная на сочетании критерия согласия Пирсона и критерия Шапиро-Уилка подтвердила гипотезу о нормальном распределения количественных признаков сахарного диабета (рисунок 3.8. - 3.11). В результате получены оригинальные данные о распределениях значений диагностических признаков сахарного диабета. Выявлено наличие слабой тесноты связи (коэффициент парной корреляции находится в пределах от 0,1 до 0,3), за исключением пары признаков Hb и ППГ у пациентов с сахарным диабетом. Между Hb и ППГ обнаружена умеренная теснота связи (коэффициент парной корреляции находится в пределах от 0,3 до 0,5). Следовательно, связь между диагностическими признаками незначительная и может не учитываться при разработке диагностической модели (таблица 3.5).
6 Решатель MatLab представляет собой программный комплекс формирования диагностической модели и распознавания сахарного диабета методом Байеса по одному и сочетанию диагностических признаков.
7 Дружественный визуальный интерфейс ИС (рисунок 2.26 - 2.27, 4.11) делают работу пользователя с программой удобной и простой. Пользовательский интерфейс ИС позволяет освоить работу с программой даже начинающему пользователю персонального компьютера. Работа с программой не требует от пользователя знаний математического аппарата, заложенного в ней.
8 Оценка эффективности предложенной методики распознавания сахарного диабета показала высокую предсказующую точность (88,23%) программно-методического комплекса (таблица 4.5). В связи с чем, информационная система может быть внедрена в учебный процесс для обучения молодых специалистов в области эндокринологии, а также в лечебно-профилактические учреждения в качестве «помощника» начинающим специалистам. Наличие расхождений в диагнозах, объясняется тем, что для принятия диагноза недостаточно рассматриваемых диагностических признаков. Повышение достоверности распознавания возможно благодаря увеличению количества диагностических признаков в вероятностной диагностической модели и за счет обучения информационной системы (пополнения базы данных пациентов с сахарным диабетом новыми сведениями).
9 Результаты в полной мере соответствуют поставленным задачам дипломной работы. Перспективами применения данных методик, алгоритмов и программных комплексов является создание медицинских информационных систем, позволяющих осуществить дифференциальную диагностику болезней других органов и систем; дополнение существующих диагностических моделей другими диагностическими признаками.



