Введение 3
Постановка задачи 5
Глава 1 Нейронные сети в медицинской диагностике 7
1.1. Применение нейронных сетей в медицине и диагностике 7
1.2. Использование нейронных сетей в диагностике сахарного диабета 9
Глава 2. Сравнительный анализ нейронных сетей LightGBM, CatBoost и XGBoost для диагностики сахарного диабета 13
2.1. Набор данных 13
2.2. Методология исследования 13
2.3 Эксперимент, результаты и обсуждение 22
Заключение 33
Список литературы 35
Сахарный диабет - это хроническое заболевание, которое возникает, когда поджелудочная железа не вырабатывает достаточного количества инсулина или когда организм не в состоянии эффективно использовать вырабатываемый инсулин. Инсулин - это гормон, который регулирует уровень глюкозы в крови. Гипергликемия, также известная как повышенный уровень глюкозы в крови, является распространенным следствием неконтролируемого диабета и со временем может привести к серьезному повреждению многих систем организма, особенно нервов и кровеносных сосудов [1].
В 2014 году 8,5% взрослых в возрасте 18 лет и старше страдали сахарным диабетом. В 2019 году диабет стал непосредственной причиной 1,5 миллионов смертей, причем 48% смертей от диабета произошли в возрасте до 70 лет. Еще 460 000 смертей от заболеваний почек вызваны диабетом, а повышение уровня глюкозы в крови является причиной около 20% смертей от сердечно-сосудистых заболеваний [2].
В период с 2000 по 2019 год показатели смертности от диабета, соответствующие возрастным стандартам, увеличились на 3%. В странах с низким и средним уровнем дохода смертность от диабета увеличилась на 13% [2].
Напротив, вероятность смерти от любого из четырех основных неинфекционных заболеваний (сердечно-сосудистые заболевания, рак, хронические респираторные заболевания или диабет) в возрасте от 30 до 70 лет в период с 2000 по 2019 год во всем мире снизилась на 22% [2].
Риск осложнений диабета намного выше у человека склонного к диабету, с не диагностированной проблемой и не получившего должного лечения. Эти осложнения включают преждевременные болезни сердца и инсульт, слепоту, ампутации конечностей и почечную недостаточность. Симптомы диабета могут быть неочевидны в течение длительного периода времени, в результате чего состояние может ухудшиться [1, 3, 4].
Именно поэтому так важна ранняя диагностика предиабета, чтобы пациенты могли узнать о своем состоянии и принять меры до того, как оно ухудшится, и избежать гораздо серьезных осложнений, которые могут снизить качество жизни. Предиабет — это состояние, при котором уровень глюкозы в крови выше среднего, но недостаточно высок, чтобы поставить диагноз диабета 2 типа. Если уровень глюкозы в крови натощак составляет от 7,9 ммоль/ л до 11 ммоль/ л (от 100 до 125 мг/дл), это считается предиабетом. Если это не лечить, преддиабет может легко прогрессировать, и у людей с предиабетом в конечном итоге разовьется диабет 2 типа [1].
Преддиабет сам по себе представляет повышенный риск развития микро- и макрососудистых заболеваний и их осложнений и по-прежнему является фактором риска развития диабета 2 типа в будущем [3]. Выявив пациентов с предиабетом и начав раннее вмешательство в образ жизни и/или фармакологическое лечение, прогрессирование можно задержать, а в некоторых случаях даже предотвратить. Чем раньше поставлен диагноз, тем легче обратить вспять заболевание и остановить развитие полномасштабного диабета 2 типа.
Факторы риска преддиабета включают неправильное питание, курение, низкую физическую активность, избыточный вес, стресс, гестационный диабет в анамнезе и семейный анамнез диабета [1, 3].
Интенсивные программы изменения образа жизни (диета, физические упражнения и физическая активность) действительно снижают заболеваемость диабетом среди людей, у которых выявлен диабет на ранней стадии, с сопутствующим улучшением факторов сердечно-сосудистого риска. Некоторые из тестов, которые могут помочь вам в раннем выявлении диабета:
Анализ уровня сахара в крови натощак проводится натощак, и нормальный результат варьируется от 4 ммоль/ л до 7,8 ммоль/ л (от 70 до 99 мг/дл)....
Идея диагностики диабета и преддиабета по данным опросов и небольшому объему лабораторных данных очень актуальна. В работе исследованы признаки, влияющие на диагноз диабет из базы данных Kaagle - это, прежде всего, индекс массы тела, глюкоза, наличие генетической предрасположенности и возраст.
Для прогнозирования диабета по табличным данным использовались три алгоритма, а именно XGBoost , CatBoost, LightGBM. Для улучшения качества набора данных использовались различные методы предварительной обработки, такие как вменение, Z-оценка и методы очистки. Кроме того, для улучшения прогнозирования заболеваний были проведены нормализация данных, передискретизация и настройка гиперпараметров.
По экспериментальным данным, XGBoost имел наибольшую точность - 84%. XGBoost, таким образом, показал хорошие результаты в других тестах, таких как кривая ROC , точность, отзыв и показатель fl. Существенным недостатком этого метода, является наибольшее время выполнение на тестовой выборке.
Метод важности признаков показал, как отдельные признаки влияют на окончательный результат прогнозирования - это может лечь в основу объясняемого искусственного интеллекта.
Более того, по сравнению с аналогичными работами предложенная структура превосходила существующие системы. Для дальнейшего улучшения качества результатов можно добавить другие стратегии ансамблевого обучения, такие как кластеризация и суммирование. Чтобы расширить рамки данного исследования, предлагаемый метод можно применить к другим наборам медицинских данных с сопоставимыми характеристиками.
В будущих исследованиях изучение методов глубокого обучения может привести к лучшему выявлению и прогнозированию диабета. Эти достижения в области машинного и глубокого обучения помогают принимать более точные и эффективные решения в области здравоохранения.