ВВЕДЕНИЕ 4
ГЛАВА 1. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ 8
1.1 Интеллектуальный анализ медицинских изображений: КТ и рентгеновских снимков легких 10
1.2 Шум в изображениях компьютерной томографии 11
1.3 Методы подавления шума 13
1.4 Выводы по главе 1 22
ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ 23
2.1 Краткое описание программы Orange Data Mining 23
2.2 Нейронная сеть Inception v3 25
2.3 Модуль аналитики изображений 29
2.4 Обучение без учителя 34
2.5 Модуль визуализации данных 40
2.6 Модуль оценки эффективности классификации изображений 43
2.7 Выводы по главе 2 47
ГЛАВА 3. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ ПНЕВМОНИИ 48
3.1 Описание базы данных 48
3.2 Алгоритм распознавания медицинских изображений 50
3.3 Результаты анализа рентгеновских изображений 52
3.4 Выводы по главе 3 58
ЗАКЛЮЧЕНИЕ 58
СПИСОК ЛИТЕРАТУРЫ 59
Актуальность проблемы. Среди наиболее применяемых методик ранней диагностики широкого спектра социально значимых заболеваний: пневмония, онкологические заболевания легких, рак молочной железы, нарушения целостности костных структур и т.д., наиболее точной является лучевая диагностика. Она позволяет установить диагноз на самой ранней стадии развития заболевания. Соответствующие изображения и их интерпретация являются превалирующими инструментами в постановке диагноза перечисленных групп заболеваний. Фундаментальный недостаток лучевой диагностики связан с интегральным характером получаемого изображения, что ведет к потере информации по ее глубине. Это вызывает необходимость в получении и анализе множества проекций [1]. Отсюда возникает следующая ситуация: совершенствование методов и средств диагностики не всегда приводит к улучшению показателей качества диагностики [2]. Следовательно, решение задач распознавания медицинских изображений, их классификация по категориям и внедрение в клинические методы позволит разрешить накопленные противоречия [3].
Учитывая изложенное, разработка и исследование методов и алгоритмов классификации медицинских изображений (их сегментов) в условиях априорной неопределенности координат патологических нарушений является актуальной задачей. Для решения подобного рода задач используются различные методы машинного обучения. Например, метод опорных векторов или случайный лес, могут быть применены для доступных признаков на изображениях, сверточные нейронные сети (англ. convolutional neural network, CNN) показывают превосходные результаты в решении задач распознавания медицинских изображений [4-7].
Важной частью распознавания медицинских изображений является подготовка данных и извлечение признаков [8, 9]. Данная процедура включает предварительную обработку таких параметров изображений1 как резкость, фильтрация шума или нормализация. Кроме того, изображения могут быть представлены в виде гистограммы направленных градиентов или карты активации.
Интеллектуальный анализ медицинских изображений в виде компьютерных томограмм (КТ) и рентгена легких, представляет собой важную область исследований [10]. Различные методы машинного обучения и глубокого обучения могут быть использованы для решения задачи распознавания фрагментов изображений. Целью интеллектуального анализа изображений КТ легких c диагнозом пневмония может быть выявление патологий и классификация заболевания по доли области поражения легких.
Цель работы: поиск новых подходов, методов и алгоритмов классификации КТ и рентген изображений с диагнозом пневмония в условиях априорной неопределенности координат патологии и относительных уровней яркости объектов на фоне пространственно-неоднородного изображения.
Для достижения данной цели были поставлены и решены следующие задачи:
- поиск и подготовка медицинских изображений, необходимых для обучения алгоритмов;
- анализ и подбор подходящих алгоритмов предобработки и
классификации изображений;
- разработка, обучение и определение на тестовой выборке ее диагностической информативности;
- анализ результатов исследования.
Диапазон значений интенсивности пикселей.
Решение поставленных задач выполнено в программе Orange Data Mining, которая визуально отображает данные машинного обучения и их интеллектуального анализа.
Область исследования. Выпускная квалификационная работа выполнена в рамках освоения компетенций ОПК-2 (способен творчески использовать в профессиональной деятельности знания фундаментальных и прикладных разделов дисциплин (модулей), определяющих направленность магистратуры), и ОПК-6 (способен творчески применять и модифицировать современные компьютерные технологии, работать с профессиональными базами данных, профессионально оформлять и представлять результаты новых разработок) ФГОС ВО - Магистратура по направлению подготовки 06.04.01. Биология. Кроме того, российский и международный опыт показывают, что недостаточно и нельзя говорить об успешном инновационном развитии без эффективного междисциплинарного взаимодействия искусственного интеллекта и медицинской визуализации. Приоритеты инновационного развития здравоохранения России и способы реализации технологического развития, в том числе и искусственного интеллекта, отражены в нормативных документах Министерств здравоохранения и экономического развития РФ (Указ Президента Российской Федерации от 9 мая 2017 г. № 203 «О Стратегии развития
информационного общества в Российской Федерации на 2017-2030 годы») [11].
В данной работе будут рассмотрены методы предварительной обработки рентгеновских и КТ снимков и проведено сравнение качества классификации на наборах данных с разной степенью предобработки.
Объектом исследования является открытая база данных КТ снимков легких, загруженная с платформы Kaggle [12, 13]. В работе мы проанализировали набор из 300 снимков, который содержит три типа изображений: норма, пневмония и туберкулез легких.
Данная выпускная квалификационная работа была представлена 18.04.2024 на Международной научно-практической конференции «Компьютерное моделирование физических процессов и новые цифровые технологии в медицине и фармации».
1. Разработана интеллектуальная система поддержки принятия решений по классификации КТ и рентгеновских снимков, экспериментальная апробация которой проведена на контрольных выборках по 58
классификации медицинских изображений по классам «пневмония», «туберкулез» и «норма» показали высокую диагностическую эффективность: около 90%.
2. Разработан метод автоматической классификации КТ-изображений с использованием сверточных нейронных сетей, получаемых путем предварительной сегментации изображения, позволяющей формировать дескрипторы только по тем пикселям, которые не маскированы маской прозрачности.
3. Научно-технические результаты могут быть использованы при клинической диагностике различных заболеваний, формировании атласов эталонных изображений анатомических объектов в процессе терапевтических воздействий. Возможность работы с удаленными пользователями, позволяет алгоритму получать для своей базы данных информацию о влиянии терапевтического воздействия на легкие.
1. Т. Г. Авачева, М.К.А., Ю. В. Зубцова. Применение искусственного интеллекта в радиологии. in Всероссийская научно-практическая конференция с международным участием «Информационный обмен в междисциплинарных исследованиях». 2022 года. Рязанский государственный радиотехнический университет им. В.Ф. Уткина.
2. Дабагов, А.Р. Методы и алгоритмы синтеза систем искусственного интеллекта с гетерогенными интеллектуальными агентами для рентгенологических исследований в цифровой медицине. 2020.
3. Kaur, C. and U. Garg, Artificial intelligence techniques for cancer detection in medical image processing: A review. Materials Today: Proceedings, 2021.
4. Singh, M., et al., Transfer learning-based ensemble support vector machine model for automated COVID-19 detection using lung computerized tomography scan data. Med Biol Eng Comput, 2021. 59(4): p. 825-839.
5. Bi, L. and Y. Guo, Development and Validation of the Random Forest Model via Combining CT-PET Image Features and Demographic Data for Distant Metastases among Lung Cancer Patients. J Healthc Eng, 2022. 2022: p. 7793533.
6. Печников, А.А. and Н.А. Богданов. Два подхода к распознаванию
пневмонии по рентгеновским снимкам: описание, реализация и сравнение. 2022. ; Available from: https://cyberleninka.ru/article/n/dva-
podhoda-k-raspoznavaniyu-pnevmonii-po-rentgenovskim-snimkam- opisanie-realizatsiya-i-sravnenie (дата обращения: 26.02.2024).
7. Heidari, M., et al., Improving the performance of CNN to predict the likelihood of COVID-19 using chest X-ray images with preprocessing algorithms. Int J Med Inform, 2020. 144: p. 104284.
8. Косарева, А., Алгоритм подготовки набора данных для обучения нейронных сетей на примере задачи анализа радиологических изображений лёгких. Доклады Белорусского государственного университета информатики и радиоэлектроники, 2023. 21(1): р. 66-73.
9. Sailunaz, K., et al., A survey of machine learning-based methods for COVID-19 medical image analysis. Med Biol Eng Comput, 2023. 61(6): p. 1257-1297.
10. Zhang, Z. and E. Seeram, The use of artificial intelligence in computed tomography image reconstruction-a literature review. Journal of medical imaging and radiation sciences, 2020. 51(4): p. 671-677.
11. Указ Президента Российской Федерации от 09.05.2017 г. № 203 "О Стратегии развития информационного общества в Российской Федерации на 2017 - 2030 годы". 2017.
12. MOONEY, P. Chest X-Ray Images (Pneumonia). Available from: https://www.kaggle.com/datasets/paultimothymooney/chest-xray- pneumonia.
13. RAHMAN, T. Tuberculosis (TB) Chest X-ray Database. Available from: https://www.kaggle.com/datasets/tawsifurrahman/tuberculosis-tb-chest-xray- dataset.
14. Виллевальде, А., О системном подходе к медицинской визуализации. Известия СПбГЭТУ «ЛЭТИ», 2006: р. 37.
15. Guo, K., et al., Diagnosis and detection of pneumonia using weak-label based on X-ray images: a multi-center study. BMC Medical Imaging, 2023. 23(1): p. 209... 73