Разработка алгоритма интеллектуального анализа распознавания пневмонии
|
ВВЕДЕНИЕ 4
ГЛАВА 1. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ 8
1.1 Интеллектуальный анализ медицинских изображений: КТ и рентгеновских снимков легких 10
1.2 Шум в изображениях компьютерной томографии 11
1.3 Методы подавления шума 13
1.4 Выводы по главе 1 22
ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ 23
2.1 Краткое описание программы Orange Data Mining 23
2.2 Нейронная сеть Inception v3 25
2.3 Модуль аналитики изображений 29
2.4 Обучение без учителя 34
2.5 Модуль визуализации данных 40
2.6 Модуль оценки эффективности классификации изображений 43
2.7 Выводы по главе 2 47
ГЛАВА 3. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ ПНЕВМОНИИ 48
3.1 Описание базы данных 48
3.2 Алгоритм распознавания медицинских изображений 50
3.3 Результаты анализа рентгеновских изображений 52
3.4 Выводы по главе 3 58
ЗАКЛЮЧЕНИЕ 58
СПИСОК ЛИТЕРАТУРЫ 59
ГЛАВА 1. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ 8
1.1 Интеллектуальный анализ медицинских изображений: КТ и рентгеновских снимков легких 10
1.2 Шум в изображениях компьютерной томографии 11
1.3 Методы подавления шума 13
1.4 Выводы по главе 1 22
ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ 23
2.1 Краткое описание программы Orange Data Mining 23
2.2 Нейронная сеть Inception v3 25
2.3 Модуль аналитики изображений 29
2.4 Обучение без учителя 34
2.5 Модуль визуализации данных 40
2.6 Модуль оценки эффективности классификации изображений 43
2.7 Выводы по главе 2 47
ГЛАВА 3. ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ ПНЕВМОНИИ 48
3.1 Описание базы данных 48
3.2 Алгоритм распознавания медицинских изображений 50
3.3 Результаты анализа рентгеновских изображений 52
3.4 Выводы по главе 3 58
ЗАКЛЮЧЕНИЕ 58
СПИСОК ЛИТЕРАТУРЫ 59
Актуальность проблемы. Среди наиболее применяемых методик ранней диагностики широкого спектра социально значимых заболеваний: пневмония, онкологические заболевания легких, рак молочной железы, нарушения целостности костных структур и т.д., наиболее точной является лучевая диагностика. Она позволяет установить диагноз на самой ранней стадии развития заболевания. Соответствующие изображения и их интерпретация являются превалирующими инструментами в постановке диагноза перечисленных групп заболеваний. Фундаментальный недостаток лучевой диагностики связан с интегральным характером получаемого изображения, что ведет к потере информации по ее глубине. Это вызывает необходимость в получении и анализе множества проекций [1]. Отсюда возникает следующая ситуация: совершенствование методов и средств диагностики не всегда приводит к улучшению показателей качества диагностики [2]. Следовательно, решение задач распознавания медицинских изображений, их классификация по категориям и внедрение в клинические методы позволит разрешить накопленные противоречия [3].
Учитывая изложенное, разработка и исследование методов и алгоритмов классификации медицинских изображений (их сегментов) в условиях априорной неопределенности координат патологических нарушений является актуальной задачей. Для решения подобного рода задач используются различные методы машинного обучения. Например, метод опорных векторов или случайный лес, могут быть применены для доступных признаков на изображениях, сверточные нейронные сети (англ. convolutional neural network, CNN) показывают превосходные результаты в решении задач распознавания медицинских изображений [4-7].
Важной частью распознавания медицинских изображений является подготовка данных и извлечение признаков [8, 9]. Данная процедура включает предварительную обработку таких параметров изображений1 как резкость, фильтрация шума или нормализация. Кроме того, изображения могут быть представлены в виде гистограммы направленных градиентов или карты активации.
Интеллектуальный анализ медицинских изображений в виде компьютерных томограмм (КТ) и рентгена легких, представляет собой важную область исследований [10]. Различные методы машинного обучения и глубокого обучения могут быть использованы для решения задачи распознавания фрагментов изображений. Целью интеллектуального анализа изображений КТ легких c диагнозом пневмония может быть выявление патологий и классификация заболевания по доли области поражения легких.
Цель работы: поиск новых подходов, методов и алгоритмов классификации КТ и рентген изображений с диагнозом пневмония в условиях априорной неопределенности координат патологии и относительных уровней яркости объектов на фоне пространственно-неоднородного изображения.
Для достижения данной цели были поставлены и решены следующие задачи:
- поиск и подготовка медицинских изображений, необходимых для обучения алгоритмов;
- анализ и подбор подходящих алгоритмов предобработки и
классификации изображений;
- разработка, обучение и определение на тестовой выборке ее диагностической информативности;
- анализ результатов исследования.
Диапазон значений интенсивности пикселей.
Решение поставленных задач выполнено в программе Orange Data Mining, которая визуально отображает данные машинного обучения и их интеллектуального анализа.
Область исследования. Выпускная квалификационная работа выполнена в рамках освоения компетенций ОПК-2 (способен творчески использовать в профессиональной деятельности знания фундаментальных и прикладных разделов дисциплин (модулей), определяющих направленность магистратуры), и ОПК-6 (способен творчески применять и модифицировать современные компьютерные технологии, работать с профессиональными базами данных, профессионально оформлять и представлять результаты новых разработок) ФГОС ВО - Магистратура по направлению подготовки 06.04.01. Биология. Кроме того, российский и международный опыт показывают, что недостаточно и нельзя говорить об успешном инновационном развитии без эффективного междисциплинарного взаимодействия искусственного интеллекта и медицинской визуализации. Приоритеты инновационного развития здравоохранения России и способы реализации технологического развития, в том числе и искусственного интеллекта, отражены в нормативных документах Министерств здравоохранения и экономического развития РФ (Указ Президента Российской Федерации от 9 мая 2017 г. № 203 «О Стратегии развития
информационного общества в Российской Федерации на 2017-2030 годы») [11].
В данной работе будут рассмотрены методы предварительной обработки рентгеновских и КТ снимков и проведено сравнение качества классификации на наборах данных с разной степенью предобработки.
Объектом исследования является открытая база данных КТ снимков легких, загруженная с платформы Kaggle [12, 13]. В работе мы проанализировали набор из 300 снимков, который содержит три типа изображений: норма, пневмония и туберкулез легких.
Данная выпускная квалификационная работа была представлена 18.04.2024 на Международной научно-практической конференции «Компьютерное моделирование физических процессов и новые цифровые технологии в медицине и фармации».
Учитывая изложенное, разработка и исследование методов и алгоритмов классификации медицинских изображений (их сегментов) в условиях априорной неопределенности координат патологических нарушений является актуальной задачей. Для решения подобного рода задач используются различные методы машинного обучения. Например, метод опорных векторов или случайный лес, могут быть применены для доступных признаков на изображениях, сверточные нейронные сети (англ. convolutional neural network, CNN) показывают превосходные результаты в решении задач распознавания медицинских изображений [4-7].
Важной частью распознавания медицинских изображений является подготовка данных и извлечение признаков [8, 9]. Данная процедура включает предварительную обработку таких параметров изображений1 как резкость, фильтрация шума или нормализация. Кроме того, изображения могут быть представлены в виде гистограммы направленных градиентов или карты активации.
Интеллектуальный анализ медицинских изображений в виде компьютерных томограмм (КТ) и рентгена легких, представляет собой важную область исследований [10]. Различные методы машинного обучения и глубокого обучения могут быть использованы для решения задачи распознавания фрагментов изображений. Целью интеллектуального анализа изображений КТ легких c диагнозом пневмония может быть выявление патологий и классификация заболевания по доли области поражения легких.
Цель работы: поиск новых подходов, методов и алгоритмов классификации КТ и рентген изображений с диагнозом пневмония в условиях априорной неопределенности координат патологии и относительных уровней яркости объектов на фоне пространственно-неоднородного изображения.
Для достижения данной цели были поставлены и решены следующие задачи:
- поиск и подготовка медицинских изображений, необходимых для обучения алгоритмов;
- анализ и подбор подходящих алгоритмов предобработки и
классификации изображений;
- разработка, обучение и определение на тестовой выборке ее диагностической информативности;
- анализ результатов исследования.
Диапазон значений интенсивности пикселей.
Решение поставленных задач выполнено в программе Orange Data Mining, которая визуально отображает данные машинного обучения и их интеллектуального анализа.
Область исследования. Выпускная квалификационная работа выполнена в рамках освоения компетенций ОПК-2 (способен творчески использовать в профессиональной деятельности знания фундаментальных и прикладных разделов дисциплин (модулей), определяющих направленность магистратуры), и ОПК-6 (способен творчески применять и модифицировать современные компьютерные технологии, работать с профессиональными базами данных, профессионально оформлять и представлять результаты новых разработок) ФГОС ВО - Магистратура по направлению подготовки 06.04.01. Биология. Кроме того, российский и международный опыт показывают, что недостаточно и нельзя говорить об успешном инновационном развитии без эффективного междисциплинарного взаимодействия искусственного интеллекта и медицинской визуализации. Приоритеты инновационного развития здравоохранения России и способы реализации технологического развития, в том числе и искусственного интеллекта, отражены в нормативных документах Министерств здравоохранения и экономического развития РФ (Указ Президента Российской Федерации от 9 мая 2017 г. № 203 «О Стратегии развития
информационного общества в Российской Федерации на 2017-2030 годы») [11].
В данной работе будут рассмотрены методы предварительной обработки рентгеновских и КТ снимков и проведено сравнение качества классификации на наборах данных с разной степенью предобработки.
Объектом исследования является открытая база данных КТ снимков легких, загруженная с платформы Kaggle [12, 13]. В работе мы проанализировали набор из 300 снимков, который содержит три типа изображений: норма, пневмония и туберкулез легких.
Данная выпускная квалификационная работа была представлена 18.04.2024 на Международной научно-практической конференции «Компьютерное моделирование физических процессов и новые цифровые технологии в медицине и фармации».
1. Разработана интеллектуальная система поддержки принятия решений по классификации КТ и рентгеновских снимков, экспериментальная апробация которой проведена на контрольных выборках по 58
классификации медицинских изображений по классам «пневмония», «туберкулез» и «норма» показали высокую диагностическую эффективность: около 90%.
2. Разработан метод автоматической классификации КТ-изображений с использованием сверточных нейронных сетей, получаемых путем предварительной сегментации изображения, позволяющей формировать дескрипторы только по тем пикселям, которые не маскированы маской прозрачности.
3. Научно-технические результаты могут быть использованы при клинической диагностике различных заболеваний, формировании атласов эталонных изображений анатомических объектов в процессе терапевтических воздействий. Возможность работы с удаленными пользователями, позволяет алгоритму получать для своей базы данных информацию о влиянии терапевтического воздействия на легкие.
классификации медицинских изображений по классам «пневмония», «туберкулез» и «норма» показали высокую диагностическую эффективность: около 90%.
2. Разработан метод автоматической классификации КТ-изображений с использованием сверточных нейронных сетей, получаемых путем предварительной сегментации изображения, позволяющей формировать дескрипторы только по тем пикселям, которые не маскированы маской прозрачности.
3. Научно-технические результаты могут быть использованы при клинической диагностике различных заболеваний, формировании атласов эталонных изображений анатомических объектов в процессе терапевтических воздействий. Возможность работы с удаленными пользователями, позволяет алгоритму получать для своей базы данных информацию о влиянии терапевтического воздействия на легкие.





