Введение 4
Глава 1 Анализ проблемы классификации патологий на рентгенограммах 8
1.1 Виды патологий на рентгенографических снимках 8
1.2 Обзор современного состояния классификации рентгенографических изображений 13
1.3 Анализ программных средств для решения проблемы классификации 19
1.3.1 Анализ языков программирования 19
1.3.2 Анализ формата DICOM 22
1.3.3 Исходные данные задачи классификации 24
Глава 2 Формирование решения задачи классификации рентгенографического снимка грудной клетки 28
2.1 Методы сегментаций и обработки изображения 28
2.2 Архитектура и методы обучения сверточной нейронной сети 35
2.3 Анализ моделей, предварительно обученных глубоких сверточных нейронных сетей 37
2.4 Структура математической модели сверточной нейронной сети 41
Глава 3 Формирование составной глубокой сверточной нейронной сети для задачи классификации рентгенографического снимка 47
3.1 Обработка рентгенографических снимков 47
3.1.1 Обработка формата DICOM 47
3.1.2 Сегментация рентгенографического снимка 49
3.2 Подготовка выборки для нейронной сети 52
3.3 Реализация сверточной нейронной сети 53
3.3.1 Реализация сверточной нейронной сети на основе модели Inception-v3 54
3.3.2 Реализация сверточной нейронной сети на основе модели VGG-16 60
Глава 4 Проведение эксперимента на эффективность работоспособности алгоритма 65
4.1 Сравнительный анализ результатов классификаций 65
4.2 Классификация рентгенографических снимков глубокой сверточной нейронной сетью 70
Заключение 73
Список используемых источников 75
Приложение А Код составной глубокой сверточной нейронной сети на основе модели Inception-v3 79
Приложение Б Код составной глубокой сверточной нейронной сети на основе модели VGG-16 81
Острая респираторная вирусная инфекция является группой клинически и морфологически подобных острых воспалительных заболеваний органов дыхания.
По данным в 2016 году зафиксировано 297 миллионов случаев заболеваний легких по всему миру, из которых 2,2 миллиона со смертным исходом. По данным Росстата в Российской Федерации за этот же период легочными заболеваниями переболело более 971 тысяч человек, умерло более 56 тысяч. В 2019 году наблюдался скачок заражения людей вирусной пневмонией, что привело к высокой смертности, которая составила 19 тысяч в первое полугодие [26].
Для того, чтобы предотвратить развитие и осложнение респираторных заболеваний, используется диагностика легких.
Рентгенография грудной клетки является наиболее часто используемым диагностическим метод для исследований заболеваний легких, таких как рак, отек легких, плевральный выпот, пневмония, туберкулез.
Многие лекарства эффективны для большинства заболеваний только на ранней стадии [8]. Экранирование может помочь ранней диагностике, но для обеспечения массового применения необходимо использовать метод более чувствительный и экономичный. Стандартная рентгенография грудной клетки отвечает этим требованиям, за исключением того, что современные методы имеют небольшую неточность. Более удобный метод, имеющий высокую точность, это компьютерная томография (КТ), но данный метод имеет недостаток - КТ подвергают пациента более высокой дозе радиации. Еще одной причиной широко распространенного использования обычной рентгенографии является его экономическая целесообразность [11].
Несмотря на целесообразность использования рентгенографии, на стадии постановки диагноза врачом существует вероятность того, что болезнь может быть не обнаружена. В связи с этим появляется риск развития патологии, что может привести к летальному исходу.
На сегодняшний день существуют компьютерные технологии, которые облегчают нахождение патологии и повышают точности постановки диагноза. Нахождение и распознание патологий на рентгенографических снимках помогают решить методы обработки изображения и нейронная сеть, которая, основываясь на большом количестве заведомо верных результатов постановки диагноза, выявляет патологии на снимках с минимальной погрешностью. Для того, чтобы нейронная сеть была способна выполнять поставленную задачу, требуется обучить её алгоритму обнаружения области заболевания. Также для облегчения решения данной задачи существуют методы сегментации с различными вариациями точности результата.
Актуальность темы исследования обусловлена проблемой обнаружения и классификации патологий на рентгенограммах грудной клетки.
Целью диссертационной работы является уменьшение коэффициента ошибки при постановке диагноза с помощью классификации патологий на рентгенографических снимках нейронной сети.
Объектом исследования выступает процесс классификации патологий на рентгенографическом снимке грудной клетки.
Предметом исследования составила глубокая сверточная нейронная сеть для классификации патологий на рентгенографическом снимке грудной клетки.
Гипотеза исследования: разработанная нейронная сеть послужит вспомогательным инструментом для врача в диагностике заболеваний, что уменьшит коэффициент неточно поставленных диагнозов и сократит время на обследования.
Задачами в диссертационной работе являются:
1. Проанализировать диагностику легочных заболеваний и их проявление на рентгенографических снимках.
2. Проанализировать современное состояние методов классификации рентгенографического снимка.
2. Сформулировать задачи классификации патологий рентгенографических снимках.
3. Провести сравнительный анализ и выбор подходов к классификации изображений.
4. Разработать систему для классификации патологий легких на рентгенограммах.
5. Произвести тестирование эффективности реализованной системы.
Теоретической основой исследования стали научные достижения отечественных и зарубежных ученых, занимающиеся диагностикой заболеваний при помощи искусственного интеллекта. Авторы указывают, что для достижения высокой точности результата классификации используются модели заранее обученных нейронных сетей. Упор в распознавании делается на объеме и форме набора данных, зачастую используются необработанные изображения, тем самым, полученный результат, является недостаточно высоким.
Практическая значимость диссертационного исследования заключается в применении системы в качестве вспомогательного инструмента врача в диагностике заболеваний, что позволит повысить эффективность и уменьшить коэффициент ошибки.
Методы исследования, которые использовались в процессе формирования диссертационной работы: анализ и синтез модели, математическое моделирование, экспериментальные измерения и анализ.
Диссертационное исследование производилось с 2018 по 2020 гг. в три этапа:
1. Констатирующий этап исследования (2018 г.) состоял в формализации темы, цели, задач, гипотезы исследования, подтверждении актуальности решения проблемы, произведения обзора современного состояния темы и определении методики решения задач.
2. Моделирующий этап (2018-2019 гг.) состоял в обзоре и выборе методов классификаций, моделировании математической модели, апробации результатов исследования на научных конференциях и формализации статей.
3. Экспериментальный этап (2020 г.) состоял в реализации метода обработки рентгенографического снимка для последующей формализации набора данных, реализации глубокой сверточной нейронной сети, анализе полученных результатов работоспособности системы.
Публикации по теме магистерской работы представлены на XLV Самарской областной студенческой научной конференции, VI международной научно-практической конференции. Результаты исследования сформулированы в статьях в научных сборниках.
Научная новизна заключается в получении высокой точности классификации пневмонии и туберкулеза на рентгенографических снимках грудной клетки при помощи моделировании составной глубокой сверточной нейронной сети, тонкой настройки и составлении набора данных, помогающих повысить точность.
На защиту предоставляются:
1. Метод предобработки рентгенографических снимков.
2. Математическая модель сверточной нейронной сети.
3. Реализованная глубокая сверточная нейронная сеть.
Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и трех приложений. Работа изложена на 74 страницах, включает 35 иллюстрации, 10 таблиц, 35 использованных источников.
В процессе работы над магистерской диссертацией были описаны актуальность и проблематика рассматриваемой темы, выявлен объект, предмет, поставлена цель и сформулированы задачи по теме исследования.
Проанализированы виды заболеваний органов легких и формы проявления на рентгенографическом снимке. Выбраны заболевания для последующей классификации: пневмония и туберкулез. Произведен обзор современного состояния существующих методов классификации рентгенограмм. Сделан вывод, что для выполнения цели исследования наиболее подходит заведомо обученная нейронная сеть. Проведен анализ, выбран и описан язык программирования, с помощью которого происходит реализация классификации, описан формат DICOM. Сформулированы требования и задачи для выполнения решения проблемы исследования.
Произведен анализ методов сегментации с целью улучшения гибридного алгоритма, реализованного в бакалаврской работе. В результате выбран метод активных контуров и адаптивный метод повышения контраста. Рассмотрена архитектура сверточной нейронной сети и произведен сравнительный анализ эффективности моделей заведомо обученных сетей. Сформирована математическая модель сверточной нейронной сети.
Реализованы алгоритм обработки формата DICOM и улучшен алгоритм сегментации рентгенографического снимка. Получены сегментированные области легких с повышенным контрастом регионов. Сформированы три набора данных для обучения нейронной сети. Реализованы глубокие сверточные нейронные сети на основе модели Inception-v3 и VGG-16, и произведена тонкая настройка для улучшения точности результата.
Полученные нейронные сети обучены на трех различных наборах данных. В результате сделан вывод, что целесообразнее использовать нейронную сеть на основе модели Inception-v3 и обучать ее на наборе, содержащим сегментированные снимки с увеличенным контрастом. Реализован алгоритм работы с нейронной сетью и произведена проверка на работоспособность. В результате не выявлено некорректного поведения алгоритма. Алгоритм полностью соответствует поставленным требованиям.
Реализованная глубокая сверточная нейронная сеть достигает 89,17% точности классификации рентгенографических снимков, что является хорошим показателем сети, обученной на небольшом объеме данных.
Разработанный в процессе диссертационной работы алгоритм поможет в повышении эффективности диагностики заболеваний легких, как вспомогательный инструмент для врача, а также снизит коэффициент неверно поставленных диагнозов. Алгоритм имеет перспективу улучшения в повышении точности за счет увеличения набора данных и повышении качества постановки диагноза, учитывая другие факторы, влиявшие на пациента.
Нормативно-правовые акты
1. ГОСТ 19.701-90. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения [Текст]. Введ. 1992-01-01. - М. : Изд-во стандартов, 1992. - 14 с.
2. ГОСТ 2.105-95. Общие требования к текстовым документам [Текст]. - Введ. 1995-04-26. - М. : Госстандарт России: Изд-во стандартов, 1996. - 29 с.
3. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание. Общие требования и правила составления [Текст]. - Введ. 2004-07-01. - М. : Госстандарт России: Изд-во стандартов, 2004.
4. ГОСТ 7.32-2001. Отчет о научно-исследовательской работе. Структура и правила оформления [Текст]. Введ. 2002-07-01. - М. : Госстандарт России: Изд-во стандартов, 2002.
5. ГОСТ 7.82-2001. Библиографическая запись. Библиографическое описание электронных ресурсов. [Текст]. Введ. 2001-05-01. - М. : Госстандарт России: Изд-во стандартов, 2001.
Научная и методическая литература
6. Астафьева В.В. Разработка математической модели нейронной сети [Текст] / В.В. Астафьева ; Молодой ученый. - 2016. - №19. - 1-4 с.
7. Гузий Е.А. Сверточная нейронная сеть для разработки системы распознавания и классификации изображений [Текст] / Е.А. Гузий, В.В. Федоренко ; Молодежный научно-технический вестник. - 2017.
8. Лисовская, М.Г. Разработка алгоритма распознавания патологий на цифровых рентгенограммах [Текст] / М.Г. Лисовская; Научные исследования и перспективные проекты. - Тольятти, 2017. - 17-21 с.
9. Немков Р.М. Метод синтеза параметров математической модели сверточной нейронной сети с расширенным обучающим множеством [Текст] / Р.М. Немков ; Современные проблемы науки и образования. - 2015. - №1.
10. Семашко, А.С. Обработка и анализ границ объектов на основе метода активных контуров [Текст] / А.С. Семашков, А.С. Крылов; МГУ имени Ломаносова, вычислительная математика и кибернетика, лаборатория математических методов обработки изображений. - Москва, 2015. - 4 с.
11. Спиркина А.А. Разработка и реализация метода сегментации рентгенограммы с наименьшим коэффициентом ошибки [Текст] / А.А. Спиркина; выпускная квалификационная работа. - [2018]. - 42 с.
12. Спиркина, А.А. Классификация патологий на цифровых рентгенограммах грудной клетки при помощи глубокой сверточной нейронной сети [Текст] / А.А. Спиркина, М.Г. Лисовская; сборник статей «Информационные технологии в моделировании и управлении: подходы, методы, решения». - Тольятти, 2020. - 276-282 с.
13. Талалаев А.А. Анализ эффективности применения искусственных нейронных сетей для решения задач распознавания, сжатия и прогнозирования [Текст] / А.А. Талалаев, И.П. Тищенко, В.П. Фраленко, В.М. Хачумов ; Искусственный интеллект и принятие решений. - [2008]. - № 2. - 24-33 с.
14. Тропченко А.Ю. Методы вторичной обработки и распознавания изображений : учебное пособие [Текст] / А.Ю. Тропченко, А.А. Тропченко. - СПб: Университет ИТМО. - [2015]. - 215 с.
15. Труфанов Г.Е. Лучевая диагностика : учебник [Текст] / Г.Е. Труфанов ; 8 глава. - [2014]. - 416 с.
...