ВВЕДЕНИЕ. 5
1. Анализ способов дифференциации затемнений рентгенограммы . 6
1.1 Анализ снимка рентгенологом. 6
1.2 Методы исследования дыхательных путей. 7
1.3 Автоматизированная классификация изображений. 8
1.4 Анализ нейросетевого подхода . 10
2. Разработка алгоритма дифференциации. 22
2.1 Выбор технических средств 22
2.2 Сравнение архитектур для классификации. 26
2.3 Анализ датасета 32
3. Обучение нейронных сетей и тестирование моделей 34
3.1 Обучение нейронной сети для классификации . 34
3.2 Выделение области интереса. 36
ЗАКЛЮЧЕНИЕ 39
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ. 40
Аннотация. Введение.
Заболевания легких являются одной из самых больших угроз для здоровья человека. По данным Европейской Белой Книги по заболеваниям легких [1], из-за них происходит каждая шестая смерть во всем мире, а в России на каждые 100000 человек приходится около 90 человек с патологиями легких. Эти патологии приводят к инвалидности и даже могут стать причиной смерти, что влечет за собой огромные затраты на первую помощь, госпитализацию и лекарства. Кроме этого, огромный ущерб наносит потеря людьми трудоспособности и преждевременные смерти в результате болезни.
Цифровая рентгенография является одним из первых и основных вариантов диагностики различных заболеваний. Рентгенограммы позволяют увидеть даже самые незначительные изменения и не только выявить патологию на ранних стадиях, но и поставить точный диагноз заболевания. Именно поэтому рентгенографическое исследование широко распространено по всему миру и остается приоритетным в медицинской практике даже в хорошо оснащенных клиниках и медицинских центрах. Однако работа с рентгеновскими снимками - это постоянная работа с однородными изображениями, поэтому на стадии постановки диагноза есть вероятность, что болезнь может быть не замечена врачом. В связи с тем, что планово рентген делают лишь раз в год, незамеченная болезнь на ранней стадии может сильно спрогрессировать до следующего обследования.
Чтобы снизить влияние человеческого фактора при анализе снимков и обнаружить как можно большее количество патологических процессов необходимо создать вспомогательный инструмент «Второй глаз», выступающий в роле интерна просматривающего снимки для выявления патологии и выделения области требующей внимания. Таким инструментом может стать ПО со сверточной нейронной сетью, способной выполнять поставленные задачи без вмешательства со стороны. Особенно востребован такой инструмент будет при проведении массового обследования.
Целью выпускной квалификационной работы являлась повышение степени автоматизации в анализе рентгенограммы и разработка приложения для этого. Создание данного приложения позволяет классифицировать рентгеновские снимки груди по патологиям на 14 классов. На основе анализа установлено, что задачу распознавания можно успешно решить с помощью сверточных нейронных сетей, которые обладают рядом преимуществ для работы с изображениями.
В рамках данной выпускной квалификационной работы были достигнуты следующие результаты:
1. произведен анализ работы рентгенолога и методов, которые он использует в работе, выявлены проблемы и предложено их решение, а именно использование нейросетевого подхода;
2. были исследованы основные методы систем распознавания и архитектуры нейронных сетей;
3. выбран и подготовлен подходящий набор данных для обучения;
4. для обучения был разработан соответствующий алгоритм, выбраны наиболее подходящие архитектуры нейронных сетей для задачи;
5. проведены эксперименты посредством обучения нейросетей на данных, по результатам которых была обучена модель сверточной нейронной сети построенная по архитектуре DenseNet201 и показавшая наилучшие результаты классификации при анализе рентгенограммы , а именно точность порядка 0.827 по AUC при классификации по 14 патологиям грудной клетки;
6. был реализован метод Grad-CAM позволяющий локализовать патологии если таковые имеются.
Разработанная сеть может быть использована специалистами для уменьшения вероятности пропуска патологии за счет концентрирования их внимания на определенной области с предположением о находящейся там патологии.