Введение 3
Постановка задачи 5
Глава 1. Обзор литературы 6
1.1. Основные определения 6
1.2. Обзор существующих решений задачи классификации . . 12
1.3. Обзор существующих решений задачи детекции 15
1.4. Доступные программные средства 18
Глава 2. Архитектура и особенности реализации 19
2.1. Обработка данных 20
2.2. Архитектура модели классификации 23
2.3. Архитектура модели детекции 26
Глава 3. Полученные результаты 28
3.1. Модель классификации 28
3.2. Модель детекции 32
Заключение 35
Список литературы
В настоящее время основным методом исследования и диагностики заболеваний лёгких является рентгенограмма грудной клетки, по которой опытный специалист может выделить различить около десятка патологий. В настоящей работе проводится исследование возможности автоматической диагностики наиболее важной из них - пневмонии. Пневмония является очень опасным заболеванием. В год диагноз пневмония ставится более 17 млн человек. Особенную опасность она представляет для детей и пожилых людей. Она является причиной смертности 18 % детей до 5 лет во всем мире [1]. Также на сегодняшний день пневмония, возникшая на фоне коронавирусной инфекции (COVID-19), унесла жизни более 300 тысяч людей по всему миру. [2]
В настоящее время анализ рентгенограмм чаще всего выполняется высококвалифицированными специалистами вручную. В связи с этим, на-грузка да рентгенологов существенно возрастает за счёт того, что им приходится иметь дело с огромным потоком снимков, который возникает в силу массовости процедуры, особенно в период эпидемий. Для повышения точности постановки диагноза и уменьшения влияния человеческого фактора одни и те же снимки проверяются двумя специалистами или одним с интервалом в один день, что увеличивает нагрузку вдвое. Даже очень опытным специалистам бывает сложно проанализировать более 100 снимков в день. Чем позднее обнаружена пневмония, тем выше риск летального исхода. Таким образом, задача создания алгоритма для автоматического обнаружению пневмонии на рентгенограмме грудной клетки является актуальной. Например, существуют различные соревнование RSNA Pneumonia Detection Challenge по данной тематике с денежным призовым фондом.
Задача диагностики пневмонии по рентгенограмме фактически сводится к задаче детектирования областей и распознавания изображений, которая в настоящее время в основном решается с использованием методов глубокого обучения [3]. Наилучшим подходом на данный момент является применение свёрточных нейронных сетей, которые и будут использоваться в данной работе. Существует множество архитектур нейронных сетей, которые имеют различную степень предрасположенности к обучению. При обучении нейросетей, предназначенных для обработки изображений, большое значение имеет «чистота» выбранных данных. В данном случае подразумевается отсутствие различных шумов, например, в контексте рентгенограмм требуется иметь не засвеченные снимки и снимки без наличия посторонних предметов на них. Следовательно, необходимым этапом является предварительная обработка изображений. В данной работе используются классические методы по предобработке изображений, приведенные на официальной странице соревнования на сайте kaggle.com[4].
В ходе данной работы был построен алгоритм обнаружения пневмонии на рентгенограммах органов грудной клетки и проведён анализ полученных результатов.
Уникальность данной работы заключается в том, что часть построенного алгоритма является модификацией существующей архитектуры [5], имея при этом существенно меньшее число параметров, но сравнимую точность.
Постановка задачи
Целью данной работы является построение алгоритма обнаружения пневмонии на рентгенограмме грудной клетки и выделение границ поражённой области с помощью методов глубокого машинного обучения. Для достижения данной цели необходимо решить следующие задачи:
1) провести изучение предметной области и анализ существующих решений поставленной задачи;
2) рассмотреть методы предобработки медицинских изображений и применить их к изображениям из имеющегося датасета;
3) разработать архитектуру системы, позволяющей эффективно осуществлять анализ рентгеновских снимков;
4) подобрать подходящие гиперпараметры и произвести обучение реализованной модели;
5) провести тестирование реализованного решения, измерить его производительность и сделать выводы относительно полученных результатов.
В ходе работы были получены следующие результаты:
1. Проведено изучение предметной области, анализ существующих решений поставленной задачи и рассмотрены технические возможности для их реализации. В результате было принято решение использовать комбинированный алгоритм, первой частью которого является классификация имеющихся данных, а второй - детекция пневмонии с помощью сегментационной свёрточной сети.
2. Для подготовки данных было рассмотрено три метода предобработки медицинских изображений. Было проанализировано влияние всех трёх методов на верность предсказания классификационных моделей. Лучшие результаты получены при предобработке с помощью метода усиления локального контраста.
3. Разработана архитектура системы, позволяющая эффективно осуществлять детекцию пневмонии на снимках и вместе с этим сравнить эффективность двух разных подходов к её решению. Принято решение сравнить детекцию поражённых областей с предварительной классификацией изображений и без предварительной классификации.
4. Опытным путём были подобраны гиперпараметры, позволяющие получить максимально высокие показатели точности предсказаний обученной модели на тестовых выборках.
5. Произведен анализ полученных результатов, следуя которому можно сделать выводы о том, что детекция с предварительной классификацией снимков дает намного более точные результаты.
В дальнейшем планируется доработать существующее решение с использованием более мощных технических средств, достаточных для проведения нескольких эпох обучения, с целью улучшения показателей его производи-тельности. А также апробировать предварительную классификацию изображений на три класса.