Введение 4
Постановка задачи 5
Обзор литературы 6
Глава 1. Описание медицинских и математических аспектов задачи распознавания пневмонии 7
1.1. Описание пневмонии 7
1.2. Диагностика пневмонии 9
1.3. Описание задачи классификации 12
1.4. Распознавание пневмонии как задача бинарной классификации 14
Глава 2. Описание используемых подходов 16
2.1. Подход, основанный на использовании сверточных нейронных сетей 16
2.1.1 Функции активации 17
2.1.2 Функция потерь 19
2.1.3 Переобучение 21
2.1.4 Сверточные нейронные сети 23
2.1.5 Структура нейронной сети, решающей задачу распознавания пневмонии 27
2.2. Подход, основанный на использовании колмогоровской сложности 30
2.2.1 Основные теоретические аспекты 30
2.2.2 Алгоритм классификации 32
2.2.3 Детали реализации алгоритма классификации 33
Глава 3. Сравнение результатов 35
3.1. Описание данных 35
3.2. Метрики 36
3.3. Выбор гиперпараметров и сравнение методов 37
Выводы 41
Заключение 42
Список литературы 43
Диагностика заболеваний, поражающие органы дыхания, является актуальной медицинской проблемой. Такие болезни чрезвычайно опасны, но своевременное обращение к специалистам обычно помогает избежать тяжелых осложнений. Пневмония является тяжелым инфекционным поражением легочной ткани. Клинические картины вирусной и бактериальной пневмонии во многом совпадают [1].
Наиболее точным методом распознавания пневмонии является компьютерная томография [2], однако компьютерные томографы пока есть далеко не во всех лечебных учреждениях. Основным методом диагностики, использующимся на практике, является рентгенологическое исследование. Данный метод обладает меньшей разрешающей способностью и наличием шумов, но более распространен из-за большей доступности рентгеновских аппаратов [3]. Нагрузка на специалистов-рентгенологов такова, что в течение дня ими анализируются десятки и даже сотни снимков. Это приводит к неизбежным ошибкам при постановке диагнозов. Поэтому актуальна разработка быстрых и надежных компьютерных программ, помогающих врачам оперативно обнаруживать заболевание по рентгеновским снимкам грудной клетки.
В данной работе для решения задачи распознавания по рентгеновским снимкам такого заболевания как пневмония рассматриваются два подхода. Первый из них, активно изучаемый в последнее время, основан на применении нейронных сетей [4-7]. В работах показана перспективность данного подхода. При этом отмечается, что точность классификации сильно зависит от количества представленных образцов, и уделяется особое внимание предварительной обработке изображений.
Второй подход, предлагаемый автором, использует понятие нормализованное расстояние сжатия [8, 9], являющегося практической реализацией такого теоретического понятия как колмогоровская сложность [10-12]. Сама идея классификации изображений с использованием колмогоровской сложности не нова (например, [13]). Однако представляется важным сравнить распространенный сегодня подход, основанный на нейронных сетях, и подход, базирующийся на колмогоровской сложности, с целью выявления достоинств и недостатков каждого из них, что в дальнейшем будет учитываться при разработке программ для диагностики пневмонии.
В первой главе дается медицинское описание пневмонии и перечисляются основные методы ее диагностирования. Затем приводится способ сведения медицинской задачи обнаружения пневмонии к математической задаче бинарной классификации.
Во второй главе рассматриваются основные теоретические аспекты двух подходов и описываются способы программной реализации каждого из них
Третья глава посвящена сравнению результатов работы алгоритмов на заданном наборе данных. Далее следуют выводы с описанием основных преимуществ и недостатков каждого из подходов.
В рамках ВКР все поставленные задачи были выполнены. Была описана задача распознавания пневмонии и методы диагностики этой болезни.
Во второй главе содержатся описания двух подходов к распознаванию пневмонии и предлагаются программные решения, реализующие данные алгоритмы.
Код программ доступен для ознакомления по ссылкам: https://github.com/bogdanov978/Pneumonia-classification-CNN https://github.com/bogdanov978/Pneumonia-classification-Kolmogorov-comlexity
В третьей главе было произведено сравнение качество работы программ, классифицирующих примеры изображений из заданного набора данных.
Итогом настоящей работы являются программы: Сверточная нейронная сеть: (sensitivity = 0.99, specificity = 0.78)
Программа, использующая колмогоровскую сложность (sensitivity = 0.92, specificity = 0.67)
Разработанные программы могут быть использованы в качестве программ- консультантов для специалистов-рентгенологов.
[1] Всемирная организация здравоохранения. Пневмония [Электронный ресурс]. - URL: https://www.who.int/ru/news-room/fact- sheets/detail/pneumonia (дата обращения 14.04.2021).
[2] Струтынский, А.В. Опыт применения компьютерной томографии высокого разрешения легких в диагностике и оценке результатов лечения внебольничной пневмонии / А.В. Струтынский, А.Л. Юдин, Д.В. Семенов, Н.И. Афанасьева, В.А. Семенов, // Пульмонология. - 2014. - №. 4. - С. 68-70.
[3] Иванов, В.В. и др. Дифференциальная диагностика внебольничной пневмонии и диссеминированного заболевания / В.В. Иванов, М.А. Харитонов, В.В. Данцев, Б.А. Чумак, и др. // Вестник Российской военномедицинской академии. - 2015. - №. 2. - С. 113-117.
[4] Ефремцев, В.Г. Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей / В.Г. Ефремцев, Н.Г. Ефремцев, Е.П. Тетерин, П.Е. Тетерин, Е.С. Базавлук // Компьютерная оптика. - 2021. - Т. 45, № 1. - С. 149-153.
[5] Imran, A. Training a CNN to detect Pneumonia. / A. Imran [Электронный ресурс]. - URL: https://medium.com/datadriveninvestor/training-a- cnn-to-detect-pneumonia-c42a44101deb (дата обращения 14.05.2021).
[6] Chhikara, P. Deep convolutional neural network with transfer learning for detecting pneumonia on chest X-rays / P. Chhikara, P. Singh, P. Gupta, T. Bhatia // Advances in Bioinformatics, Multimedia, and Electronics Circuits and Signals. - Springer, Singapore, 2020. - P. 155-168.
[7] Арбузова, А.А. Диагностика легочных заболеваний с помощью нейронных сетей / А.А. Арбузова // Математическое и компьютерное моделирование естественно-научных и социальных проблем: материалы XIV Международной научн.-техн. конф. молодых специалистов, аспирантов и студентов (Россия, г. Пенза, 14 июня 2020 г.) - 2020. - С. 185-189.
[8] Cilibrasi, R. Clustering by compression / R. Cilibrasi, P. Vitanyi // IEEE Transactions on Information Theory. - 2005. - V. 51, Iss. 4. - P. 1523-1545.
[9] Li, M. The Similarity Metric / M. Li, P. Vitanyi // IEEE Transaction on Information Theory, vol. 50, N° 12, 2004, pp. 3250-3264.
[10] Колмогоров, А.Н. Три подхода к определению понятия «количество информации» / А.Н. Колмогоров // Проблемы передачи информации. - 1965. - Т 1, Вып. 1. - С. 3-11.
[11] Верещагин, Н.К. Колмогоровская сложность и алгоритмическая случайность / Н.К. Верещагин, В.А. Успенский, А. Шень. - М.: МЦНМО, 2013. - 576 с.
[12] Li, M. An Introduction to Kolmogorov Complexity and Its Applications. / Ming Li, P. Vitanyi - 3rd ed. New York: Springer-Verlag, 2008. - 809 p.
[13] Quispe-Ayala, M.R. Image classification using data compression techniques / M.R. Quispe-Ayala, K. Asalde-Alvarez, A. Roman-Gonzalez // IEEE 26th Convention of Electrical and Electronics Engineers in Israel. - 2010. - С. 000349-000353.
[14] ChestX-ray14. [Электронный ресурс]. URL: https://nihcc.app.box.com/v/ChestXray-NIHCC (дата обращения 24.04.2021).
[15] Chest X-Ray Images (Pneumonia)|Kaggle. [Электронный ресурс]. - URL: https://www.kaggle.com/paultimothymooney/chest-xray-pneumonia (дата обращения 24.04.2021).
...