Тип работы:	Предмет:	Язык работы:

Поиск аномалий на рентгенограммах грудной клетки

Работа №	125497
Тип работы	Бакалаврская работа
Предмет	программирование
Объем работы	26
Год сдачи	2018
Стоимость	4550 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено	33

Не подходит работа?

Узнай цену на написание

Содержание

Введение 4
Постановка задачи 6
1. Обзор 7
1.1. Нейросеть ChestXNet 7
1.2. Генеративные модели 8
1.2.1. Лвтоэнкодеры 9
1.2.2. Генеративно-состязательные нейросети 10
1.3. Алгоритмы классификации 11
1.3.1. Случайный лес 12
1.3.2. Машина опорных векторов 12
1.4. Метод оценки точности 12
1.4.1. Метрика AUC-ROC 13
1.4.2. Метрика AUC-PR 14
2. Подготовка данных для машинного обучения 15
3. Разработанные модели машинного обучения 16
3.1. Лвтоэнкодер 16
3.2. Генеративно-состязательная нейросеть 16
3.3. Классификация 19
4. Эксперименты 20
4.1. Автоэнкодер 20
4.2. Генеративно-состязательная нейросеть 20
4.3. Выводы 21
Заключение 24
Список литературы 25

Введение

При медицинском исследовании легких с помощью рентгенограмм грудной клетки можно выделить примерно 14 видов патологий таких как рак, пневмоторакс, пневмония, фиброз, эмфизема и туберкулез.
Главным заболеванием, из-за которого люди проходят регулярные флюорографические исследования, является туберкулез. Он является весьма заразным и опасным заболеванием, поэтому проведение рентгенологического исследования грудной клетки, является обязательной и ежегодной процедурой для каждого человека в России.
Из-за массовости этой процедуры многие миллионы рентгенограмм должны быть проанализированы, что является огромной нагрузкой для радиологов. Более того, чтобы снизить риски человеческого фактора, рентгенограмма проверяется минимум двумя специалистами или одним и тем же специалистом, но два раза с интервалом минимум один день. Анализ рентгенограмм — это сложная работы над однородными изображениями, и даже опытным радиологам сложно качественно обработать более чем 100 рентгенограмм в день. Также по данным СПб НИИФ причиной 21% поздних стадий туберкулеза является несвоевременное обнаружение на флюорографии. Поэтому существует заинтересованность в разработке компьютерных алгоритмов для поиска аномалий на рентгенограмме, которые впоследствии станут вспомогательным инструментом в помощь радиологам.
Одним из методов машинного обучения являются нейронные сети. Нейронные сети являются универсальными системами для интерполяции функций. Нейронная сеть с оптимальной архитектурой способна аппроксимировать функцию выделения патологий и переложить задачу формализации признаков патологий с человека на нейронную сеть, что упрощает классификацию снимков грудной клетки.
Новизна данной работы состоит в применении автоэнкодеров и генеративно-состязательных нейросетей для классификации медицинских данных. В работе проверялось две гипотезы. Первая состояла в том, что в скрытом пространстве автоэнкодера можно разделить здоровые и нездоровые снимки, а вторая — в том, что если обучить генеративную нейронную сеть на здоровых снимках, то патологии можно искать как разницу между входным и выходным снимком.
Работа состоит из обзора, трех глав и заключения.
В обзорной части (1) описывается какие подходы уже применялись для обнаружения патологий в легких, подробно обозревается нейронная сеть ChextXNet, описываются основные концепции генеративных методов машинного обучения, в том числе подробно описывается модели автоэнкодера и генеративно-состязательной нейронной сети. Описываются алгоритмы случайный лес и машина опорных векторов, использованные для классификации скрытого представления снимков на здоровые и нездоровые, и метрики AUC-ROC и AUC-PR, использованные для оценки качества алгоритмов.
В первой главе (2) описываются использованные данные: удалось отобрать 27320 здоровых снимков и 13863 снимков с аномалиями из датасета NIH Chest X-ray.
Во второй главе (3) подробно описывается архитектура автоэнкоде- ра и генеративно-состязательной нейронной сети: применяли последовательно сверточные слои, слои нормализации и активационные слои ReLU и рассчитывали ошибки моделей как среднюю квадратическую ошибку. Также для классификации применялся случайный лес с 1000 решающими деревьями и машина опорных векторов с радиальной базисной функцией в качестве ядра.
В третьей главе (4) описывались эксперименты: выборка разделялась в пропорциях 85% и 15% для обучения и тестирования соответственно, применялся метод оптимизации Адама со скоростью обучения 1e-3. Приводятся результаты и делается вывод, что первая гипотеза жизнеспособна и получена наилучшая точность в 0.65, а подтвердить вторую не удалось.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

Курсовые Статьи Диплом Рязань

Заключение

В рамках данной выпускной квалификационной работы были достигнуты следующие результаты.
1. Проведена подготовка данных для машинного обучения: из да- тасета NIH Chest X Ray были отобраны снимки без патологий подходящие для обучения.
2. Разработана модель автоэнкодера и комбинированная модель, включающая в себя генеративно-состязательную нейросеть и вариационный автоэнкодер. Реализованы модели на языке программирования python с помощью фреймворка Pytorch.
3. Проведены эксперименты с реализованными моделями: проведено обучение на обработанных данных, в качестве метрики для оценки эффективности моделей выбраны метрики AUR-ROC и AUC- PR, модели протестированы на тестовой части данных и получена лучшая точность классификации 0.65.

Литература

[1] Luna16. — 2016. — Access mode: https://luna16.grand-challenge. org/.
[2] Data science bowl 2017. — 2017. — Access mode: https://www. kaggle.com/c/data-science-bowl-2017.
[3] ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases / Xiaosong Wang, Yifan Peng, Le Lu et al. // CoRR. — 2017. - Vol. abs/1705.02315. -1705.02315.
[4] Learning to diagnose from scratch by exploiting dependencies among labels / Li Yao, Eric Poblenz, Dmitry Dagunts et al. // CoRR. — 2017. — Vol. abs/1710.10501. —1710.10501.
[5] CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning / Pranav Rajpurkar, Jeremy Irvin, Kaylie Zhu et al. // CoRR. —2017.—Vol. abs/1711.05225. —1711.05225.
[6] Generalization of Deep Neural Networks for Chest Pathology Classification in X-Rays Using Generative Adversarial Networks / Hojjat Salehinejad, Shahrokh Valaee, Tim Dowdell et al. // CoRR. — 2017. — Vol. abs/1712.01636. —1712.01636.
[7] Simonyan Karen, Zisserman Andrew. Very Deep Convolutional Networks for Large-Scale Image Recognition // CoRR. — 2014.—Vol. abs/1409.1556. —1409.1556.
[8] Autoencoder for words / Cheng-Yuan Liou, Wei-Chen Cheng, Jiun-Wei Liou, Daw-Ran Liou // Neurocomputing. — 2014. — Vol. 139. — P. 84 - 96.—Access mode: http://www.sciencedirect.com/ science/article/pii/S0925231214003658.
[9] Radford Alec, Metz Luke, Chintala Soumith. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks // CoRR. 1511.06434.
[10] Breiman Leo. Random Forests // Machine Learning. — 2001. — Oct. — Vol. 45, no. 1.—P. 5-32.—Access mode: https://doi.org/10.1023/ A:1010933404324.
[11] Steinwart Ingo, Christmann Andreas. Support Vector Machines. — 1st edition. — Springer Publishing Company, Incorporated, 2008. — ISBN: 0387772413.
[12] Doersch Carl. Tutorial on Variational Autoencoders // CoRR.— 2016. - Vol. abs/1606.05908. -1606.05908.
[13] Официальный сайт Python.—Access mode: https://www.python. org/.
[14] Официальный репозиторий PyTorch. — Access mode: https:// github.com/pytorch/pytorch.
[15] A Tutorial on the Cross-Entropy Method / Pieter-Tjerk de Boer, Dirk P. Kroese, Shie Mannor, Reuven Y. Rubinstein // Annals of Operations Research. — 2005. — Feb. — Vol. 134, no. 1. — P. 19-67. — Access mode: https://doi.org/10.1007/s10479-005-5724-z.
...