Введение 4
Постановка задачи 7
Обзор литературы 8
Глава 1. Анализ данных 10
1.1 Анализ наборов данных медицинских изображений 10
1.1.1 Набор данных OASIS 10
1.1.2 Набор данных CBIS-DDSM 11
1.1.3 Набор данных BRATS 12
1.2 Анализ используемого набора изображений 14
1.2.1 Обзор данных 14
1.2.2 Описание патологий набора CheXpert 17
1.3 Выводы 19
Глава 2. Методы классификации медицинских изображений 21
2.1 Свёрточные нейронные сети 21
2.1.1 Свёрточный слой 22
2.1.2 Слой пулинга 23
2.1.3 Полносвязные слои 23
2.1.4 Residual block 24
2.1.5 Dense Block 24
2.1.6 Depthwise separable convolution 25
2.2 Модель внимания 26
2.3 Выводы 29
Глава 3. Модель внимания к потенциальным областям интереса на изображении 31
3.1 Модель с механизмом внимания 31
3.1.1 Карты признаков 31
3.1.2 Механизм выделения областей интереса 32
3.1.3 Обучение модели 34
3.2 Модель на основе анализа частей изображения 34
3.2.1 Выделение областей 35
3.2.2 Архитектура модели 35
3.3 Ансамблирование моделей 37
3.4 Выводы 38
Глава 4. Реализация метода 40
4.1 Структура программного обеспечения 40
4.2 Базовая модель 40
4.3 Предложенный подход 42
4.4 Выводы 44
Заключение 45
Список литературы 46
Сегодня методы машинного обучения играют всё большую роль в автоматизации медицинских процессов, им находят применение в таких областях как геномная биоинформатика, структурная биоинформатика, анализ медицинских снимков и многих других направлениях исследований.
Так, например, искусственным интеллектом решается задача прогнозирования фолдинга белка, то есть процесс формирования сложной структуры белка. Данные прогнозы способствуют созданию белков, имеющих определённую структуру, что позволяет создавать лекарства на основе белка.
В области геномной биоинформатики искусственный интеллект решает такие задачи как: аннотация геномов и предсказание эффекта мутаций, что позволяет в значительной степени ускорить процесс аннотации, что особенно важно, учитывая стремительно растущее количество данных о последовательностях генома.
Наиболее заметную роль, методы машинного обучения играют в области анализа медицинских изображений, таких как рентген снимки и изображения, полученные с помощью компьютерной томографии. Искусственный интеллект позволяет обнаружить различные патологии на данных изображениях, что позволяет снизить нагрузку на медицинский персонал. Наиболее популярными направлениями в данной области является поиск новообразований на рентген снимках груди и томографии мозга.
Применение машинного обучения в области анализа медицинских изображений сегодня актуально как никогда, учитывая растущую доступность исследований с помощью магнитно-резонансной томографии, сегодня генерируется большое количество данных, которые необходимо анализировать человеку. Внедрение искусственного интеллекта в данный процесс, позволит значительно увеличить скорость обработки данных и снять нагрузку со специалистов в данной области. Высокая степень автоматизации данных процессов позволит проводить более широкую диспансеризацию населения, что в свою очередь приведёт к увеличению ранней выявляемости заболеваний, а следственно снизит уровень смертности населения, от заболеваний которые имеют слабую симптоматику на раннем этапе.
О необходимости исследований в данной области нам говорит то, что уже сегодня методы машинного обучения внедряются в процесс диагностики заболеваний. Так например, уже сегодня платформа Botkin.AI помогает врачам выявлять рак лёгких на компьютерных томограммах, а модель, разработанная компанией Care Mentor AI позволяет по КТ-снимкам определить процент и степень поражения лёгких COVID-19. Данные сервисы были подключены к единому радиологическому информационному сервису, что говорит о том, что данный подходу уже активно используется для диагностики заболеваний.
Основным источником данных, рассматриваемом в данной работе являются рентген снимки груди с выявленными заболеваниями. Основной задачей данной работы является классификация данных снимков по типу выявленного заболевания. Для решения данной необходимо привлечь методы машинного обучения, в частности свёрточные нейронные сети, которые являются наиболее популярным решением для анализа изображений.
Так же необходимо проанализировать специфику данных снимков, для того чтобы произвести соответствующую предварительную обработку изображений и выбрать наиболее подходящую архитектуру свёрточной сети. Следует так же изучить специфику различных наборов данных медицинских изображений, чтобы выявить общие закономерности в таких данных, для того чтобы результаты данной работы не были слишком специфичны и могли быть применены и для других областей анализа медицинских изображений.
В ходе данной работы был произведён обзор различных методов классификации, выполнен поиск необходимых данных, были предложены базовый подход и подход, учитывающий специфику данных изображений, данные подходы были реализованы, было произведено сравнение и анализ их результатов работы.
В ходе данной работы был проведён анализ популярных наборов медицинских данных. В результате данного анализа была выявлена общая специфика для наборов медицинских изображений. Были проанализированы популярные подходы учитывающие данную специфику. На основе анализа данных подходов были предложены решения, которые потенциально могут исправить недостатки рассмотренных решений. Были разработаны и реализованы архитектуры свёрточных сетей, необходимые для реализации предложенного подхода. Было реализовано ансамблирование моделей. Был предложен и реализован механизм выделения зон интереса на изображений. В итоге предложенная модель позволила улучшить точность классификации относительно подхода реализованного с помощью ансамбля популярных архитектур свёрточных сетей.
[1] Hao R., Namdar K., Liu L., Khalvati F. A Transfer Learning Based Active Learning Framework for Brain Tumor Classification [Электронный ресурс] // arXiv preprint arXiv:2011.09265. - 2020 URL: https://arxiv.org/abs/2011.09265 (дата обращения 15.04.2021).
[2] Khan M.A., Ashraf I., Alhaisoni M., Damasevicius R., Scherer R., Rehman A. Multimodal Brain Tumor Classification Using Deep Learning and Robust Feature Selection: A Machine Learning Application for Radiologists //Diagnostics (2075- 4418).-2020.-Т. 10.-№. 8.
[3] Chaunzwa L.T, Hosny A., Xu Y., Shafer A., Diao N., Lanuti M., Christiani D., Mak R. Deep learning classification of lung cancer histology using CT images //Scientific reports. -2021. -Т. 11.-№. 1.-С. 1-12.
[4] Sathyakumar K., Munoz M., Singh J., Hussain N., Babu B.A. Automated Lung Cancer Detection Using Artificial Intelligence (AI) Deep Convolutional Neural Networks: A Narrative Literature Review //Cureus. - 2020. - Т. 12. - №. 8.
[5] Khan H.A., Jue W., Mushtaq M., Mushtaq U.M. Brain tumor classification in MRI image using convolutional neural network //Mathematical Biosciences and Engineering. - 2020. - Т. 17. - №. 5. - С. 6203-6216.
[6] LaMontagne P.J., Benzinger T., Morris J.C., Keefe S., Hornbeck R., Xiong C., Grant E., Hassenstab J., Moulder K., Vlassenko A.G., Raichle M.E., Cruchaga C., Marcus D. OASIS-3: longitudinal neuroimaging, clinical, and cognitive dataset for normal aging and Alzheimer disease [Электронный ресурс] //MedRxiv. - 2019 URL: https://www.medrxiv.org/content/10.1101/2019.12.13.19014902v1 (дата обращения 16.04.2021).
[7] Islam J., Zhang Y. An ensemble of deep convolutional neural networks for Alzheimer's disease detection and classification [Электронный ресурс] //arXiv preprint arXiv:1712.01675. - 2017 URL: https://arxiv.org/abs/1712.01675 (дата обращения 16.04.2021).
[8] Wen J., Thibeau-Sutre E., Diaz-Melo M., Samper-Gonzalez J., Routier A., Bottani S., Dormont D., Durrleman S., Burgos N., Colliot O. Convolutional neural networks for classification of Alzheimer's disease: Overview and reproducible evaluation //Medical image analysis. - 2020. - Т. 63. - С. 101694.
[9] Heath M., Bowyer K., KopansD., Kegelmeyer P., Moore R., Chang K., Munishkumaran S. Current status of the digital database for screening mammography //Digital mammography. - Springer, Dordrecht, 1998. - С. 457460.
[10] Sun H., Li C., Liu B., Liu Z., Wang M., Zheng H., Feng D.D., Wang S. AUNet: Attention-guided dense-upsampling networks for breast mass segmentation in whole mammograms //Physics in Medicine & Biology. - 2020. - Т. 65.-№. 5. - С. 055005.
[11] Xi P., Shu C., Goubran R. Abnormality detection in mammography using deep convolutional neural networks //2018 IEEE International Symposium on Medical Measurements and Applications (MeMeA). - IEEE, 2018. - С. 1-6.
[12] Menze B.H., Jakab A., Bauer S., Kalpathy-Cramer J.,. Farahani K, Kirby J., et al. The multimodal brain tumor image segmentation benchmark (BRATS) //IEEE transactions on medical imaging. - 2014. - Т. 34. - №. 10. - С. 1993-2024.
[13] Bakas S., Akbari H.,. Sotiras A, Bilello M., Rozycki M., Kirby J.S., et al., Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features //Scientific data. - 2017. - Т. 4. - №. 1. -С. 1-13.
[14] Bakas S., Reyes M., Jakab A., Bauer S., Rempfler M., Crimi A., et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the BRATS challenge [Электронный ресурс] //arXiv preprint arXiv:1811.02629. - 2018 URL: https://arxiv.org/abs/1811.02629 (дата обращения 15.04.2021).
[15] Awasthi N., Pardasani R., Gupta S. Multi-Threshold Attention U-Net (MTAU) based Model for Multimodal Brain Tumor Segmentation in MRI scans [Электронный ресурс] //arXiv preprint arXiv:2101.12404. - 2021 URL: https://arxiv.org/abs/2101.12404 (дата обращения 21.04.2021).
...