Введение 4
Глава 1. Обзор предметной области 5
1.1 Методы решения задачи распознавания изображений 5
1.2 Алгоритмы машинного обучения 7
1.2.1 Предобработка 7
1.2.2 Выделение областей интереса 8
1.2.3 Проектирование признаков 8
1.2.3.1 Гистограмма ориентированных градиентов 9
1.2.3.2 Локальные бинарные шаблоны 11
1.2.4 Классификация 13
1.2.5 Сверточные нейронные сети 14
1.2.5.1 Слои сверточной нейронной сети 16
1.2.5.2 Функции активации и обучение 17
1.2.5.3 Построение архитектуры сверточной нейронной сети 19
1.2.6 Ансамбли сверточных нейронных сетей 20
1.2.7 Сверточные нейронные сети основанные на регионах (RCNN) 21
1.2.7.1 Селективный поиск 22
1.3 Существующие подходы к распознаванию полипов 23
1.4 Метрики оценки качества 24
Глава 2. Разработка алгоритма распознавания 26
2.1 Описание исходных данных 26
2.2 Анализ исходных данных 26
2.3 Разработка алгоритмов распонзавания 27
2.3.1 Генерация данных для классификации 30
2.3.1.1 Несбалансированность выборки 31
2.3.1.2 Извлечение сложных отрицательных примеров 32
2.3.1.3 Аугментация 33
2.3.2 Построение классификатора 34
Глава 3. Разработка системы распознавания и проведение экспериментов 35
3.1 Проектирование 35
3.2 Реализация 38
3.2.1 Выбор технологий 38
3.2.2 Интрфейс пользователя 42
3.3 Экспериментальные исследования 41
Заключение 45
Литература 46
Полипы - это избыточное разрастание слизистой оболочки внутри толстой кишки. От 10 до 30% из них могут перерождаться в злокачественные опухоли. По причине поздней диагностики летальность достигает 40% в течение года с момента выявления болезни. Почти в 50% случаев колоректального рака, у больных обнаруживаются метастазы в печени.
Самым информативным методом обследования является колоноскопия. Этот метод позволяет осмотреть толстую кишку на всем ее протяжении.
Представленная статистика и возможность сокращения медицинских ошибок с помощью запоминания особенностей полипов, позволяющих их детектировать, показывает важность разработки и необходимость использования новых программных методов и инструментов, классифицирующих аномальные разрастания в толстом кишечнике.
Целью работы является разработка реконфигурируемой системы для распознавания патологий по видеоданным колоноскопии.
Для достижения данной цели были поставлены следующие задачи:
1. Изучение методов распознавания изображений
2. Изучение существующих подходов к распознаванию полипов
3. Разработка системы для тестирования, сравнения и использования методов распознавания на реальных данных
В ходе работы была построена система для распознавания патологий на видео колоноскопии, были разработаны и протестированы несколько основных методов распознавания.
Ансамбли сверточных нейронных сетей показали самую высокую эффективность для решения задачи классификации полипов. При обнаружении полипов оба рассмотренных метода сегментации показали хороший результат, и могут меняться в зависимость от временных ограничений и требуемой точности. Однако обучающая выборка является недостаточной для построения качественной модели.
В дальнейшем планируется добавить методы предобработки для усиления признаков, увеличить объем обучающих данных, улучшить архитектуру ансамблей сверточных нейронных сетей, а также усовершенствовать веб-приложения для более эффективной разработки и использования.
1. Alexandre, L.A., Nobre, N., Casteleiro, J.: Color and position versus texture features for endoscopic polyp detection. In: International Conference on BioMedical Engineering and Informatics, BMEI 2008, vol. 2, pp. 38-42. IEEE.
2. Tajbakhsh, N., Chi, C., Gurudu, S.R., Liang, J.: Automatic polyp detection from learned boundaries. In: 2014 IEEE 11th International Symposium on Biomedical Imaging (ISBI), 2014. pp. 97-100. IEEE.
3. Tajbakhsh N., Gurudu S.R., Liang J. A Comprehensive Computer-Aided Polyp Detection System for Colonoscopy Videos. In: Ourselin S., Alexander D., Westin CF., Cardoso M. (eds) Information Processing in Medical Imaging. IPMI 2015. Lecture Notes in Computer Science, 2015. Vol. 9123. Springer, Cham.
4. N. Dalal, B. Triggs. Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on, volume 1, pages 886-893. IEEE, 2005.
5. R. Girshick, J. Donahue, T. Darrell, J. Malik. Rich feature hierarchies foraccurate object detection and semantic segmentation. arXiv: 1311.2524
6. J. R. Uijlings, K. E. van de Sande, T. Gevers, A. W. Smeulders. Selective search for object recognition. International journal of computer vision, 104(2):154-171, 2013.
7. C. L. Zitnick and P. Dollar. Edge boxes: Locating object proposals from edges. In Computer Vision-ECCV 2014, pages 391-405. Springer, 2014.
8. Y. Tang. Deep Learning using Linear Support Vector Machines. arXiv: 1306.0239
9. A. Nokland. Improving Back-Propagation by Adding an Adversarial Gradient.arXiv: 1510.04189v2
10. K. He, X. Zhang, S. Ren, J. Sun. Deep Residual Learning for ImageRecognition. arXiv:1512.03385
11. Li B. and Meng M.Q.H., Automatic Polyp Detection for Wireless Capsule Endoscopy Images, Expert Systems with Applications, 39(12), p.10952-10958, 2012.
12. Tamaki T., Yoshimuta J., Kawakami M., Raytchev B., Kaneda K., Yoshida S., Takemura Y., Onji K., Miyaki R. and Tanaka S., Computer-Aided Colorectal Tumor Classification in NBI Endoscopy using Local
13. CVC-ClinicDB // MICCAI Sub-Challenge on Automatic Polyp Detection
Challenge in Colonoscopy Videos. 2015. URL: https://polyp.grand-
challenge.org/site/Polyp/CVCClinicDB/ (дата обращения: 12.04.2017).
14. Shaohua Wan Zhijun Chen Tao Zhang Bo Zhang Kong-kat Wong, Bootstrapping Face Detection with Hard Negative Examples. arXiv: 1608.02236
15. Sebastien C. Wong, Adam Gatt, Victor Stamatescu, Understanding data augmentation for classification: when to warp. arXiv: 1609.08764... 19