Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Извлечение признаков из изображений 10
1.1. Характеристики датасета 10
1.2. Статистики первого порядка 12
1.3. Полутоновая матрица смежности 13
1.4. Локальные бинарные шаблоны 14
1.5. Энергетические характеристики Лавса 15
1.6. Моменты Цернике 16
1.7. Инвариантные моменты 18
Глава 2. Способы классификации изображений 20
2.1. Случайный лес 20
2.2. AdaBoost 20
2.3. Метод k-ближайших соседей 20
2.4. Метод опорных векторов 21
2.5. Многослойный перцептрон 21
Глава 3. Описание экспериментов 22
3.1. Архитектура системы 22
3.2. Инструментарий 22
3.3. Эксперименты 23
Глава 4. Анализ результатов 27
Заключение 29
Список использованных источников 31
Рак молочной железы является одним самых распространенных видов онкологии в мире. По статистике Всемирной Организации Здравоохранения [1] в 2020 году рак груди был обнаружен у более 2,2 миллиона женщин, а количество смертей составило более 685 тысяч. Более того, за последние несколько десятилетий средний возраст возникновения опухолей сильно снизился. Так как сейчас причины возникновения этого заболевания не до конца ясны, на данный момент не существует достаточно эффективных средств его предотвращения. Однако ранняя диагностика заболевания значительно увеличивает шансы на полное восстановление. Чаще всего для такой диагностики врачи используют маммографические снимки, позволяющие анализировать текстуру ткани груди. Тем не менее, по статистике радиологи не обнаруживают значительную часть аномалий в дополнение к высокому уровню ложноположительных результатов по различным причинам (малый опыт радиолога или плохое качество изображений).
В связи с этим получает широкое распространение разработка систем компьютерного обнаружения и диагностики для повышения точности работы врачей, что требует реализации извлечения текстурных, статистических и структурных признаков из областей изображения и обработки этих признаков с помощью алгоритмов машинного обучения, хотя часто такие системы могут лишь провести бинарную классификацию (наличие или отсутствие рака), но не определить конкретный вид аномалии. Например, скопление микро- кальцинатов в молочной железе может быть фактором, говорящим о наличии заболевания, но не всегда оно означает рак.
Так как текстуру тканей груди человеку анализировать сложнее, чем, например, цвет, часто вывод о диагнозе делается на основе границ и очертаний масс или подозрительных областей, но такой признак не всегда является точным, например, поражения тканей не обязательно имеют четкие контуры. Таким образом, разработка систем, анализирующих текстурные признаки снимков, может помочь специалистам в постановке более точного диагноза.
В результате проведенной работы разработана система, решающая задачу детекции аномалии на маммографических изображениях. Проведен поиск и анализ литературы на тему уже существующих решений поставленной и похожих задач и изучено современное состояние вопроса. Изучены методы извлечения текстурных признаков и моментов из изображения для повышения точности классификации; проведены эксперименты с разными комбинациями дескрипторов и алгоритмов машинного обучения. Показатели итогового варианта системы в основном сопоставимы с другими решениями задачи, использующими классическое машинное обучение, хотя уступают некоторым продивинутым реализациям. Тем не менее, благодаря сочетанию нескольких методов в голосовании, полученные результаты будут устойчивы к потенциальному изменению или ухудшению качества набора входных данных. Также итоговая точность метода сопоставима с моделями, использующими глубокое обучение [31], [32], но представленная система имеет преимущество в виде отсутствия необходимости долгого времени на обучение и высоких вычислительных мощностей. Сравнение с некоторыми решениями представлено в Таблице 6.
Таблица 6: Сравнение с некоторыми существующими решениями
Авторы | Метод | Классиф. | Датасет | Точность
Матос и др. [3] | SIFT-LBP | AdaBoost | DDSM | 99%
Роча и др. [7] | GLCM +Gleason Index | SVM | DDSM | 86%
Фархан и др. [11] | LBP | Logistic regression | MIAS | 85%
Алоби и др. [17] | FOS | Voting | DDSM | 87%
Дезерно и др. [12] | 2DPCA | SVM | IRMA | 80%
Цохацидис и др [31] | Finetuning | ResNet152 | CBIS-DDSM | 75%
Ванг и др. [32] | Domain adaptation | ResNet34 | CBIS-DDSM | 85%
Предложенный метод | GLCM, FOS, LBP, Law’s, Hu | Voting | DDSM | 86%
Конец таблицы 6.
Более того, учитывая то, что при изучении маммограм радиологами пропускаются от 10 до 30% случаев рака и до сих высок уровень и ложноположительных, и ложноотрицательных результатов [2], точность итогового варианта системы сопоставима или превышает точность нынешней медицинской диагностики, а значит, вполне может использоваться как средство поддержки решений врача-онколога. Среди возможных вариантов улучшения работы системы можно перечислить смену датасета на новый, состоящий из цифровых маммограм, а не отсканированных, а также добавление сегментирования изображения для более точной детекции аномалии в помощь специалисту- маммологу.
[1] Рак молочной железы // ВОЗ. URL: https://www.who.int/ru/ news-room/fact-sheets/detail/breast-cancer (дата обращения: 11.05.2022).
[2] Меских Е.В., Оксанчук Е.А., Солодкий В.А. Рак молочной же лезы: диагностические сложности и ошибки // Вестник РНЦРР. 2020. №2. — URL: https://cyberleninka.ru/article/n/rak-molochnoy-zhelezy-diagnosticheskie-slozhnosti-i-oshibki (дата обращения: 10.05.2022).
[3] Matos, C,E Diagnosis of breast tissue in mammography images based local feature descriptors / C,E Matos, J. C. Souza, J,O Diniz // Multimedia Tools and Applications. — 2019. — № 78. — С. 12961-12986. — URL: https: //link.springer.com/article/10.1007/s11042-018-6390-x (дата обращения: 10.05.2022).
[4] Computer Aided Breast Cancer Detection Using Ensembling of Texture and Statistical Image Features / S. Roy, S. Das, D. Kar [и др.] // Sensors. — 2021. — № 21. — С. 3628. — URL: https://www.mdpi.com/1424-8220/21/ 11/3628 (дата обращения: 10.05.2022).
[5] Phadke, A. Fusion of local and global features for classification of abnormality in mammograms / A. Phadke, P. Rege // Sadhana. — 2016. — Т. 41. — С. 1-11. — URL: https://www.academia.edu/50779923/Fusion_of_ local_and_global_features_for_classification_of_abnormality_ in_mammograms (дата обращения: 11.05.2022).
[6] Effective Extraction of Gabor Features for False Positive Reduction and Mass Classification in Mammography / M. Hussain, S. Khan, G. Muhammad [и др.] // Applied Mathematics & Information Sciences. — 2014. — Т. 8 — № 1. — С. 397-412. —URL: https://www.naturalspublishing.com/Article. asp?ArtcID=5226 (дата обращения: 11.05.2022).
[7] Texture analysis of masses in digitized mammograms using Gleason and Menhinick Diversity Indexes / S. Rocha, G. Junior, A. Silva, A. Paiva // Revista Brasileira de Engenharia Biomedica. — 2014. — Т. 30. — С. 35-46. — URL: https://www.researchgate.net/publication/276007723_Texture_ analysis_of_masses_in_digitized_mammograms_using_Gleason_ and_Menhinick_Diversity_Indexes (дата обращения: 12.05.2022).
[8] Sharma, S. Computer-aided diagnosis of malignant mammograms using Zernike moments and SVM / S. Sharma, P. Khanna // Journal of digital imaging. — 2014. — Т. 28. — URL: https://pubmed.ncbi. nlm.nih.gov/ 25005867/ (дата обращения: 11.05.2022).
[9] Mammogram Classification Using Selected GLCM Features and Random Forest Classifier / V. P. Singh, A. Srivastava, D. Kulshreshtha [и др.] // International Journal of Computer Science and Information Security (IJCSIS). — 2016. — Т. 14 — № 6. — URL: https://www.academia.edu/27067717/Mammogram_Classification_ Using_Selected_GLCM_Features_and_Random_Forest_Classifier (дата обращения: 11.05.2022).
[10] Vijaya, M. M. Gabor Filter Based Classification of Mammography Images Using LS-SVM and Random Forest Classifier / M. M. Vijaya, B. T. Christy // International Conference on Recent Trends in Image Processing and Pattern Recognition. — Singapore : Springer, 2019. — С. 69-83. — URL: https:// link.springer.com/chapter/10.1007/978-981-13-9184-2_6 (датаобращения: 11.05.2022).
[11] Farhan, A. Texture Analysis of Mammogram Using Local Binary Pattern Method / A. Farhan, Kamil Y // Journal of Physics: Conference Series. — 2020. — Т. 1530. — URL: https://www.researchgate.net/publication/ 341679511_Texture_Analysis_of_Mammogram_Using_Local_Binary_ Pattern_Method (дата обращения: 20.05.2022).
[12] Computer-aided diagnostics of screening mammography using contentbased image retrieval / T. Deserno, M. Soiron, J. Oliveira // Proceedings of SPIE - The International Society for Optical Engineering. — 2012. • Т. 8315. — С. 527-831. — URL: https://www.researchgate. net/publication/228438050_Computer-aided_diagnostics_of_ screening_mammography_using_content-based_image_retrieval (дата обращения: 19.05.2022).
[13] Breast Cancer Histopathological Images Recognition Based on Low Dimensional Three-Channel Features / Y. Hao, S. Qiao, L. Zhang [и др.] // Frontiers in Oncology. — 2021. — Т. 11. — URL: https://www.researchgate.net/publication/352375311_Breast_ Cancer_Histopathological_Images_Recognition_Based_on_Low_ Dimensional_Three-Channel_Features (дата обращения: 20.05.2022)
[14] Selection Mammogram Texture Descriptors Based on Statistics Properties Backpropagation Structure / S. Uyun, S. Hartati, A. Harjoko, S. S. Seno // Journal of Computer Science (IJCSIS). — 2013. — Т. 11 — № 5. • URL: https://www.researchgate.net/publication/251567122_ Selection_Mammogram_Texture_Descriptors_Based_on_Statistics_ Properties_Backpropagation_Structure (дата обращения: 20.05.2022).
[15] Abdalla, A. M. Detection of Masses in Digital Mammogram Using Second Order Statistics and Artificial Neural Network / A. M. Abdalla, S. Dress, N. Zaki // International Journal of Computer Science & Information Technology. — 2011. — Т. 3. — С. 176-186. — URL: https://www.researchgate.net/publication/ 215644411_Detection_of_Masses_in_ Digital_Mammogram_Using_Second_Order_ Statistics_and_Artificial_Neural_Network (дата обращения: 15.05.2022).
...