ВВЕДЕНИЕ 5
1 АНАЛИЗ МЕТОДОВ СПЕКТРОСКОПИИ И МАШИННОЕ ОБУЧЕНИЯ 8
1.1 Анализ проблемы неинвазивной диагностики кожно -раковых
заболеваний 8
1.2 Машинное обучение и общая характеристика искусственных
нейронных сетей 11
2 ПРОЕКТИРОВАНИЕ НЕЙРОСЕТЕВЫХ АРХИТЕКТУР 15
2.1 Используемое программное обеспечения 15
2.2 Анализ результатов автофлуоресценции для дифференциации
образцов кожи 17
2.3 Сверточные нейронные сети 24
2.4 Обзор архитектуры CNN 25
2.5 Слои субдискретизации 29
2.6 Предобученные сверточные нейронные сети 30
2.7 Препроцессинг и создание различных наборов данных на основе
спектров комбинационного рассеивания 37
3 ТЕСТИРОВАНИЕ НЕЙРОСЕТЕВЫХ АРХИТЕКТУР 42
3.1 Дифференциация результатов автофлуоресценции 42
3.2 Тестирование сверточных архитектур 45
ЗАКЛЮЧЕНИЕ 54
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 56
ПРИЛОЖЕНИЕ А 58
ПРИЛОЖЕНИЕ Б 60
ПРИЛОЖЕНИЕ В
Заболеваемость раковыми образованиями, в России составляет в общем 330 случаев на сто тысяч населения в год. Лишь по Самарской области показатель уровня заболеваемости злокачественными новообразованиями - составляет около 446,6 новых случая на 100 000 населения и около 18,6% из них именно рак кожи. Смертельный исход происходит в двухстах случаях из трехсот и за последние несколько десятилетий показатели статистики остаются неизменны [7].
Рак кожи - это обобщенное название большого количества разновидностей злокачественных опухолей. Каждая опухоль имеет свои специфические биологические особенности: клиническое проявление, тканевую структуру, метастазирование и т.д. [1].
Существует три основных типа рака кожи: базальноклеточный рак, плоскоклеточный рак и злокачественная меланома. Среди всех раков кожи злокачественная меланома кожи является наиболее опасным видом рака, так как в подавляющем большинстве случаев приводит к гибели пациентов, особенно при обнаружении патологии на поздней стадии. При этом заболеваемость и смертность от меланомы кожи увеличивается в большинстве стран по всему миру [2]. Принимая во внимание низкую (около 50%) диагностическую точность пигментных опухолей на ранней стадии врачами общей практики, требуется создание новых методов контроля опухолей.
Трудности диагностики меланом врачами общей практики связаны со сложностью в интерпретации клинических признаков опухоли и невозможностью отличить меланому от доброкачественных пигментных образований (таких как невус) на ранней стадии развития. Также при подозрении на наличие меланомы медицинский персонал лишён возможности использования инвазивных методов исследования, таких как биопсия с гистологическим или цитологическим исследованием, в связи с повышенным риском прогрессирования поражений. В этой связи оптические методы имеют огромный потенциал для неинвазивного выявления и определения конкретного типа опухолевых образований в тканях кожи с применением инструментальных методов.
Наиболее широко развивающимися в этой области являются методы оптической спектроскопии, они позволяют неинвазивно диагностировать раковые опухоли. Сегодня в арсенале ученых существует несколько способов спектроскопического анализа биологических сред. Это: спектроскопия обратного рассеяния, автофлуоресценция, спектроскопия комбинационного рассеяния (КР), отражательная спектроскопия и другие [14].
При выполнении бакалаврской работы использовались высокоуровневые языки программирования MATLAB 9.4 (R2018a), Python 3.6, предоставляющие широкий инструментарий для решения задач машинного обучения по данным результатов спектроскопии с помощью алгоритмов машинного обучения производилось обучение нейронных сетей различных архитектур.
Проект разрабатывается при поддержке Самарского национального исследовательского университета имени академика С.П. Королева, материалы для исследования предоставлены ГБУЗ Самарским областным клиническим онкологическим диспансером.
Цель выпускной квалификационной работы: исследование точности дифференциации патологий по результатам АФ и КР спектроскопии с помощью нейросетевого алгоритма.
Объект исследования - процесс дифференциации образцов биоткани по результатам спектроскопии комбинационного рассеивания и флуоресценции.
Предмет исследования - искусственные нейронные сети.
Выпускная квалификационная работа состоит из введения, трех глав и заключения.
Во введении описывается актуальность рассматриваемой темы, определяются объект и предмет выпускной квалификационной работы, ставится цель и выявляются задачи.
В первой главе обосновывается актуальность проделанной работы, представляются теоретические сведенья о машинном обучении, в частности нейронные сети.
Во второй главе описываются существующие нейросетевые модели, так же подготавливаются наборы данных для их обучения.
В третьей главе производится обучения разработанных нейросетевых архитектур на основе подготовленных наборов данных.
В заключении подводятся итоги исследования, формируются окончательные выводы по рассматриваемой теме.
В ходе выпускной квалификационной работы была описана актуальность рассматриваемой темы, определены объект и предмет выпускной квалификационной, поставлена цель и выявлены задачи. Так же, было рассмотрено два различных подхода к дифференциации патологи. Первый подход основан на выявлении признаков спектров автофлуоресценции с помощью стохастических методик дифференциации патологий, второй же - это слепой метод дифференциации спектров комбинационного рассеивания.
На начальном этапе было проведено обучения нейронной сети на спектрах автофлуоресценции. Основой для исследования стали стохастические методики дифференциации патологий. При данном подходе входными данными в нейронную сеть был вектор признаков размерность 1х5. Для решения данной задачи подходила нейронная сеть прямого распространения, состоящая из 1 скрытого слоя, представляющая собой классификатор - входными данными в которой являются классифицирующие признаки, вычисленные с использованием стохастических методик.
Но при данном подходе существует вероятность упустить скрытые зависимости, в результате чего было принято решение перейти к архитектуре, объединяющей в себе поиск классифицирующих признаков и их последующую классификацию - сверточные нейронные сети. В качестве входных данных стали рассматриваться спектры комбинационного рассеивания.
Эффективным решением в этой области может стать использование предобученных нейронных сетей: Xception, VGG16, VGG19. В частности, использование их сверточных слоев, совместно с новым классификатором.
Используя методы интерполяции и дублирования спектров было составлено пять наборов данных по которым в дальнейшем обучались сверточные нейронные сети. После обучения сети с лучшими результатами подверглись тонкой настройки. Точность дифференциации патологий: Невус/Базалиома - 83.33, Невус/Меланома - 63, Меланома/Базалиома - 65.31.
Для объединения всех обученных нейронных сетей был составлен алгоритм принятия взвешенного решения, основанный на логическом. Точность работы данного алгоритма составляет 70%, специфичность - 53%, чувствительность - 93,64.
Апробация данной работы была представлена в финале Всероссийского студенческого фестиваля «СТАРТАП», который проводилась в Тольяттинском государственном университете с 4 по 7 октября 2017 года в очной форме.
Опубликована на I Всероссийской научной конференции «Информационные технологии в моделировании и управлении: подходы, методы, решения», которая проводилась в Тольяттинском государственном университете с 12 по 14 декабря 2017 года в заочной форме.
И так же работа была представлена и опубликована на научной конференции «Студенческие дни науки ТГУ», которая проводилась в Тольяттинском государственном университете с 23 по 25 апреля 2018 года в очной форме.
1. Быков В.Л. Цитология и общая гистология: учеб. пособие / В.Л. Быков - СПб.: СОТИС, 2015. - 520 с.
2. Демидов Л.В. Меланома кожи: стадирование, диагностика и лечение: науч. работа / Л.В Демидов - Москва, 2013. - 658-665 с
3. Дьяконов В.П., Круглов В.В. MATLAB 6.5 SP1/7/7 SP1/7 SP2 +Simulink 5/6. Инструменты искусственного интеллекта и биоинформатики./ В.П. Дьяконов, В.В Круглов - Москва: СО-ЛОН-ПРЕСС, 2011. - 456 с.
4. Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6 / В.С. Медведев, В.Г. Потемкин - Москва: ДИАЛОГ-МИФИ, 2013. - 496 с
5. Сержантов К.А. Автофлуоресцентный анализ кожных патологий, с использованием нейросетевого алгоритма: науч. работа /К.А. Сержантов, М.Г. Лисовская, В.П. Захаров, А.А. Морятов, С.В. Козлов / сборник статей «Информационные технологии в моделировании и управлении: подходы, методы, решения», 2017. - 256-263 с.
6. Тучин. В.В. Оптическая биомедицинская диагностика: учеб. пособие / В.В. Тучин - Москва: ФИЗМАТЛИТ, 2015. - 13 с.
7. Тюляндин С.А., Моисеенко В.М. Практическая онкология: учеб. пособие/ С.А. Тюляндин, В.М. Моисеенко - СПб.: Центр ТОММ, 2014. - 23 с.
8. Beazley, D. Python_Cookbook_3rd_Edition_2015 / David Beazley, Brain K. Jones: O'Reilly Media - June 2016. - 706 p.
9. Buduma N. Fundamentals of Deep Learning. Designing Next-Generation Machine Intelligence Algorithms / Nikhil Buduma: O'Reilly Media - June 2017. - 298 p.
10. Chollet, F. Deep Learning with Python / Francois Chollet: - Manning Publications - December 22, 2017. - 386 р.
11. Kuhlman, Dave. A Python Book: Beginning Python, Advanced Python, and Python Exercises. / Kuhlman, Dave: Archived from the original on 23 June 2012. - 673 p
12. Lutz, M. Learning Python, 5th Edition Fifth Edition / Mark Lutz: O'Reilly Media - June 2015. - 1648 p.
13. Shukla N. Manning Early Access Program Machine Learning with TensorFlow/ Nishant Shukla Manning Publications 2017. - 244 p
14. M. Vrakova, I. Bratchenko, V. Zakharov Autofluorescence analysis of skin cancer pathologies in the visible region / Proceedings of Saratov Fall Meeting - SFM’14, International Symposium Optics and Biophotonics-IV September Saratov, 2014. - 22-26 p
Электронные ресурсы
15. Andrei Sozykin [Электронный ресурс]. - Режим доступа: https://www. asozykin. ru/deep_learning
16. Keras Documentation. keras.io. [Электронный ресурс]. - Режим доступа: https://keras. io/applications/
17. Matlab Documentation [Электронный ресурс]. - Режим доступа: https://nl.mathworks .com/help/matlab/
18. Python Documentation [Электронный ресурс]. - Режим доступа: https://www. python. org/doc/
19. Python Software Foundation. Retrieved [Электронный ресурс]. - Режим доступа: https://en.wikipedia. org/wiki/Python_(programming_language)
20. Welcome to Neural Network Toolbox [Электронный ресурс] - Режим доступа: http://matlab.exponenta. com/neuralnetwork/index.php