Медицинские рентгеновские снимки являются одним из первых и основных вариантов диагностики различных заболеваний. Рентгенограммы, благодаря наличию широкого спектра информации, анализ которого позволяет не только выявить на ранних стадиях и поставить точный диагноз заболевания, но и отслеживать динамику процесса лечения, получили широкое распространение в медицинской практике. В то же время, автоматизированное обнаружение аномалий на снимках, позволяющее снизить нагрузку на специалистов - рентгенологов, повысить эффективность обработки данных и как следствие, повысить точность диагноза остается приоритетным направлением развития информационных технологий.
По оценке специалистов, врач-рентгенолог за день может качественно обработать не более 200 рентгенограмм. В густонаселенных районах врач- рентгенолог вынужден изучать гораздо большее число снимков, что неизбежно влечет за собою снижение качества обработки информации, содержащейся в рентгенограмме. Практика показывает, что сложность в работу специалиста вносит не только все увеличивающееся количество снимков, но и их качество, зависящее от ряда параметров: содержание посторонней информации (наличие кардиостимуляторов, операционных швов, проводов и т.п.), оптические шумы (засветка, затемнение), анатомические особенности тела пациента.
Перспективным решением по ставленной задачи автоматизированного обнаружения аномалий на рентгеновских снимках являются применение сверточных нейронных сетей, которые занимают лидирующие позиции, среди программных средств, применяемых для обработки и анализа изображений. Для решения задачи классификации фронтальных рентгеновских снимков по поиску туберкулеза Alvin Rajkomar, Sneha Lingam и др. использовали сверхточную нейтронную сеть GoogLeNet, предварительно обученную на наборе данных ImageNet [1]. Это служит доказательством эффективного использования концепции глубокого машинного обучения на рентгенограммах грудной клетки. Кроме того, сверточная нейросеть показала высокие результаты при поиске рака на рентгенограммах грудной клетки [2]. Классификация снимков на нормальные (здоровые) и с аномалиями существенно бы помогла работе специалистов на первичном этапе диагностики.
В данной работе производен анализ архитектур сверточных нейронных сетей, описанных в статье авторов Darvin Yi, Archana Shenoyas и др. [3], в рамках задачи классификации рентгеновских снимков грудной клетки с добавлением метода обработки снимков, а именно - сегментации легких. Полученные результаты в данной работе говорят о том, что увеличение глубины сетей улучшает результаты их работы лишь на малое количество значений, что говорит о том, что уход в глубину не сильно существенен для решения данной задачи. Так, например GoogLeNet дает следующие значения F1-меры - 0.78, precision - 0.85. Более глубокие нейронные сети обладают следующими значениями F1-меры - 0.80, precision - 0.85 и 0.89. Несмотря на близкие значения данных метрик у всех архитектур, GoogLeNet также дает самые низкие показатели по метрикам recall и accuracy, что может говорить о том, что использование сетей с большим количеством слоев предпочтительнее для распознания аномалий на рентгенограммах грудной клетки.
В рамках данной выпускной квалификационной работы достигнуты следующие результаты:
• Сделан обзор предметной области.
• Подготовлен набор данных для обучения.
• Произведена предварительная обработка рентгеновских снимков.
• Построены и обучены нейронные сети, выбранных архитектур.
• Представлен сравнительный анализ результатов работы нейронных сетей различных архитектур.
По результатам данной работы сделаны следующие выводы:
1. Архитектура нейронной сети GoogLeNet, хоть и показывает неплохие результаты по различным метрикам, немного уступает в качестве двум более глубоким архитектурам: Inception-V3 и ResNet.
2. Архитектуры нейронных сетей Inception-V3 и ResNet показывают очень близкие результаты. Их П-мера совпадает на тестовой выборке. ResNet обладает более высоким значением метрики recall = 0.78. Но для практического применения значения recall должно быть около 0.99 и выше. Поэтому более предпочтительной архитектурой нейронной сети для решения задачи распознания аномалий на рентгенограммах грудной клетки является нейронная сеть Inception-V3 с самым высоким показателем precision = 0.89. Увеличение значения в данной метрике выбрано, так как оно минимизирует количество снимков с аномалиями, распознанных системой как здоровые и позволяет сократить нагрузку на специалиста - рентгенолога.