Тема: АУГМЕНТАЦИЯ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ ГЕНЕРАТИВНО-СОСТЯЗАТЕЛЬНЫХ НЕЙРОННЫХ СЕТЕЙ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Обзор методов аугментации медицинских изображений 6
1.1 Проблема ограниченности и несбалансированности данных в медицинской
визуализации 6
1.2 Традиционные методы аугментации изображений 9
1.3 Глубокое обучение в анализе медицинских изображений 20
1.4 Генеративные модели для синтеза медицинских данных 24
1.5 Применение GAN для генерации медицинских изображений 35
2 Архитектура и математические основы генеративно-состязательных нейросетей 48
2.1 Математическая модель и функция потерь GAN 48
2.2 Архитектура генеративных состязательных сетей: GAN и DCGAN 56
2.3 Условные генеративные сети: cGAN, ACGAN, InfoGAN 63
3. Экспериментальная часть 69
3.1 Описание используемого набора данных и предварительная обработка данных 69
3.2 Архитектура построенных моделей GAN и cGAN 71
3.3 Методика оценки качества синтетических изображений 73
3.4 Результаты экспериментов и их сравнительный анализ 75
ЗАКЛЮЧЕНИЕ 83
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 85
📖 Введение
Недостаточный объём данных негативно влияет на обучение глубоких нейронных сетей, вызывая переобучение и снижая обобщающую способность моделей. Более того, частое наличие дисбаланса между классами (например, значительно меньшее количество изображений с патологией по сравнению с нормой) дополнительно затрудняет обучение и приводит к смещённым результатам классификации. Таким образом, возникает необходимость в эффективных методах расширения обучающих выборок, способных повысить вариативность и репрезентативность медицинских данных.
Традиционные методы аугментации изображений включают в себя такие трансформации, как повороты, масштабирование, сдвиги, отражения, добавление шума и фильтрация. Несмотря на свою простоту и широкую применимость, эти подходы ограничены тем, что они лишь модифицируют уже существующие изображения, не создавая принципиально новых структур и вариаций. Это особенно критично в случае медицинских изображений, где важны анатомическая достоверность и сохранение паттернов заболеваний.
С развитием генеративных моделей, в частности генеративно-состязательных нейросетей (Generative Adversarial Networks, GAN) [1], появилась возможность синтезировать реалистичные изображения, приближённые по статистике и визуальным признакам к реальным данным. GAN-сети состоят из двух нейросетей - генератора и дискриминатора - которые обучаются в состязательном режиме: генератор учится создавать «фальшивые» изображения, а дискриминатор — отличать их от настоящих. В ходе такого обучения генератор совершенствуется до уровня, когда синтезируемые изображения становятся трудноотличимыми от подлинных. Это делает GAN мощным инструментом для создания новых образцов медицинских изображений с сохранением важных диагностических признаков.
Особый интерес в задачах аугментации представляют условные GAN (Conditional GAN, cGAN) [1], в которых генерация изображений осуществляется с учётом заданного класса или другого условия. Это позволяет более точно контролировать процесс генерации и направлять его на синтез изображений определённых патологий или анатомических структур.
Данная магистерская диссертация посвящена исследованию методов аугментации медицинских изображений с использованием генеративно-состязательных нейросетей, в частности, GAN и cGAN. Основное внимание уделяется решению задачи автоматической классификации пневмонии по рентгеновским снимкам органов грудной клетки.
В теоретической части работы проводится обзор существующих подходов к аугментации изображений, рассматриваются архитектуры генеративных моделей, принципы их работы, особенности обучения и возможные проблемы. Особое внимание уделено анализу применимости GAN к медицинским данным и описанию их преимуществ и ограничений в данной области.
В экспериментальной части исследования реализована генерация синтетических изображений грудной клетки с использованием базовой архитектуры GAN и условной GAN (cGAN) на основе открытого набора данных Chest X-Ray Images (Pneumonia) (платформа Kaggle). Далее на основе полученных синтетических данных и реальных изображений были обучены нейросетевые модели-классификаторы пневмонии. Производилось сравнение результатов классификации в двух вариантах: на чисто реальных данных и на смешанных (реальные + синтетические изображения), с использованием общепринятых метрик качества — Accuracy, Precision, Recall, F1-score.
Результаты эксперимента показали, что добавление синтетических изображений, полученных с помощью генеративных моделей, позволяет улучшить точность классификации и обобщающую способность модели. Это подтверждает эффективность и практическую значимость применения GAN для аугментации медицинских изображений.
Целью данной работы является исследование и экспериментальное подтверждение эффективности использования генеративно-состязательных нейросетей для аугментации медицинских изображений в задаче автоматической диагностики на примере рентгеновских снимков лёгких.
Для достижения поставленной цели в работе решаются следующие задачи:
1. проведение анализа существующих методов аугментации и генеративного синтеза изображений;
2. описание и реализация архитектур GAN и cGAN применительно к медицинским данным;
3. обучение моделей генераторов на рентгеновских снимках лёгких и получение синтетических изображений;
4. обучение и тестирование классификаторов на реальных и дополненных выборках;
5. проведение оценки эффективности предложенного подхода с использованием метрик качества;
6. формулировка выводов о применимости и перспективах использования GAN в задачах медицинской визуализации.
✅ Заключение
Для достижения данной цели последовательно были решены следующие задачи:
1. Проведение анализа существующих методов аугментации и генеративного синтеза изображений
Анализ подтвердил перспективность подходов генеративно-состязательных моделей (GAN и cGAN), которые успешно используются для увеличения обучающих наборов данных и улучшения результатов моделей машинного обучения в области медицинской визуализации.
2. Описание и реализация архитектур GAN и cGAN применительно к медицинским данным
Были реализованы две модели: классическая GAN и её условная модификация CGAN. Для реализации обеих архитектур были выбраны современные подходы, обеспечивающие стабильность обучения и высокое качество синтезируемых данных.
3. Обучение моделей генераторов на рентгеновских снимках лёгких и получение синтетических изображений
Модели обучались на наборах изображений, относящихся к двум диагностическим классам: NORMAL и PNEUMONIA. Генерация синтетических образцов проводилась на различных этапах обучения с дальнейшей оценкой качества сгенерированных изображений.
4. Обучение и тестирование классификаторов на реальных и дополненных выборках
На реальных и синтетических наборах данных были обучены классификаторы, позволяющие определить диагностический класс. Тестирование классификаторов выявило значительные различия в эффективности в зависимости от типа использованной генеративной модели для создания синтетических данных.
5. Проведение оценки эффективности предложенного подхода с использованием метрик качества
Для оценки результатов был использован набор классификационных метрик (точность, полнота, Fl-мера). Модель cGAN значительно опередила GAN, достигнув точности классификации 96% против 75% у GAN, что подтверждает высокое качество генерируемых данных.
Подробный анализ матриц ошибок дополнительно подчеркнул преимущества CGAN:
• Для CGAN из 568 изображений класса NORMAL 483 были правильно классифицированы, лишь 85 ошибочно отнесены к классу PNEUMONIA; из 1076 изображений класса PNEUMONIA 1036 корректно классифицированы и только 40 пропущены. Это свидетельствует о высоком уровне безопасности модели.
• Напротив, GAN показала значительное количество ошибок второго рода (288 из 1076 изображений PNEUMONIA были ошибочно классифицированы как NORMAL), что критически опасно для медицинских задач и может привести к неправильной диагностике и задержке необходимого лечения.
6. Формулировка выводов о применимости и перспективах использования GAN в задачах медицинской визуализации
Полученные результаты однозначно демонстрируют преимущество условных генеративно-состязательных сетей (CGAN) над классическими GAN в задачах медицинской визуализации. cGANпозволяют генерировать синтетические изображения высокого качества, улучшающие точность и надёжность медицинских классификаторов.
Таким образом, предложенный подход с использованием cGAN является перспективным для решения задач, связанных с дефицитом обучающих данных в медицинской области, позволяя существенно снизить количество ошибок при диагностике и повысить общее качество оказания медицинских услуг.



