Разработка моделей диагностики болезней легких с использованием свёрточных нейронных сетей
|
АННОТАЦИЯ 2
ВВЕДЕНИЕ 5
1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ МЕТОДОВ, ТЕХНОЛОГИЙ И
АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ 8
1.1 Методологические основы машинного обучения 8
1.2 Сравнительный анализ подходов к машинному обучению 10
1.3 Постановка задачи 13
1.4 Выводы по главе 1 15
2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, РЕШЕНИЯ ЗАДАЧ
КОМПЬЮТЕРНОГО ЗРЕНИЯ 16
2.1 Анализ методов машинного обучения 16
2.2 Нейронные сети 22
2.3 Обучение сверточной нейронной сети 27
2.4 Функции активации нейросети 38
2.5 Выводы по главе 2 45
3 ИССЛЕДОВАНИЕ МОДЕЛЕЙ ДИАГНОСТИКИ БОЛЕЗНЕЙ ЛЕГКИХ С
ИСПОЛЬЗОВАНИЕМ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ 46
3.1 Исследование эффективности сверточных нейронных сетей на примере
простой нейронной сети с описанием библиотек 46
3.2 Построение моделей методом обучения нейронной сети 53
3.3 Описание базы данных 55
3.4 Усиление локального контраста 56
3.5 Сегментация легких 57
3.5 Построение модели и сравнение моделей 58
3.6 Метрика качества модели 59
3.6 Выводы по главе 3 61
4 КОММЕРЦАЛИЗАЦИЯ ПРОЕКТА 63
4.1 Пути коммерциализации проекта 63
4.2 Участники процесса 65
4.3 Стратегия коммерциализации проекта 66
4.3 Дорожная карта коммерциализации 67
4.4 Выводы по главе 4 70
ЗАКЛЮЧЕНИЕ 71
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 73
ВВЕДЕНИЕ 5
1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ МЕТОДОВ, ТЕХНОЛОГИЙ И
АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ 8
1.1 Методологические основы машинного обучения 8
1.2 Сравнительный анализ подходов к машинному обучению 10
1.3 Постановка задачи 13
1.4 Выводы по главе 1 15
2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, РЕШЕНИЯ ЗАДАЧ
КОМПЬЮТЕРНОГО ЗРЕНИЯ 16
2.1 Анализ методов машинного обучения 16
2.2 Нейронные сети 22
2.3 Обучение сверточной нейронной сети 27
2.4 Функции активации нейросети 38
2.5 Выводы по главе 2 45
3 ИССЛЕДОВАНИЕ МОДЕЛЕЙ ДИАГНОСТИКИ БОЛЕЗНЕЙ ЛЕГКИХ С
ИСПОЛЬЗОВАНИЕМ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ 46
3.1 Исследование эффективности сверточных нейронных сетей на примере
простой нейронной сети с описанием библиотек 46
3.2 Построение моделей методом обучения нейронной сети 53
3.3 Описание базы данных 55
3.4 Усиление локального контраста 56
3.5 Сегментация легких 57
3.5 Построение модели и сравнение моделей 58
3.6 Метрика качества модели 59
3.6 Выводы по главе 3 61
4 КОММЕРЦАЛИЗАЦИЯ ПРОЕКТА 63
4.1 Пути коммерциализации проекта 63
4.2 Участники процесса 65
4.3 Стратегия коммерциализации проекта 66
4.3 Дорожная карта коммерциализации 67
4.4 Выводы по главе 4 70
ЗАКЛЮЧЕНИЕ 71
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 73
Диагностика заболеваний легких в последнее столетие занимает значимую проблему для цивилизационного общества. В развитых странах данная проблема особенно актуальна, так-как в таких странах высоко развита производственная промышленность, в совокупности недостатком очистительных систем, также не маловажную роль играет климат, денежный достаток людей, как известно болезни легких гораздо быстрее развиваются в слабом организме и плохих условиях жизни. В связи с этим возникает потребность постоянно проверять состояние легких населения, для пресечения или лечения заболеваний, прежде чем будет нанесен не поправимый вред здоровью граждан, так-как в большинстве случаев, болезни легких распространяются воздушно капельным путем.
Для того что бы узнать есть ли у человека какое-либо заболевание легких, для начала нужно сделать рентген грудной клетки (рентгенография) в 2 проекциях (стандартная практика).
Рентгенография - технически простой и наиболее доступный для населения метод предварительной диагностики заболевания. Рентгенография очень распространена по всему миру, данный метод позволяет выявить заболевание на ранних стадиях. Несмотря на все преимущества рентгенографии, диагностика и выявление признаков заболевания по флюорографическим снимкам является сложной задачей, для которой требуется участия нескольких высоко квалифицированных специалистов. Сложность задачи заключается, что большинство снимков в плохом качестве, это происходит из-за малого бюджетирования, некоторые больницы не способны обновить рентген аппарат, так-как они очень дорогие, по этому снимки как правило приходят на описание в плохом качестве и с различного рода шумами, таких как засвечена область, посторонние предметы и размытие. Выделение и последующая фильтрация подобного рода структур, с сохранением информации о легочной ткани под ними, является важной задачей для систем автоматизированного проектирования (САПР), используемых для рентгенографического исследования грудной клетки и может значительно повысить точность обнаружения аномалий. Статистические исследования машинного обучения дали большой набор алгоритмических и математических инструменты за последние десятилетия, и породил ряд коммерческих и научных приложений. Тем не менее, некоторые из первоначальных целей этой области исследований остаются недостижимы. Цель исследований в области машинного обучения заключается в создании методов что позволит компьютерному зрению, способным к сложному обучению с минимальным вмешательством человека и предварительными знаниями распознавать сложно отличимые объекты на изображении или видео ряде.
Научная новизна состоит в том, что были рассмотрены и проанализированы методы машинного обучения диагностики болезней легких, проведен сравнительный анализ методов диагностики болезней легких, построены и проанализированы модели сверхточных нейронных сетей.
В качестве объекта исследования выступают методы диагностики болезней легких с использованием свёрточных нейронных сетей.
Предметом является процесс обнаружение аномалий болезней легких.
Практическая значимость работы обусловлена применением результатов исследования на практике, разработанные в диссертации модели распознавания предназначаются для использования в медицинских системах, для повышения качества труда медицинских работников.
В работе проанализированы теоретико-методологические основы диагностики болезней легких. Разработана модель, диагностики болезней легких и анализирующая их эффективность. Проведено исследование моделей диагностики болезней легких и обоснован выбор наиболее эффективной.
Целью исследования является разработка моделей диагностики болезней легких.
Для достижения поставленной цели были выполнены следующие задачи:
- исследованы современные алгоритмы и методы диагностики болезней легких;
- разработана и проанализирована наилучшая модель диагностики болезней легких с использованием свёрточных нейронных сетей;
- проведена оценка точности распознавания в сравнении с другими проанализированными методами.
Для того что бы узнать есть ли у человека какое-либо заболевание легких, для начала нужно сделать рентген грудной клетки (рентгенография) в 2 проекциях (стандартная практика).
Рентгенография - технически простой и наиболее доступный для населения метод предварительной диагностики заболевания. Рентгенография очень распространена по всему миру, данный метод позволяет выявить заболевание на ранних стадиях. Несмотря на все преимущества рентгенографии, диагностика и выявление признаков заболевания по флюорографическим снимкам является сложной задачей, для которой требуется участия нескольких высоко квалифицированных специалистов. Сложность задачи заключается, что большинство снимков в плохом качестве, это происходит из-за малого бюджетирования, некоторые больницы не способны обновить рентген аппарат, так-как они очень дорогие, по этому снимки как правило приходят на описание в плохом качестве и с различного рода шумами, таких как засвечена область, посторонние предметы и размытие. Выделение и последующая фильтрация подобного рода структур, с сохранением информации о легочной ткани под ними, является важной задачей для систем автоматизированного проектирования (САПР), используемых для рентгенографического исследования грудной клетки и может значительно повысить точность обнаружения аномалий. Статистические исследования машинного обучения дали большой набор алгоритмических и математических инструменты за последние десятилетия, и породил ряд коммерческих и научных приложений. Тем не менее, некоторые из первоначальных целей этой области исследований остаются недостижимы. Цель исследований в области машинного обучения заключается в создании методов что позволит компьютерному зрению, способным к сложному обучению с минимальным вмешательством человека и предварительными знаниями распознавать сложно отличимые объекты на изображении или видео ряде.
Научная новизна состоит в том, что были рассмотрены и проанализированы методы машинного обучения диагностики болезней легких, проведен сравнительный анализ методов диагностики болезней легких, построены и проанализированы модели сверхточных нейронных сетей.
В качестве объекта исследования выступают методы диагностики болезней легких с использованием свёрточных нейронных сетей.
Предметом является процесс обнаружение аномалий болезней легких.
Практическая значимость работы обусловлена применением результатов исследования на практике, разработанные в диссертации модели распознавания предназначаются для использования в медицинских системах, для повышения качества труда медицинских работников.
В работе проанализированы теоретико-методологические основы диагностики болезней легких. Разработана модель, диагностики болезней легких и анализирующая их эффективность. Проведено исследование моделей диагностики болезней легких и обоснован выбор наиболее эффективной.
Целью исследования является разработка моделей диагностики болезней легких.
Для достижения поставленной цели были выполнены следующие задачи:
- исследованы современные алгоритмы и методы диагностики болезней легких;
- разработана и проанализирована наилучшая модель диагностики болезней легких с использованием свёрточных нейронных сетей;
- проведена оценка точности распознавания в сравнении с другими проанализированными методами.
Работа направлена на исследование машинного обучения путем разработки моделей диагностики болезней легких с использованием свёрточных нейронных сетей. Так же стоит отметить, что в работе выявлены тенденции, приоритеты и направления в соответствии с методами машинного обучения, а также построены модели. В работе рассмотрены точки зрения различных авторов относительно понятия машинного обучения, компьютерного зрения и сверточных нейронных сетей.
В рамках работы были достигнуты результаты:
1) произведен обзор существующих методов глубокого обучения и алгоритмов предварительной обработки рентгеновских снимков;
2) выбран и подготовлен подходящий набор данных для обучения;
3) для каждого этапа обучения был подобран соответствующий алгоритм, выбрана наиболее подходящая архитектура нейронной сети;
4) проведены эксперименты посредством обучения нейросетей на данных с предобработкой и без неё;
5) представлен сравнительный анализ работы алгоритмов.
По результатам данной работы сделаны выводы. Использование различных методов предварительной обработки рентгеновских снимков легких позволяет повысить итоговое качество распознавания аномалий в грудной клетке. Этап предобработки является одним из значимых при автоматизированном анализе рентгеновских снимков. Наиболее эффективным оказался метод предобработки снимков и сегментации. После его применения точность классификации возросла почти на 35% и составила 73%. При этом использование данного метода также показало лучшее значение FT-меры (0.73). Так-же стоит отметить достигнутое в результате применения данного метода значение метрики Recall, а именно 0.69. Полученное значение, хоть и является лучшим в данной работе, но, тем не менее, 69 этого мало для практического использования данного метода, когда значение Recall должно быть близким к 0.99.
Тем не менее, это только первый шаг в проделанной работе, и для получения более конкретных результатов, несомненно, нужны дополнительные исследования, представляется возможным повысить точность в дальнейшем за счет рассмотрения более сложных архитектур сверточных нейросетей для классификации рентгеновских снимков.
В рамках работы были достигнуты результаты:
1) произведен обзор существующих методов глубокого обучения и алгоритмов предварительной обработки рентгеновских снимков;
2) выбран и подготовлен подходящий набор данных для обучения;
3) для каждого этапа обучения был подобран соответствующий алгоритм, выбрана наиболее подходящая архитектура нейронной сети;
4) проведены эксперименты посредством обучения нейросетей на данных с предобработкой и без неё;
5) представлен сравнительный анализ работы алгоритмов.
По результатам данной работы сделаны выводы. Использование различных методов предварительной обработки рентгеновских снимков легких позволяет повысить итоговое качество распознавания аномалий в грудной клетке. Этап предобработки является одним из значимых при автоматизированном анализе рентгеновских снимков. Наиболее эффективным оказался метод предобработки снимков и сегментации. После его применения точность классификации возросла почти на 35% и составила 73%. При этом использование данного метода также показало лучшее значение FT-меры (0.73). Так-же стоит отметить достигнутое в результате применения данного метода значение метрики Recall, а именно 0.69. Полученное значение, хоть и является лучшим в данной работе, но, тем не менее, 69 этого мало для практического использования данного метода, когда значение Recall должно быть близким к 0.99.
Тем не менее, это только первый шаг в проделанной работе, и для получения более конкретных результатов, несомненно, нужны дополнительные исследования, представляется возможным повысить точность в дальнейшем за счет рассмотрения более сложных архитектур сверточных нейросетей для классификации рентгеновских снимков.





