ВВЕДЕНИЕ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Описание заболевания 8
1.2. Обзор научной литературы 9
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 11
2.1. Обзор методов машинного обучения 11
2.1.1 Ансамблевые методы 11
2.1.2 Обучение с учителем 13
2.1.3. Обучение с учителем 19
2.2. Анализ исходных данных 20
2.3. Постановка задачи машинного обучения 24
3. ПРОЕКТИРОВАНИЕ 26
3.1. Требования к платформе 26
3.2. Архитектура 26
3.2.1. API controller 28
3.2.2. Worker (ML processor) 29
3.2.3. Message broker 30
3.2.4. Database 31
3.2.5. Shared file storage 32
3.3. Диаграммы вариантов использование 32
3.4. Диаграммы последовательности 33
3.4.1. Загрузка файла 33
3.4.2. Обработка операции 34
3.4.3. Получение результатов 36
3.4. Протокол 36
4. РЕАЛИЗАЦИЯ 39
4.1. Сравнение методов машинного обучения 40
4.2. API controller 42
4.3. Worker 42
4.4. Облачные функции 42
4.5. MongoDB 44
4.6. Очередь сообщений 45
4.7. Хранилище файлов 46
5. ТЕСТИРОВАНИЕ 47
5.1. Модульное тестирование 47
5.2. Функциональное тестирование 47
ЗАКЛЮЧЕНИЕ 49
ЛИТЕРАТУРА 50
Актуальность
Для того чтобы предсказать появления обострений того или иного заболевания, иногда недостаточно визуального осмотра. Лучше всего об этом скажет анализ крови пациента. Это относится и к заболеванию псориаз. Существует достаточно много исследований, в которых исследуется кожный покров пациента с использованием методов машинного обучения, для постановки диагноза [5,23,24,30]. Однако, предсказать обострение заболевания этими методами невозможно. Для этого необходимо исследовать кровь пациента.
В статье [18] с помощью алгоритма случайного леса были выявлены 10 основных показателей, влияющих на обострение болезни псориаз, например, индекс массы тела и липопротеины высокой плотности, а также другие. В обучающий набор данных попало 263 пациента, которых наблюдали на протяжении длительного времени. Обучающий набор данных исследователями не был предоставлен в свободный доступ.
Несмотря на большое количество данных клинических испытаний эффективности препаратов для лечения болезни псориаз, выбор препарата для пациента по-прежнему основан на пробах и ошибках. Часто для того, чтобы клинический ответ был значимым, требуется 12-16 недель, а эффективность препарата может составлять от 30 до 80% успеха [8]. Это создает «пробел в оценке» между реакцией пациента на лечение. Алгоритмы машинного обучения могут устранить этот пробел в оценке, прогнозируя долгосрочные результаты применения препаратов у пациентов с псориазом. В нескольких исследованиях были созданы модели прогнозирования для определения долгосрочной реакции на лечение препаратами [9,25,26].
Данная работа является частью, составляющей приложения для помощи больным псориазам.
Постановка задачи
Ключевой целью выполнения данной работы является разработка сервиса рекомендаций на основе анализа пациентов с псориазом с помощью методов машинного обучения. Для достижения данной цели необходимо решить следующие задачи:
1) провести анализ предметной области;
2) спроектировать сервис рекомендаций;
3) реализовать сервис рекомендаций;
4) провести тестирование сервиса рекомендаций.
Структура и содержание работы
Работа состоит из введения, пяти глав, заключения и списка литературы. Объем работы составляет 53 страницы, объем списка литературы - 36 источников.
В первой главе, «Анализ предметной области», изложено описание заболевания и произведен обзор научной литературы.
Во второй главе, «Теоретическая часть», произведен обзор методов машинного обучения, представлен анализ данных и поставлена задача машинного обучения.
Во третьей главе, «Проектирование», приведено описание архитектуры сервиса и его компонент.
В четвертом разделе, «Реализация», представлен перечень используемых средств и технологий разработки, а также приводится техническая реализация модулей предобработки данных, аналитической обработки и интерфейса системы.
В пятом разделе, «Тестирование», приведены результаты тестирования, подтверждающие корректность работы сервиса рекомендаций.
В заключении приводятся основные результаты выполненной работы.
Целью данной работы являлась разработка сервиса рекомендаций на основе анализа пациентов с псориазом с помощью методов машинного обучения.
В ходе выполнения выпускной квалификационной работы магистра были решены следующие задачи.
1. Выполнен анализ предметной области.
2. Выполнено проектирование сервиса рекомендаций.
3. Выполнена реализация сервиса рекомендаций.
4. Выполнено тестирование сервиса рекомендаций.
В результате выполнения выпускной квалификационной работы были решены все поставленные задачи, таким образом, цель данной работы достигнута.