Тема: Интеллектуальная подсистема сбора и анализа медицинских данных на платформе Loginom
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ИНФОРМАЦИИ DATA MINING 10
1.1 Теоретические основы анализа данных Data Mining 10
1.2 Стандарты Data Mining 14
1.3 Методы Data Mining 17
1.4 Выбор метода анализа данных 22
2 НЕЙРОСЕТИ И ВЫБОР АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ 27
2.1 Принцип работы и основные свойства нейронных сетей 27
2.2 Принцип построения и архитектура нейронных сетей 31
2.3 Обучение нейронной сети 35
2.4 Выбор аналитической платформы 42
ЗАКЛЮЧЕНИЕ 88
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 94
ТЕРМИНЫ И СОКРАЩЕНИЯ 98
📖 Введение
На текущий момент, ключевой платформой для работы и отчетности врачей является система МИС «БАРС». Пакет «аналитика», представленный в программе, формирует только статистическую отчетность, а изучение и анализ медицинских данных, не производится. Большой объем и разнообразность хранимых данных делают актуальным применение аналитических платформ и интеллектуальных методов анализа. Их ключевая особенность в регулярном самообучении на основе обучающего тестового множества, перенимающего практический опыт врачей, нацелена на сведение к минимуму неточностей и просчетов в направлении лечения каждого пациента индивидуально.
Так, например, современные методики работы с нейронными сетями создают большой задел на появление уникальных по качеству методик лечения в медицине. Среди основных направлений использования методов интеллектуального анализа в медицине можно выделить: эффективность применения лекарственных средств и процедур, а также методологий лечения, выявление или постановка точного диагноза на ранних этапах, получение новых нетривиальных зависимостей в показателях здоровья пациентов.
В этом заключается актуальность данной работы.
Целью работы является разработка и применение интеллектуальной подсистемы сбора для анализа медицинских данных на платформе Loginom на объекте исследования.
В соответствии с целью поставлено ряд задач:
Во-первых, рассмотреть методы интеллектуального анализа информации Data Mining, а также теоретические основы, стандарты Data Mining и выбрать метод анализа данных;
Во-вторых, описать принципы работы, основные свойства, архитектуру и обучение нейросетей; обосновать выбор аналитической платформы Loginom, рассмотрев, при этом, зарубежные и отечественные аналоги;
В-третьих, представить разработку интеллектуальной подсистемы сбора и анализа информации на платформе Loginom, а именно:
• показать развертывание аналитической платформы и экспорт данных из внешних источников;
• выполнить подготовку данных, обучение модели и интерпретацию результатов при прогнозировании состояния здоровья сердца по лабораторно-диагностическим показаниям;
• определить эффективность лечения пациентов при выполнении подготовки данных, обучение модели и интерпретацию результатов.
Объектом исследования проектной работы является ГАУЗ «Челябинский центр онкологии и ядерной медицины». В заключении сформулированы основные результаты дипломной работы.
Предмет исследования: применение интеллектуальной подсистемы сбора и анализа медицинских данных на платформе Loginom.
Практическая значимость состоит в возможности использования в ГАУЗ «ЧОКЦОиЯМ» интеллектуальной подсистемы сбора и анализа медицинских данных на платформе Loginom.
Методы исследования: использовались эмпирические (наблюдение, эксперимент) и аналитические методы (анализ научной литературы, количественный математико-статистический и качественный анализ данных), методы систематизации и обобщение материалов исследования.
Структура и объем работы
В выпускную квалификационную работу входят: введение, три главы, три вывода по написанным главам, итоговое заключение.
Во введении обоснована актуальность работы, сформулированы цели и задачи, показана практическая значимость.
В первой главе представлены теоретические основы, стандарты и методы анализа данных Data Mining.
Во второй главе раскрыты инструменты интеллектуального подхода на основе машинного обучения – нейронные сети. Произведен выбор аналитической платформы для дальнейшего применения.
В третьей главе представлена практическая реализация проекта. Произведено развертывание аналитической платформы и экспорт данных из медицинских информационных систем. Выполнена предобработка и очистка информации, настроены модели нейросети. Реализуется обучение моделей до достижения высокой точности прогнозирования или классификации. Произведена интерпретация результатов. Также произведено внедрение аналитической платформы на доменном пространстве ГАУЗ «ЧОКЦОиЯМ».
В заключении сформулированы основные результаты дипломной работы.
✅ Заключение
При разработке интеллектуальной подсистемы сбора и анализа информации на платформе Loginom проведено развертывание аналитической платформы, экспорт и формирование набора данных, реализована модель нейросети (регрессия) и модель нейросети (классификация).
При этом в процессе работы установлено:
1. Среди основных направлений использования методов Data Mining в медицине: можно выделить: эффективность применения лекарственных средств и процедур, а также методологий лечения, выявление или постановка точного диагноза на ранних этапах, получение новых нетривиальных зависимостей в показателях здоровья пациентов. Недостатки применения подобных методов сводятся в основном к области прикладной реализации.
2. Стандарты, описывающие методологию анализа данных Data Mining, рассматривают организацию процесса Data Mining и разработку Data Mining- систем.
При разработке интеллектуальной подсистемы был использован Стандарт CRISP-DM (The Cross Industrie Standard Process for Data Mining – Стандартный Преимущества стандарта заключается в том, что
а) Модель процесса CRISP-DM универсальна и подходит для ведения любых проектов по бизнес-аналитике.
б) Нет привязки к конкретным программным продуктам и инструментам.
в) Методология близка к технологии извлечения знаний из баз данных KDD (KnowledgeDiscoveryinDataBases) – межотраслевой процесс Data Mining).
3. Интеллектуальное (кибернетическое) направление Data Mining соединяет в себе множество подходов, объединенных идеей компьютерной математики и использования теории искусственного интеллекта такие как нейросети. Применение нейросетей особенно эффективны для решения задач прогнозирования, классификации и обобщения данных с поиском закономерностей.
Например, нейронные сети, широко используются для поиска патологических новообразований на изображениях различных органов пациентов. Очень большое значение для лечения рака имеет ранняя диагностика и мониторинг состояния пациента.
Поэтому для решения поставленных задач актуальным является метод, основанный на машинном обучении – искусственные нейронные сети.
4. Выбор аналитической платформы Loginom был обоснован тем, что отсутствует требования к знанию языков программирования. Система не требует особенных навыков от пользователя, достаточно загрузить данные и сразу получить доступ к инструментам анализа данных. Также положительным свойством системы является встроенная возможность импорта и экспорта разноформатных данных. Данная установка платформы возможна на любой рабочей станции с минимальными требованиями к техническим характеристикам. Loginom утилизирует аппаратные ресурсы, способна работать на серверах минимальной конфигурации. Систему можно развернуть как в частном, так и в публичном облаке. Также актуальным в настоящее время является то, что данный продукт отечественного производства.
5. Результатом работы являются две обученные модели нейросети. При проведении развертывания аналитической платформы, реализована модель нейросети (регрессия) и модель нейросети (классификация).
Первая модель способна прогнозировать наличие заболевание сердца у пациента.
Вторая модель классифицирует результат лечения пациента в зависимости от выбранной программы лечения, исходя из диагноза и степени заболевания.
Обе модели имеют достаточно высокую точность своих заключений. Наглядно представлена эффективность практического применения методов нейросетей в медицине – проведены эксперименты по обработке новых данных, не используемых в обучении и тестовом множестве. Указанные способы обеспечивают как скорость принятие решений, так и их точность для каждого пациента индивидуально.
Данные весовых коэффициентов позволяют выявить ключевые показатели анамнеза и врачебного заключения. Примером является первая модель, где установилось, что наибольшее значение имеют следующие показатели: процент времени с аномальной долгосрочной изменчивостью, процент времени с аномальной краткосрочной изменчивостью, ускорений в секунду. Также взаимосвязь процесса лечения и его результата позволяет определить наиболее эффективные методики борьбы с болезнью.
На примере второй модели нейросети определены наиболее эффективные препараты для общей выборки диагнозов: 5-FU(Фторурацил), Блеомицин и Атезолизумаб. Исследуя более узкую выборку, установлено, что для диагноза с кодом С184 наиболее эффективным является лечение препаратами 5- FU(Фторурацил) и Декарбазин – данные лекарства имеют высокие показатели по полю «без изменений» и «улучшение».
В качестве источников данных для анализа использованы три системы:
МИС «БАРС» – медицинская информационная система;
RadiantDICOMViewer – медицинская система просмотра изображений;
ГРР (Госпитальный раковый регистр) – система автоматизированного учета лиц с установленным диагнозом злокачественного новообразования, поступивших в стационар Городского онкологического диспансера.
Формирование набора данных произведено путем экспорта в формате Excel.
В 2010 г. все медицинские учреждения Челябинской области начали подключать к единой медицинской информационной системе (МИС) БАРС. Системы работают с массивами данных пациентов: медицинскими карточками, результатами МРТ, КТ, УЗИ, ЭКГ, заключениями лабораторно-диагностических исследований, но формирует только статистическую отчетность, а изучение и анализ медицинских данных не производится.
Поэтому большой объем и разнообразность хранимых данных делают актуальным применение аналитических платформ и интеллектуальных методов анализа.
При получении положительных отзывов лечащих врачей о эффективности применения нейросети в отделениях, целесообразно сформировать запрос об интеграции модуля в Министерство здравоохранения Челябинской области.
Предполагается внедрение или объединение данной платформы с МИС БАРС. Для данной задачи требуется сформировать единое хранилище данных, объединяющее в себе базы данных всех модулей МИС БАРС.
На текущий момент данные по пациенту хранятся на раздельных базах данных. Персональные данные, сведения о лечении, результаты лабораторно-диагностических исследований не связаны между собой. В таком варианте сбор и аналитика данных требуют больших временных затрат. Единое хранилище данных позволит формировать по каждому пациенту полный сводный отчет. Преимуществом является тот факт, что аналитическая платформа Loginom имеет инструмент импорта данных по средству SQL-запросов, что существенно упростит взаимодействие систем. Для крупных компаний и сложных проектов компанией Loginom предоставляется серверная редакция аналитической платформы, которая включает в себя следующие инструменты и возможности:
• Файловые источники, БД, 1С,
• SOAP и REST-сервисы
• Очистка, ML и Data Mining
• Визуализация
• Доступ через браузер
• Совместная работа
• Пакетное выполнение
• Публикация собственных
• Веб-сервисов
• Без ограничений на количество пользователей
• Без ограничений на ядра и ОЗУ
• Расширенная техническая поддержка
• Доступ к курсам:
• Базовые курсы
• Мини-курсы и уроки
• Один бизнес-цикл на выбор:
• Клиентская аналитика
• Кредитный скоринг
Стоимость проектного решения формируется на основе коммерческого предложения исходя из поставленных задач и объема работ.
Таким образом, установлено, что актуальной задачей на сегодняшний момент является создание единой информационной системы по сбору и интеллектуальному анализу медицинских данных. Объединив все потоки информации в единой аналитической системе, можно выявить ранее неочевидные взаимосвязи и прогнозы.
Рассмотрев методы и примеры, можно сделать вывод в необходимости внедрения и использования методов интеллектуального анализа медицинских данных. Подобные инструменты преобладают над статистической обработкой, принося новый уровень качества оказываемых услуг, своевременность выявления патологий, выявлению неявных зависимостей первичных данных и результатов, генерации новых знаний и методов в различных областях медицинских исследований. Тенденция к интеграции методов Data Mining – новый виток в развитии превентивных и качественных мер в здравоохранении.
В заключении можно отметить, что Указом Президента России №490 от 10.10.2019 была утверждена Национальная стратегия развития искусственного интеллекта (ИИ) в Российской Федерации на период до 2030 г., направленная на то, чтобы Россия стала одной из стран лидеров в области ИИ. Одним из ключевых направлений стратегии является развитие рынка программных продуктов на основе ИИ для здравоохранения нашей страны.



