Тема: Программные пакеты и статистические методы в постановке медицинского диагноза
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. СОВРЕМЕННЫЕ ПРОГРАММНЫЕ ПАКЕТЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ
РЕШЕНИЯ ЗАДАЧ В МЕДИЦИНЫ 7
1.1. MSEXCEL 7
1.2. STATISTICA 9
1.3. SPSS STATISTICS 10
1.4. SAS VISUAL ANALYTICS 12
1 .5. STATA 13
1 .6. RAPIDMINER 14
1.7. ВЫВОД К ПЕРВОЙ ГЛАВЕ 16
2. ТЕХНОЛОГИЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСКИ С ИСПОЛЬЗОВАНИЕМ
RAPIDMINER 17
2.1. ЗАДАЧА КЛАССИФИКАЦИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА 17
2.2. КЛАСТЕРНЫЙ АНАЛИЗ 21
2.3. ПОСТРОЕНИЕ ДЕРЕВА РЕШЕНИЙ 24
2.4. ВЫВОД К ВТОРОЙ ГЛАВЕ 28
3. ЧИСЛЕННЫЙ ЭКСПЕРИМЕНТ С ИСПОЛЬЗОВАНИЕМ
ПРОГРАММНОГО ПАКЕТА RAPIDMINER 30
3.1. ИСХОДНЫЕ ДАННЫЕ И ИХ ЗАГРУЗКА 30
3.2. ТЕХНОЛОГИЯ РЕШЕНИЯ ЗАДАЧИ КЛАСТЕРНОГО АНАЛИЗА 32
a) K-medoids 32
b) K-means 37
c) X-means 41
d) Сравнение алгоритмов 45
3.3. ТЕХНОЛОГИЯ ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ 46
3.4. ВЫВОД К ТРЕТЬЕЙ ГЛАВЕ 53
ЗАКЛЮЧЕНИЕ 55
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 58
ПРИЛОЖЕНИЕ A 62
📖 Введение
Потребность в системе анализа совпала с появлением интеллектуального анализа данных - процесса обнаружения знаний, который представлял собой смесь машинного обучения, экспертных систем, статистики и т. д. Такая система показала лучшее понимание процесса и предсказания будущего. Основной целью интеллектуального анализа данных является извлечение скрытых знаний из очень больших наборов данных, которые невозможно наблюдать с помощью простого статистического анализа.
Интеллектуальный анализ данных, также называемый обнаружением знаний в базах данных, в области 4
компьютерных наук, представляет собой процесс обнаружения интересных и полезных моделей и взаимосвязей в больших объемах данных, а также предоставляет лучше понять зависимость между атрибутами выборки в большом наборе данных и интерпретировать процессы подсистемы, создавать законы и предсказания поведения соответствующей подсистемы. Эта область объединяет инструменты из статистики и искусственного интеллекта (такие как нейронные сети и машинное обучение) с управлением баз данных для анализа больших цифровых коллекций, известных как наборы данных. Процесс извлекает информацию высокого качества, которую можно использовать для выработки выводов на основе отношений или структуры данных.
Интеллектуальный анализ данных является результатом использования реализованных алгоритмов в программном обеспечении для удовлетворения потребностей медицинской науки в каждом разделе с построением аналитических моделей, категоризации, информационного прогноза (прогнозирования) и представления.
В настоящее время все интенсивнее развиваются статистические методы и программные пакеты в биологии и экологии [10], географии [12, 15], психологии [8], социологии [3], бизнесе (страхование, банковское дело, розничная торговля), государственной безопасности (обнаружение преступников и террористов) и т.д.
На актуальность темы указывают такие факторы, как сокращение времени, необходимого для постановки диагноза, который позволяет медицинским работникам лучше расставить приоритеты в случае пациента. Интеллектуальный анализ данных и глубокое обучение могут анализировать гораздо больше факторов и случаев, чем работник. Чтобы быть более точным, мы можем использовать его для исследования генома, разработки лекарств, медицинской визуализации. Устройства на основе интеллектуального анализа данных могут изучать, анализировать большие объемы информации и принимать решения гораздо быстрее, чем люди.
Важной целью исследований в области диагностической медицины является оценка и сравнение точности диагностических тестов, которые служат двум целям:
1) предоставление достоверной информации о состоянии пациента и
2) формированию плана лечение пациента на основе установленного диагноза.
Как следует из вышеизложенного, здесь существенные продвижения могут быть получены именно за счет применения интеллектуального анализа данных, осуществляемого с помощью современных программных средств.
Целью данного исследования является оценка возможности эффективного использования алгоритмов для прогнозирования пациентов при поступлении в больницу, что, в свою очередь, открывает и возможности прогнозировать необходимое лечение для пациентов, а также обеспечить необходимые меры для пациентов с травмами, которые находятся до входа в критическую ситуацию. Для реализации цели должны быть решены следующие задачи:
статистического методакластерного анализа
• исследование возможности применения алгоритма построения дерева решений
Объектом исследования являются медицинские данные пациентов одной из поликлиник г. Котлас.
Предметом исследования являются статистические
программные пакеты.
✅ Заключение
исследованиинесколькихметодах и их алгоритмов.
В результате проделанной работы проведено исследованиенаиболее известных, и получивших широкое распространение, статистических программных
пакетов.Рассмотрены пакеты программного обеспечения для статистического анализа данных, такие как: MSExcel, STATISTICA, SPSS Statistics, SAS VisualAnalytics, Stata и RapidMinerStudio.
В результате проведенного анализа имеющихся на настоящий момент программных средств, для решения задач прикладной математической статистики для целей медицины можно сделать следующие выводы:
1. Предлагаемая линейка программных пакетов решает практически весь спектр задач прикладной статистики, возникающих в практической медицинской деятельности.
2. Программный пакет RAPIDMINER,несомненно, является наиболее эффективным средством решения задачоперативной медицинской практики - диагностики и прогнозирования.
Рассмотрены задачи классификации интеллектуального анализа. Эти задачи позволяют построить модели, которые могут использоваться для прогнозирования поведения анализируемой системы в ситуации, которая ранее не наблюдалась; использовать поиск скрытых закономерностей в данных, их описание и вывод правил, которые могут быть использованы в будущем для повышения эффективности работы медицинских учреждений.
Более подробно рассмотрены и описаны кластерный анализ и построение дерева решений.
В ходе работы выполнены поставленные задачи, а именно:
• исследование возможности применения статистического метода кластерного анализа.В исследованиях кластерного анализа были использованы k-means, k-medoids и x-means алгоритмы с использованием инструмента RapidMiner. Эти три алгоритма были применены для оценки производительности каждого алгоритма с точки зрения кластеризации медицинских данных. Результаты сравнивались с каждым алгоритмом с точки зрения среднего значения и совпадения объектов. В результате исследования мы получили, что алгоритм x-means показал лучший результат по сравнению с другими двумя алгоритмами, он кластеризовал данные с -4.031 средним расстоянием в каждом кластере и совпадение объектов кластера больше 70%, что считается признаком хорошей кластеризации.
• исследование возможности применения алгоритма построения дерева решений. Это исследование является попыткой использовать функции инструмента RapidMiner для анализа данных и представить некоторые из возможностей, которые предлагаются для анализа данных и было создано для того, чтобы представить деревья решений как один из инструментов современных возможностей машинного обучения (интеллектуального анализа данных). Следуя из таблицы точности, мы получаем оптимальное дерево решений с критерием gain_index, где точность построения дерева 90%. Проведя анализ, видно, что диагноз гипертонии прогнозируется у 44 пациентов, не точно поставлена степень у 5 пациентов из них 3 пациента имеют предполагаемый диагноз, но не распознаются методом классификации дерево решений.
На основании проведенного исследования можно заключить, что на настоящий момент RapidMinerявляется наиболее эффективным продуктом в решении задач оперативной медицинской практики.



