Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Подготовка данных 6
1.1 Разбор МИС «Виста-мед» 6
1.2 Составление счетов и справочник причин их возвратов 7
1.3 Анализ базы данных 9
Глава 2. Краткое введение в ассоциативные правила 12
2.1. Понятие ассоциативных правил 12
2.2 Алгоритм поиска ассоциативных правил Apriori 14
Глава 3. Реализации и получение ассоциативных правил 19
3.1 Инициализация 19
3.2 Пакет arules языка R 21
3.3 Результаты применения алгоритма 23
3.4 Ускорение работы функции apriori() 27
Глава 4. Проверка качества модели 29
4.1 Программа проверки 29
4.2 Эксперименты 30
Выводы 35
Заключение 37
Список литературы 38
Анализ данных является активно развивающейся областью в математике и информатике, что связано с тем, что в настоящее время через компании, которые занимаются разработкой, внедрением и дальнейшим сопровождением программного обеспечения для учреждений здравоохранения, проходит колоссальное количество информации, на обработку и проверку которой сотрудникам приходится тратить много времени [1]. Таким образом, автоматизация процесса проверки является одним из приоритетных направлений развития служб технической поддержки.
Проблема отсутствия автоматизации анализа объемных баз данных явно проявляется при работе с медицинской документацией, правильность заполнения которой играет важную роль. Допущенные в силу человеческого фактора ошибки ведут к тому, что истории болезней, которые включаются в счета и передаются в страховые компании на проверку, возвращаются обратно без оплаты, что порождает недопонимание между медицинскими учреждениями и страховыми компаниями. С целью понизить процент возвращаемых счетов, данные об историях болезней предварительно проверяются сотрудниками технической поддержки, что является длительным и трудозатратным процессом.
Решением данной проблемы может стать использование алгоритмов поиска ассоциативных правил. В связи с этим, целью данного дипломного исследования является построение ассоциативных правил для обнаружения ошибок в медицинской документации и создание программного обеспечения, реализующего контроль правильности заполнения на основе выявленных закономерностей. Данная работа посвящена рассмотрению и анализу вариантов ошибок, которые совершаются при внесении данных в истории болезней пациентов.
Исследования показали, что поиск ассоциативных правил может быть применим при анализе достоверности медицинской документации. С помощью алгоритма Apriori найденные ассоциативные правила в электронных картах пациентов быстро и эффективно помогают отобрать неправильно заполненные истории болезней, что упрощает работу сотрудников технической поддержки медицинских учреждений.
Эффективность и способность работать с большими данными пакета arules показывает, что можно быстро провести анализ огромного количества данных.