🔍 Поиск готовых работ

🔍 Поиск работ

Программное обеспечение и модели анализа предикторов пациентов с заболеваниями, передаваемыми клещами

Работа №205095

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы132
Год сдачи2022
Стоимость4830 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
9
Не подходит работа?

Узнай цену на написание


Введение 15
1 Обзор литературы 17
2 Объект и методы исследования 20
2.1 Объект исследования 20
2.2 Методы исследования 21
2.2.1 Методы предварительной обработки данных 21
2.2.1.1 Методы обнаружения и устранения выбросов 22
2.2.1.2 Методы работы с пропущенными значениями 25
2.2.1.3 Методы преобразования данных 26
2.2.1.3.1 Методы работы с категориальными признаками 28
2.2.1.3.2 Методы масштабирования данных 29
2.2.2 Методы машинного обучения 30
2.2.2.1 Метод дерева решений 31
2.2.2.2 Метод логистической регрессии 34
2.2.2.3 Метод случайного леса 36
2.2.2.4 Метод градиентного бустинга 37
2.2.3 Методы оценки качества и интерпретации работы моделей 39
2.2.3.1 Матрица ошибок и простые оценки 39
2.2.3.2 Важность и степень влияния признаков 42
3 Расчеты и аналитика 46
3.1 Выбор программного обеспечения и инструментов разработки 47
3.2 Загрузка, предварительный анализ и предобработка данных 49
3.3 Деление данных на обучающую и тестовую выборки 53
3.4 Построение классификаторов 53
3.4.1 Выбор моделей классификации и поиск оптимальных гиперпараметров . 53
3.4.2 Построение классификаторов с оптимальными гиперпараметрами 55
4 Результаты 57
4.1 Классификация диагнозов пациентов с клещевыми инфекциями 57
4.2 Важности признаков 59
4.3 Разработка дашборда 61
5 Финансовый менеджмент, ресурсоэффективность и ресурсосбережение 69
5.1 Предпроектный анализ 70
5.1.1 Технология «QuaD» 70
5.1.2 Диаграмма Исикавы 71
5.1.3 SWOT-анализ 73
5.2 Инициация научно-исследовательского проекта 74
5.2.1 Цели и результаты научно-исследовательского проекта 74
5.2.2 Организационная структура научно -исследовательского проекта 76
5.2.3 Ограничения и допущения проекта 76
5.3 Планирование управления научно-исследовательским проектом 77
5.3.1 План научно-исследовательского проекта 77
5.3.2 Бюджет научно-исследовательского проекта 78
5.3.2.1 Расчет материальных затрат 79
5.3.2.2 Расчет затрат на электроэнергию 79
5.3.2.3 Заработная плата исполнителей 80
5.3.2.4 Отчисления во внебюджетные фонды (страховые отчисления) 82
5.3.2.5 Накладные расходы 82
5.3.2.6 Формирование бюджета затрат научно-исследовательского проекта 82
5.3.3 Риски научно-исследовательского проекта 83
5.3.4 Описание потенциального эффекта 84
6 Социальная ответственность 85
6.1 Правовые и организационные вопросы обеспечения безопасности 86
6.1.1 Специальные правовые нормы трудового законодательства 86
6.1.2 Эргономические требования к рабочему месту оператора ПЭВМ 86
6.2 Производственная безопасность 88
6.2.1 Анализ вредных и опасных факторов, которые может создать объект исследования 88
6.2.2 Производственные факторы, связанные с аномальными
микроклиматическими параметрами воздушной среды на местонахождении работающего 89
6.2.3 Производственные факторы, связанные с отсутствием или недостатком
необходимого естественного освещения 91
6.2.4 Производственные факторы, обладающие свойствами
психофизиологического воздействия на организм человека 95
6.2.5 Производственные факторы, связанные с электрическим током, вызываемым разницей электрических потенциалов, под действие которого попадает работающий 96
6.2.6 Производственные факторы, связанные с электромагнитными полями, неионизирующими ткани тела человека 97
6.3 Экологическая безопасность 97
6.4 Безопасность в чрезвычайных ситуациях 99
Заключение 103
Список использованных источников и литературы 105
Приложение А (справочное) 111
Приложение Б - Признаки исходного набора данных 126

В настоящее время в медицинских учреждениях активно внедряются и применяются различные медицинские информационные системы (МИС), данные системы служат в качестве инструментов для сбора и хранения данных. Однако уровень развития информационных технологий позволяет не ограничиваться данным функционалом. Массивы данных могут быть использованы для поиска скрытых закономерностей с помощью алгоритмов машинного и глубокого обучения.
МИС позволяют получать отчеты по введенным данным, однако, помимо важной для анализа информации выгружаются и персональные данные пациентов, такие отчеты не могут быть использованы для проведения анализа. Интеграцию с МИС реализовать достаточно сложно, поэтому целесообразней разработать отдельное программное обеспечение, которое позволит вносить данные, на основе которых будет производиться обучение моделей машинного обучения для дальнейшего использования их в качестве инструмента для оказания помощи специалисту в постановке диагноза, а также для визуального анализа собранных данных, чтобы наглядно оценивать, сравнивать между собой отдельные случаи [1], получать некоторые статистические сведения, чтобы иметь общее представление о наборе данных.
Так как в настоящее время наиболее популярными являются кроссплатформенные программные продукты, не требующие предварительной установки, оптимальным решением будет создать веб - интерфейс [2].
Отделением инфекционных заболеваний Сибирского государственного медицинского университета были предоставлены деперсонализированные данные пациентов с инфекциями, передаваемыми клещами в виде электронной таблицы. Таблица состоит из 9 листов, в которых представлены сведения о пациентах и проводимых исследованиях.
Целью работы является повышение эффективности работы врача инфекциониста при анализе данных пациентов с клещевыми инфекциями путем разработки программного обеспечения и моделей анализа предикторов пациентов с заболеваниями, передаваемыми клещами.
В рамках данной работы проводится подготовка табличных данных пациентов с инфекциями, передаваемыми клещами, к анализу. Также предложен подход классификации диагнозов пациентов с клещевыми инфекциями, разработан интерактивный веб-интерфейс.
Объектом исследования являются данные пациентов, страдающих инфекционными заболеваниями, передаваемыми иксодовыми клещами. Предметом исследования является процесс разработки программного обеспечения и моделей анализа предикторов пациентов с заболеваниями, передаваемыми клещами.
Методы исследования - поиск литературы и источников, анализ информационных материалов, сравнение, консультация со специалистами, методы машинного обучения, методы визуализации.
В работе использованы различные методические материалы и интернет-ресурсы. Работа будет реализована на языке программирования Python, веб-фреймворке Dash.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


На протяжении выполнения данной работы поставленные задачи были выполнены. А именно, была проведена подготовка табличных данных пациентов с инфекциями, передаваемыми клещами, к анализу, а также построены классификаторы диагнозов пациентов с клещевыми инфекциями, разработан интерактивный веб-интерфейс.
Предварительно загруженные данные были проверены на наличие пропущенных значений и выбросов. Признаки и записи, содержащие пропущенные значения, которые невозможно было восстановить исключены из дальнейшего анализа. Пропущенные значения в бинарных категориальных признаках были заполнены нулями, что соответствует отсутствию у пациента того или иного признака, пропуски в числовых признаках анализов крови рассчитаны на основе лейкоцитарной формулы. Текстовые категориальные признаки были закодированы методом прямого кодирования.
Набор данных был разделен на тренировочное и тестовое подмножества. Было построено несколько моделей для определения диагноза пациентов с клещевыми инфекциями. Для выбранных моделей был проведен подбор оптимальных параметров. После чего проведена оценка качества работы моделей классификации с помощью метрик качества и ROC-кривых. Чувствительность дерева решений, логистической регрессии, случайного леса и градиентного бустинга составила 0,67, 0,75, 0,81 и 0,77, соответственно. Значения же специфичности для данных алгоритмов, соответственно, 0,7, 0,77, 0,79 и 0,78. Таким образом, наилучший результат показала модель случайного леса. Что касается значений площадей под ROC- кривыми, то наилучшие результаты по трем классам, а именно, клещевому энцефалиту, иксодовому клещевому боррелиозу и микст-инфекции, показали градиентный бустинг и дерево решений. При классификации диагнозов пациентов с помощью логистической регрессии и случайного леса, микст - инфекция определяется слабее, чем два других диагноза. 
На основе проведенного анализа данных был интерактивный веб-интерфейс, позволяющий изучить структуры набора данных и результаты анализа.
Также разработаны следующие разделы: «Финансовый менеджмент, ресурсоэффективность и ресурсосбережение», «Социальная ответственность», а также раздел на иностранном языке (английский) - «Data Preprocessing Methods», приведенный в Приложении А.



1. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP: учебное пособие / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. - Санкт-Петербург: БХВ-Петербург, 2007. - 384 с.
2. Topflight // How to develop a dashboard web app for your website [Электронный ресурс]. - URL: https://topflightapps.com/ideas/how-to-create-a- dashboard-web-application/#1(дата обращения: 26.02.2022).
3. Анализ данных // Аналитическая культура [Электронный ресурс].
- URL: https://www.mann-ivanov-ferber.ru/assets/files/bookparts-
new/analiticheskaya-kultura/analiticheskaya-kultura-mail_stamped.pdf (дата
обращения: 10.02.2022).
4. Трансмиссивные болезни // Всемирная организация здравоохранения [Электронный ресурс]. - URL: https://www.who.int/ru/news-room/fact-sheets/detail/vector-borne-diseases (дата обращения: 6.01.2022).
5. Миноранская Н.С., Сарап П.В., Андронова Н.В., Миноранская Е.И. Клинико-лабораторные предикторы прогноза исходов иксодовых клещевых боррелиозов // Вестник Российской академии медицинских наук. - 2015. Т. 70. № 3. С. 378-385.
6. Лодыгина У.В., Веселова А.Н., Лысанова А.И., Воробьева Ю.С. Клещевой энцефалит: факторы, определяющие исход // Бюллетень Северного государственного медицинского университета. - 2018. № 1 (40). С. 247-249.
7. Yang L.H., Han B.A. Data-driven predictions and novel hypotheses about zoonotic tick vectors from the genus Ixodes // BMC Ecology - 2018. - Vol. 18. № 7. DOI: 10.1186/s12898-018-0163-2. PMID: 29448923.
8. Pfeifer L.M., Valdenegro-Toro M. Automatic Detection and Classification of Tick-borne Skin Lesions using Deep Learning // arxiv.org. 2020. Дата обновления: 23.11.2020. - URL: https://arxiv.org/abs/2011.11459(дата обращения 07.02.2022).
9. Johnson L., Shapiro M., Stricker R.B., Vendrow J., Haddock J., Needell D. Antibiotic Treatment Response in Chronic Lyme Disease: Why Do Some Patients Improve While Others Do Not? // Healthcare (Basel). - 2020 Oct 3;8(4):383. DOI: 10.3390/healthcare8040383. PMID: 33022914
10. Vendrow J., Haddock J., Needell D., Johnson L. Feature Selection on Lyme Disease Patient Survey Data [Электронный ресурс] // arxiv.org. 2020. Дата обновления: 24.08.2020. - URL: https://arxiv.org/abs/2009.09087(дата обращения 14.02.2022).
11. Clarke D.J.B., Rebman A.W., Bailey A., Wojciechowicz M.L.,
Jenkins S.L., Evangelista J.E., Danieletto M., Fan J, Eshoo M.W., Mosel M.R., Robinson W., Ramadoss N., Bobe J., Soloski M.J., Aucott J.N., Ma'ayan A. Predicting Lyme Disease From Patients' Peripheral Blood Mononuclear Cells Profiled With RNA-Sequencing // Frontiers in immunology. - 2021 Mar
8;12:636289. DOI: 10.3389/fimmu.2021.636289. PMID: 33763080
12. Выброс // Викиконспекты [Электронный ресурс]. - URL: https://neerc.ifmo.ru/wiki/index.php?title=%D0%92%D 1%8B%D0%B 1%D1%80 %D0%BE%D1%81#.D0.9C.D0.B5.D1.82.D0.BE.D0.B4.D1.8B_.D0.BE.D0.B1.D 0.BD.D0.B0.D1.80.D1.83.D0.B6.D0.B5.D0.BD.D0.B8.D1.8F_.D0.B2.D1.8B.D0. B1.D1.80.D0.BE.D1.81.D0.BE.D0.B2 (дата обращения: 15.02.2022).
13. Как вычислить выбросы // wikiHow [Электронный ресурс]. - URL:
https ://ru.wikihow.com/%D0%B2%D1 %8B%D1%87%D0%B8%D1 %81 %D0%B B%D0%B8%D1 %82%D1 %8C-%D0%B2%D1%8B%D0%B 1 %D1
%80%D0%BE%D1%81%D1%8B (дата обращения: 20.05.2022).
14. Обработка пропусков в данных // Loginom [Электронный ресурс]. - URL: https://loginom.ru/blog/missing(дата обращения: 10.04.2022).
15. Типы данных в статистике // Машинное обучение [Электронный ресурс]. - URL: https://www.machinelearningmastery.ru/data-types-in-statistics- 347e152e8bee/(дата обращения: 15.05.2022).
16. Рашка С. Python и машинное обучение // пер. с англ. А. В. Логунова. - М.: ДМК Пресс, 2017. - 418 с.
17. Обучение с учителем // Машинное обучение [Электронный ресурс]. -
URL: http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D 1%83 %D 1 %87%D0%B5%D0%BD%D0%B8%D0%B5_%D 1 %81_%D 1 %83 %D 1%87%D0%B8%D 1%82%D0%B5%D0%BB%D0%B5%D0%BC (дата
обращения: 11.05.2022).
18. Кластеризация // Skill factory [Электронный ресурс]. - URL:
https ://blog. skillfactory.ru/ glossary/klasterizacziya-klasternyj -analiz/ (дата
обращения: 21.05.2022).
19. Обучение нейросети с учителем, без учителя, с подкреплением —
в чем отличие? Какой алгоритм лучше? // Neurohive [Электронный ресурс]. - URL: https://neurohive.io/ru/osnovy-data-science/obuchenie-s-uchitelem-bez-
uchitelja-s-podkrepleniem/ (дата обращения: 13.04.2022).
20. Машинное обучение применили для помощи анастезиологам // Neurohive [Электронный ресурс]. - URL: https://neurohive.io/ru/gotovye-prilozhenija/mashinnoe-obuchenie-primenili-dlya-pomoshhi-anasteziologam/ (дата обращения: 14.02.2022).
21. Модель обучили находить оптимальную схему лечения // Neurohive [Электронный ресурс]. - URL: https://neurohive.io/ru/papers/model- obuchili-nahodit-optimalnuju-shemu-lecheniya/(дата обращения: 18.04.2022).
22. Машинное обучение: методы и способы // OSP - Гид по технологиям цифровой трансформации [Электронный ресурс]. - URL: https://www.osp.ru/cio/2018/05/13054535(дата обращения: 12.04.2022).
23. Дерево решений // Loginom [Электронный ресурс]. - URL: https://wiki.loginom.ru/articles/decision-trees.html(дата обращения: 1.03.2022).
24. Логистическая регрессия (Logistic Regression) // Loginom
[Электронный ресурс]. - URL: https://wiki.loginom.ru/articles/logistic-
regression.html (дата обращения: 3.03.2022).
25. Как работает случайный лес? // Nuancesprog [Электронный ресурс]. - URL: https://nuancesprog.ru/p/6160/(дата обращения: 8.03.2022).
26. Оценка качества в задачах классификации // Университет ИТМО
[Электронный ресурс]. - URL:
https://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD %D0%BA%D0%B0_%D0%BA%D0%B0%D1%87%D0%B5%D1 %81 %D1%82 %D0%B2%D0%B0_%D0%B2_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87 %D0%B0%D1 %85_%D0%BA%D0%BB%D0%B0%D1 %81 %D1 %81 %D0%B8 %D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8 (дата
обращения: 8.04.2022).
27. Интерпретируй это: метод SHAP в Data Science // Чернобровое
Алексей [Электронный ресурс]. - URL:
https://chernobrovov.ru/articles/interpretiruj-eto-metod-shap-v-data-science.html(дата обращения: 16.04.2022).
28. Основные инструменты анализа данных. Откройте для себя список из 14 лучших программ и инструментов анализа // Xmldatafeed [Электронный ресурс]. - URL: https://xmldatafeed.com/osnovnye-instrumenty- analiza-dannyh-otkrojte-dlya-sebya-spisok-iz-14-luchshih-programm-i- instrumentov-analiza/(дата обращения: 25.04.2022).
29. Choosing a Better Framework // Tutorials point [Электронный
ресурс]. - URL: https://www.tutorialspoint.com/python_web_development_
libraries/python_web_development_libraries_choosing_a_better_framework.htm (дата обращения: 22.04.2022).
30. Долгов В. В., Меньшиков В. В. Клиническая лабораторная диагностика. Национальное руководство //М.: ГЭОТАР-Медиа. - 2016. - С. 688.
31. Криницына З. В., Видяев И. Г. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение: учебно-методическое пособие / З. В. Криницына, И. Г. Видяев; Томский политехнический университет. - Томск: Изд-во Томского политехнического университета, 2014. - 73 с.
32. Диаграмма Исикавы [Электронный ресурс]: сайт. - URL: https://up-pro.ru/encyclopedia/diagramma-isikavy/(дата обращения: 22.05.2022).
33. История диаграммы Ганта [Электронный ресурс] / Юлия Челянова и Евгений Пикулев. — Электрон. текстовые дан. — Режим доступа: http://gibtech.ru/blog/discus?entry_id=177(дата обращения: 22.05.2022).
34. «Трудовой кодекс Российской Федерации» от 30.12.2001 N 197- ФЗ (ред. от 25.02.2022) (с изм. и доп., вступ. в силу с 01.03.2022).
35. Федеральный закон «О специальной оценке условий труда» от 28.12.2013 N 426-ФЗ.
36. ГОСТ 12.2.032-78 «Рабочее место при выполнении работ сидя».
37. СанПиН 1.2.3685-21 Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания.
38. ГОСТ Р 50923-96 Дисплеи. Рабочее место оператора.
39. СП 52.13330.2016 Естественное и искусственное освещение.
40. Безопасность жизнедеятельности. Расчёт искусственного освещения. Методические указания к выполнению индивидуальных заданий для студентов дневного и заочного обучения всех направлений и специальностей ТПУ. - Томск: Изд. ТПУ, 2008. - 20 с.
41. ГОСТ Р 12.2.143-2009 Система стандартов безопасности труда. Системы фотолюминесцентные эвакуационные. Требования и методы контроля.
42. МР 2.2.9.2311 - 07 «Профилактика стрессового состояния
работников при различных видах профессиональной деятельности».
43. ГОСТ 12.1.030-81 ССБТ Защитное заземление, зануление.
44. ГОСТ Р 12.1.019-2009 ССБТ. Электробезопасность. Общие требования и номенклатура видов защиты.
45. ГОСТ Р 50948-2001 Средства отображения информации индивидуального пользования. Общие эргономические требования и требования безопасности.
46. Федеральный закон №89 от 1998 г. «Об отходах производства и потребления». Глава III, ст. № 9. — 1988. — С. 39.
47. ГОСТ Р 53692-2009 Ресурсосбережение. Обращение с отходами. Этапы технологического цикла отходов — введ. впервые 15.12.2009. — Москва: Стандартинформ, 2011. — С. 20.
48. Федеральный классификационный каталог отходов (с
изменениями на 4 октября 2021 года) [Электронный ресурс]. - 2021. - Режим доступа: http://www.consultant.ru/document/cons_doc_LAW_218071/,
свободный.
49. Постановление Правительства РФ от 28.12.2020 N 2314 «Об утверждении Правил обращения с отходами производства и потребления в части осветительных устройств, электрических ламп, ненадлежащие сбор, накопление, использование, обезвреживание, транспортирование и размещение которых может повлечь причинение вреда жизни, здоровью граждан, вреда животным, растениям и окружающей среде».
50. N 123-ФЗ от 22.07.2008 (ред. от 30.04.2021) Технический регламент о требованиях пожарной безопасности.
51. Правила устройства электроустановок [Электронный ресурс]. - Режим доступа: https://docs.cntd.ru/document/1200030216, свободный.
52. Правила по охране труда при эксплуатации электроустановок
[Электронный ресурс]. - Режим доступа:
https://docs.cntd.ru/document/573264184, свободный.
53. СП 12.13130.2009 Определение категорий помещений, зданий и наружных установок по взрывопожарной и пожарной опасности.
54. Критерии отнесения объектов, оказывающих негативное
воздействие на окружающую среду, к объектам I, II, III и IV категорий [Электронный ресурс]. - Режим доступа:
https://docs.cntd.ru/document/573292854, свободный.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ