Введение 3
1 Оценка летальности в мире и России от сердечно-сосудистых заболеваний 4
1.1 Летальность от ССЗ в России и мире 4
1.2 Исследование эпидемиологии сердечно - сосудистых заболеваний в Российской Федерации 7
1.3 Научная цель и задачи проекта 8
1.4 Описание научного коллектива гранта 8
2. Описание инструментария проекта 10
2.1 Выбор языка программирования 10
2.2 Используемые библиотеки 11
2.3 Используемые Python frameworks 13
3. Исследование моделей по оценке рисков летальности от ССЗ 16
3.1 Подготовка данных к машинному обучению 16
3.2 Понятие машинного обучения 17
3.3 Типы машинного обучения 17
3.4 Рассмотренные модели обучения с учителем 18
3.5 Описание моделей для оценки рисков летальности от ССЗ используемые в
современной медицине 21
3.6 Результаты исследования моделей по оценке рисков летальности от ССЗ 24
4 Разработка информационного сервиса прогнозирования фатального события от сердечно - сосудистых заболеваний 45
4.1 Задачи информационного сервиса 45
4.2 «Реализация клиентской стороны пользовательского интерфейса 46
4.3 «Реализация программно - аппаратной части сервиса 52
5. Технико-экономическое обоснование эффективности вложений в разработку проекта 55
5.1 Расчет стоимости трудозатрат по проекту 55
5.2 Смета прямых затрат на изготовление продукта 56
5.3 Технико-экономическое обоснование. Финансовая модель проекта 57
5.4. Выводы об окупаемости проекта 57
Заключение 59
Список используемых источников 60
Приложение А 63
Приложение Б 64
Приложение В 66
Приложение Г
Сердечно - сосудистые заболевания (ССЗ) остаются одной из самых важных проблем большинства стран современного мира, что обусловлено преобладающим уровнем смертности населения от этих патологических форм. По рекомендациям Всемирной организации здравоохранения (ВОЗ), главным подходом к понижению и стабилизации сердечно-сосудистой смертности является активная деятельность по ограничению воздействия на организм факторов риска (ФР). Вместе с тем, низкая эффективность реализации мероприятий популяционной и индивидуальной коррекции ФР способствует прогрессированию ССЗ. [1]
Профилактика ССЗ оказывает положительное влияние на снижение уровня основных ФР, на уровне популяции может предотвратить до 80% преждевременных смертей от ССЗ. Выявляя людей, которые подвержены риску развития ССЗ, и предпринимая меры по уменьшению данного риска, большую часть летальных и не летальных сердечно - сосудистых событий можно предотвратить.
Один из методов профилактики является оценка ФР ССЗ.В России применяется шкала оценки риска летальности от ССЗ SCORE, так как в обучающей выборке данной модели присутствовали результаты наблюдений за пациентами из России. Существенным недостатком ранее разработанных шкал является отсутствие учета ряда индивидуальных особенностей обследуемых лиц.
Лучшие результаты предсказаний ССЗ реализуемы при разработке шкал и моделей оценки рисков летальности от ССЗ, получить которые можно только в результате долгих активных наблюдений за контингентом, который обследуется.
Данный проект проводится на данных исследования эпидемиологии сердечно - сосудистых заболеваний Российской Федерации. Основной целью исследования является исследование факторов риска ССЗ среди популяции Приморского края, разработка моделей по прогнозированию вероятности смерти в течение ближайших 7 лет от ССЗ.
Целью данного проекта является разработка технологии и информационного сервиса для оценки индивидуальных рисков развития сердечно - сосудистых заболеваний на основе методов искусственного интеллекта.
В результате работы были выполнены все поставленные задачи.
Проведен анализ готовых моделей для оценки риска летальности SCORE и ASSIGN SCORE. Были получены основные статистические данные, была рассчитана точность моделей на данных обследуемой когорты Приморского края.
На основе факторов риска летальности SCORE было построены такие модели, как логистическая регрессия, random forest и многослойный персептрон. Модели - логистическая регрессия и Random Forest показали в среднем результаты хуже, чем результаты устоявшихся моделей оценки риска летальности от ССЗ. Многослойный персептрон в среднем на тестовых данных показал лучшие результаты среди готовых моделей и также среди результатов эксплуатируемых моделей.
Разработан информационный веб-сервис для оценки индивидуального десятилетнего риска летальности от ССЗ. Сервис предоставляет пользователю все возможности расчета десятилетнего риска летальности от ССЗ по моделям SCORE, нейросетевой модели и модели ASSIGN SCORE. Модель ASSIGN SCORE может быть выбрана по желанию, т.к. она не рекомендована к использованию на территории РФ из - за обучающей выборки модели основанной исключительно на жителях Шотландии.
Проанализировав данные собранные во время разработки, можно говорить о том, что реализация данного проекта связана с определенным уровнем риска по причине новизны услуги и слабого охвата. Однако, существующие перспективы развития достаточно высоки, поскольку, медицинский персонал Приморского края заинтересован в улучшение качества прогнозирования ССЗ жителей края.
Веб-сервис полностью справляется с поставленной задачей оценки рисков летальности от ССЗ.
1. Cardiovascular diseases // World Health Organization [Electronic resources] - URL: https://www.who.int/en/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds).
2. Global Atlas on cardiovascular disease prevention and control / editors: Mendis S, Puska P, Norrving B - World Health Organization, Geneva, 2016 -155 p.
3. Primary prevention and risk factor reduction in coronary heart disease mortality among working aged men and women in eastern Finland over 40 years: population based observational study / editors: J ousilahti P, Laatikainen T, Peltonen M, Borodulin K, Mannisto S, Jula A, Salomaa V, Harald K, Puska P, Vartiainen E. - BMJ, 2016 - 352 p.
4. Эпидемиология сердечно-сосудистых заболеваний в различных регионах России (ЭССЕ-РФ). Обоснование и дизайн исследования. / Научно-организационный комитет проекта ЭССЕ-РФ. // Профилактическая медицина. - 2013. - № 6. - С. 25-34.
5. Рабочие места, как неотъемлемая часть здорового образа жизни населения // Леонидова Г.В. - Проблемы развития территории, Федеральное государственное бюджетное учреждение науки Институт социально -экономического развития территорий Российской академии наук, 2015 - 125 c.
6. Забота о здоровье сотрудников - резерв роста производительности труда // Бурмистрова Н.О., Бурмистров Д.А. - Международный научно-исследовательский журнал, Индивидуальный предприниматель Соколова Марина Владимировна, 2016 - 75с.
7. Гриванв И.Ю., Гриванова О.В., Гриванова С.М. Безопасность жизнедеятельности. Учебно-практическое пособие. - Владивосток: Изд-во ВГУЭС, 2010. - 92 с.
8. Programming Languages Most Used and Recommended by Data Scientists // Business
Broadway [Electronic resources] - URL: https://businessoverbroadway.com/2019/01/13/
programming-languages-most-used-and-recommended-by-data-scientists.
9. McKinney Wes. Python for Data Analysis / Wes McKinney - O’Reilly, 2015. - 482 p.
10. Pandas // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia .org/wiki/Pandas.
11. SciPy // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/SciPy.
12. Визуализация данных с использованием Seaborn // Машинное обучение, нейронные сети, искусственный интеллект [Электронный ресурс] - Режим доступа: https://www.machinelearningmastery.ru/data-visualization-using-seaborn-fc24db95a850/.
13. Основы статистики с Python: описательная статистика // Tproger [Электронный ресурс] - Режим доступа: https://tproger.ru/translations/basic-statistics-in-python-descriptive- statistics/.
14. Модуль Math // Python Scripts [Электронный ресурс] - Режим доступа: https://python- scripts.com/math.
15. Обзор методов классификации в машинном обучении с помощью Scikit -Learn // Tproger [Электронный ресурс] - Режим доступа: https://tproger.ru/translations/scikit-learn-in- python/.
16. Why TensorFlow // TensorFlow [Electronic resources] - URL: https://www
.tensorflow.org.
17. Ф.М. Гафаров, А.Ф. Галимянов //Искусственные нейронные сети и их приложения Учебное пособие - .Казань: Издательство Казанского университета, 2018. - 120 с
18. Django // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/Django.
19. Новый проект // DjangoBook [Электронный ресурс] - Режим доступа: https://djbook.ru/ch02s05.html.
20. Задачи по подготовке данных для расширенного машинного обучения // Microsoft [Электронный ресурс] - Режим доступа: https://docs.microsoft.com/ru-ru/azure/machine- learning/team-data-science-process/prepare-data.
21. Мюллер, Гвидо. Введение в машинное обучение с помощью Python / Мюллер, Гвидо - Москва 2017 - 393 с.
22. Обучение с учителем и без учителя // Studme [Электронный ресурс] - Режим доступа: https://studme.org/235648/informatika/obuchenie_uchitelem_uchitelya.
23. Обучение с учителем // Machine Learning [Электронный ресурс] - Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=Обучение_с_учителем.
24. Машинное обучение: методы и способы // Гид по технологиям цифровой
трансформации [Электронный ресурс] - Режим доступа: https://www.osp.ru/
cio/2018/05/13054535.
25. Как легко понять логистическую регрессию// Habr [Электронный ресурс] - Режим доступа: https://habr.com/ru/company/io/blog/265007/.
26. Random forest // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/Random_forest.
27. Нейронная сеть // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/Нейронная_сеть.
28. European Guidelines on cardiovascular disease prevention in clinical practice // Massimo F. Piepoli, Arno W. Hoes, Stefan Agewall. - European Heart Journal, 2016, № 37, p. 2315-2381.
29. Кардиоваскулярная профилактика 2017 // М.Г. Бубнова, О.М. Драпкина, Н.Е. Гаврилова, Р.А. Еганян, А.М.Калинина, Н.С. Карамнова, Ж.Д. Кобалава, А.В. Концевая, В.В. Кухарчук, М.М.Лукьянов, Г.Я. Масленникова, С.Ю. Марцевич, В.А. Метельская, А.Н. Мешков, Р.Г.Оганов, М.В. Попович, О.Ю. Соколова, О.Ю. Сухарева, О.Н. Ткачева, С.А. Шальнова, М.В. Шестакова, Ю.М. Юферева, И.С. Явелов- Москва 2017 - 288 с
30. Калькулятор SCORE // Медицинская профилактика [Электронный ресурс] - Режим доступа: http://mpmo.ru/dop/risk.php.
31. ASSIGN SCORE // assign score [Electronic resources] - URL: http://www.assign- score.com/estimate-the -risk.
32. Критерий Стьюдента // Machine Learning [Электронный ресурс] - Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=Критерий_Стьюдента.
33. U-критерий Манна - Уитни // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/U-критерий_Манна_—_Уитни.
34. HTML5 // Википедия [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/HTML5
35. Основы CSS // MDN web docs [Электронный ресурс] - Режим доступа: https://developer.mozilla.org/ru/docs/Learn/Getting_started_with_the_web/CSS_basics#:~:text=CS S%20(Cascading%20Style%20Sheets)%20—,для%20стилизации%20вашей%20веб-страницы.
36. JavaScript // MDN web docs [Электронный ресурс] - Режим доступа: https://developer.mozilla.org/ru/docs/Web/JavaScript
37. Build fast, responsive sites with Bootstrap // Bootstrap [Electronic resources] - URL: https://getbootstrap.com.