Тип работы:
Предмет:
Язык работы:


Применение методов машинного обучения в задаче определения уровня рисков во время беременности

Работа №128312

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы28
Год сдачи2021
Стоимость4355 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
20
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Анализ и извлечение данных 8
1.1. Описание структуры БД 8
1.2. Определение критериев отбора записей 9
1.3. Сбор данных 10
Глава 2. Представление данных 12
2.1. Предобработка текстовых признаков 12
2.2. Векторное представление текстовых признаков 13
2.2.1 Word2Vec 13
2.2.2 FastText 14
2.2.3 BertEmbedings 15
2.3. Векторное представление категориальных признаков ... 16
2.4. Векторное представление пациента 17
Глава 3. Определение уровня риска 18
3.1. Методы классификации 18
3.2. Результаты 19
Вывод 22
Заключение 24
Список литературы

Рост достижений в сфере информационных технологий положительно сказывается на развитии практически всех областей знаний. Разработка и внедрение информационных систем в нашу жизни являются на сегодняшний день одними из самых актуальных задач.
В период пандемии на медицинские учреждения и их работников сильно возросла нагрузка, поэтому использование автоматизированных систем, упрощающих работу персонала, приобрело особое значение. Это дало толчок к развитию направления дистанционных медицинских консультаций, позволяющих поддерживать связь пациентов с медработниками и сократить количество личных обращений в больницы. Для оптимизации времени ожидания от такой системы полезна программа, которая могла бы проанализировать ответы пациента на простые вопросы о самочувствии и автоматических вывести по ним предварительную оценку состояния человека.
Такая задача осложняется тем, что в ней невозможно учесть все имеющиеся условия, влияющие на ответ, — можно лишь выделить примерный набор наиболее важных признаков. Полученный результат при этом будет носить только приблизительный характер, а алгоритм его нахождения не может быть выписан точно и последовательно [1].
В приложении «ТАДАМ» компании «Виста» уже организуются индивидуальные комнаты консультаций с врачом с помощью чат-ботов, позволяющие получить рекомендации, не посещая больницу. Удаленные консультации со специальными возможностями для беременных женщин являются следующим шагом развития продукта.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе работы были выполнены следующие задачи:
1. Исследование структуры базы данных и анализ представленной в ней информации.
2. Изучение возможных подходов обработки данных и их применение на полученных признаках для создания представления пациента.
3. Обучение собственных моделей Word2Vec и FastText и оценка их эффективности.
4. Подбор параметров и анализ результатов 4 алгоритмов классификации.
5. Разработка программного кода [32], реализующего:
- сбор данных из вышеописанной базы данных,
- предобработку данных,
- векторизацию данных,
- классификацию полученного векторного представления


[1] Медицинская нейроинформатика [Электронный ресурс]. URL:https://intuit.ru/studies/courses/1605/141/lecture/20589 (дата обращения: 20.12.20)
[2] Региональный акушерский мониторинг в Свердловской области - инновационный инструмент для снижения материнской и перинатальной смертности. Новые возможности дистанционной помощи / Н. О. Анкудинов [и др.] // Журнал телемедицины и электронного здравоохранения. 2015. № 1(1). С. 28-31.
[3] Зильбер Н. А., Анкудинов Н. О. Региональный акушерский мониторинг: инновационный инструмент управления кластером родовспоможения // Журнал телемедицины и электронного здравоохранения. 2019. Т. 5. № 1. С. 3-7.
[4] Гергет О. М. Модель и инструментальные средства анализа информационных процессов биологической системы мать-плод [Электронный ресурс]. URL:https://postgraduate.tusur.ru/system/file_copies/files/000/000/907/original/dissertation.pdf (дата обращения: 15.12.20)
[5] SF Medic [Электронный ресурс]. URL:https://www.sourcefuse.com/sf-medic (дата обращения: 18.12.20)
[6] How SF Medic Provides Real-Time Clinical Decision
Support Using AWS Machine Learning Services [Электронный ресурс]. URL:https://aws.amazon.com/ru/blogs/apn/
how-sf-medic-provides-real-time-clinical-decision-support-using-aw(дата обращения: 18.12.20)
[7] Choi E., Schuetz A. , Stewart W. F., Sun J. Medical Concept Representation Learning from Electronic Health Records and its Application on Heart Failure Prediction [Электронный ресурс]. URL:https://arxiv.org/ftp/arxiv/papers/1602/1602.03686.pdf (дата обращения: 12.12.20)
[8] MySQL Documentation [Электронный ресурс]. URL:https://dev.mysql.com/doc/ (дата обращения: 21.10.20)
[9] Фиайли К. SQL. Москва: ДМК Пресс. 456
[10] Перинатальный риск, баллы [Электронный ресурс]. URL:http://www.chelsma.ru/files/misc/perinatalnyefaktoryriska.pdf (дата обращения: 10.02.21)
[11] Natural Language Processing (NLP) for Machine Learning [Электронный ресурс]. URL:https://www.machinelearningmastery.ru/natural-language-processing-nlp-for-machine-learning-d44498845d5b/(дата обращения: 21.01.21)
[12] Векторное представление слов [Электронный ресурс]. URL:https://neerc.ifmo.ru/wiki/index.php?title=%D0%92%D0%B5%D0%BA%D1%82%D0%BE%D1%80%D0%BD%D0%BE%D0%B5_%D0%BF%D1%80%D0%B5%D0%B4%D1%81%D1%82%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81%D0%
BB%D0%BE%D0%B2 (дата обращения: 25.02.21)
[13] Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space [Электронный ресурс]. URL:https://arxiv.org/pdf/1301.3781v3.pdf (дата обращения: 25.02.21)
[14] Документация Gensim Word2Vec [Электронный ресурс]. URL:https://radimrehurek.com/gensim/models/word2vec.html (дата обращения: 20.03.21)
[15] Документация FastText [Электронный ресурс]. URL:https://fasttext.cc/ (дата обращения: 22.03.21)
[16] Документация Gensim FastText [Электронный ресурс]. URL:https://radimrehurek.com/gensim/models/fasttext.html (дата обращения: 22.03.21)
[17] Devlin J., Chang M., Lee K., Toutanova K.BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding [Электронный ресурс]. URL:https://arxiv.org/pdf/1810.04805.pdf (дата обращения: 10.04.21)
[18] BERT in DeepPavlov [Электронный ресурс]. URL:http://docs.deeppavlov.ai/en/master/features/models/bert.html (дата обращения: 11.04.21)
[19] Дьяконов А.Г. Python: категориальные признаки [Электронный ресурс]. URL:https://dyakonov.org/2016/08/03/python (дата обращения: 03.03.21)
[20] Воронцов К.В. Математические методы обучения по прецедентам [Электронный ресурс]. URL:http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf (дата обращения: 28.03.21)
[21] Nearest Neighbors // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/neighbors.html#classification(дата обращения: 01.04.21)
[22] KNeighborsClassifier // scikit-learn [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html (дата обращения: 01.04.21)
[23] SVM // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.ru/1-4-support-vector-machines/ (дата обращения: 02.04.21)
[24] SVC // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/generated/sklearn.svm.
SVC.html#sklearn.svm.SVC (дата обращения: 02.04.21)
[25] LinearSVC // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/generated/sklearn.svm.
LinearSVC.html#sklearn.svm.LinearSVC (дата обращения: 02.04.21)
[26] Ensemble methods // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/ensemble.html#forest (дата обращения: 07.04.21)
[27] Воронцов К. В. Логические алгоритмы классификации [Электронный ресурс]. URL:http://www.machinelearning.ru/wiki/images/3/3e/Voron-ML-Logic.pdf (дата обращения: 06.04.21)
[28] RandomForestClassifier // scikit-learn [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.
RandomForestClassifier (дата обращения: 06.04.21)
[29] LogisticRegression // scikit-learn [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html (дата обращения: 15.04.21)
[30] Matthews corrcoef // scikit-learn [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.
matthews_corrcoef.html (дата обращения: 10.04.21)
[31] Оценка качества в задачах классификации и регрессии [Электронный ресурс]. URL:https://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%BA%D0%B0_%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B2_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D1%85_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8_%D0%B8_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8 (дата обращения: 14.04.21)
[32] GitHub репозиторий [Электронный ресурс]. URL:https://github.com/SvetaGolovina/RiskClassification


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ