Тип работы:
Предмет:
Язык работы:


Исследование архитектур нейронных сетей в задаче классификации клинических данных

Работа №35269

Тип работы

Дипломные работы, ВКР

Предмет

программирование

Объем работы43
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
221
Не подходит работа?

Узнай цену на написание


Введение
ПОСТАНОВКА ЗАДАЧИ 5
2. ТЕКУЩЕЕ СОСТОЯНИЕ ИССЛЕДОВАНИЙ 6
3. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ 8
3.1. Рекуррентные нейронные сети 10
3.1.1. Долгая краткосрочная память 11
3.1.2. Регуляризация 13
3.1.3. ASGD Weight-Dropped LSTM 14
3.2. Transformer 15
3.3. Метод опорных векторов 17
4. РАБОТА С ДАННЫМИ 20
4.1. Предобработка данных 20
4.2. Анализ данных 21
4.3. Подготовка данных 24
5. ЭКСПЕРИМЕНТЫ 27
6. ЗАКЛЮЧЕНИЕ 30
ГЛОССАРИЙ 31
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 33
ПРИЛОЖЕНИЕ


Минувшее десятилетие ознаменовалось взрывом популярности алгоритмов глубокого обучения на большом спектре задач, в том числе включая обработку естественного языка [1], распознавания речи [2], компьютерного зрения [3] и обучения с подкреплением [4]. Все большее количество информации становится доступным специалистам в области анализа данных [5-9], что ведет к возросшему количеству исследований (см. Диаграмму 1-2), в том числе и в медицине.
Глубокое обучение было широко использовано в задачах анализа медицинских изображений [10], в работе по определению ретинопатии, как одной из форм осложнения сахарного диабета [11], в работе по определению клеток метастаза на гигапиксельных изображениях [12]. В геномике глубокое обучение помогло идентифицировать распространенные генетические вариации более точно в сравнении с традиционными методами [13,14], что позволило открыть пути к новым генетическим исследованиям [15,16]. Генетические исследования в свою очередь ведут к созданию персонифицированных лекарственных средств [17].
Во всех вышеперечисленных исследованиях алгоритмы глубокого обучения анализировали базы данных Electronic Health Records (EHR). EHR представляет собой цифровую версию истории болезни пациента. EHR доступны в реальном времени, содержат всю возможную информацию о конкретном пациенте и предоставляют возможность мгновенного и защищенного доступа к ним авторизованным пользователям.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной выпускной квалификационной работе были изучены и реализованы работы последних лет в области обработки естественного языка. Была проведена работа по анализу и обработке клинических данных, были проведены эксперименты по обучению разных архитектур нейронных сетей, проведена валидация полученных результатов. Результаты работы показали, что использование простой архитектуры без сложной семантической обработки текста недостаточно для эффективного решения прикладных задач. Для улучшения результата следует применить более комплексный подход, включающий в себя выделение именованных сущностей, использование русскоязычных онтологий.



1. Hirschberg J., Manning С. D. Advances in natural language processing //Science. - 2015. - T. 349. - №. 6245. - C. 261-266.
2. Graves A., Mohamed A., Hinton G. Speech recognition with deep recurrent neural networks //2013 IEEE international conference on acoustics, speech and signal processing. - IEEE, 2013. - C. 6645-6649.
3. Szegedy C. et al. Inception-v4, inception-resnet and the impact of residual connections on learning //Thirty-First AAAI Conference on Artificial Intelligence. - 2017.
4. Mnih V. et al. Playing atari with deep reinforcement learning //arXiv preprint arXiv: 1312.5602. -2013.
5. Johnson A. E. W. et al. МШПС-Ш, a freely accessible critical care database //Scientific data. - 2016. - T. 3. - C. 160035.
6. M. Ariel Geer Wallace, Joachim D. Pled, Dataset of breath research manuscripts curated using PubMed search strings from 1995-2016 //Data in Brief. - 2018. - T. 18. - C. 1711-1724.
7. Zhengxi Chen, Ju Qiao, Qirui Wang, Qian Xiao, Data on tumor progression of c-mos deficiency in murine models of KrasG12D lung and ApcMin colorectal cancer //Data in Brief. - 2018. - T. 20. - C. 1124-1132.
8. Michael Petridis, Gregory M.Cook, Microarray dataset on the genome-wide expression profile of an M. smegmatis amtR mutant (JR258) compared to M. smegmatis mc2155 //Data in Brief. - 2017. - T. 10. -C. 38-40.
9. Ji Hyung Hong, Yoon Но Ко, Keunsoo Kang, RNA-seq data of invasive ductal carcinoma and adjacent normal tissues from a Korean patient with breast cancer //Data in Brief. - 2018. - T. 18. - C. 736-739.
lO.Shen D., Wu G., Suk H. I. Deep learning in medical image analysis //Annual review of biomedical engineering. - 2017. - T. 19. - C. 221-248.
11. Gulshan V. et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs //Jama. - 2016. - T. 316. - №. 22. - C. 2402-2410.
12. Liu Y. et al. Detecting cancer metastases on gigapixel pathology images //arXiv preprint arXiv: 1703.02442. - 2017.
13. Webb S. Deep learning for biology //Nature. - 2018. - T. 554. - №. 7693.
14. Poplin R. et al. A universal SNP and small-indel variant caller using deep neural networks //Nature biotechnology. -2018. - T. 36. -№. 10. - C. 983.
15. Angermueller C. et al. Deep learning for computational biology //Molecular systems biology. - 2016. - T. 12. - №. 7. - C. 878.
16. Yue T., Wang H. Deep Learning for Genomics: A Concise Overview //arXiv preprint arXiv: 1802.00810. - 2018.
17. Gawehn E., Hiss J. A., Schneider G. Deep learning in drug discovery //Molecular informatics. - 2016. - T. 35. - №. 1. - C. 3-14.
18. What is an Electronic Health Record (EHR)? [Электронный ресурс] //Health Information Technology, 2019, May 13, URL: https://www.healthit.gov/faq/what-electronic-health-record-ehr (дата обращения: 09.06.2019)
19. ГОСТ Р 52636-2006, Электронная история болезни. Общие положения (с Поправкой) [Электронный ресурс] //Электронный фонд правовой и нормативно-технической документации, URL: http://docs.cntd.ru/document/1200048924 (дата обращения:
31.05.2019) .
20. Cortes С., Vapnik V. Support-vector networks //Machine learning. - 1995. - T. 20. - №. 3. - C. 273-297
21. Hochreiter S., Schmidhuber J. Long short-term memory //Neural computation. - 1997. - T. 9. - №. 8. - C. 1735-1780.
22. Merity S., Keskar N. S., Socher R. Regularizing and optimizing LSTM language models //arXiv preprint arXiv: 1708.02182. - 2017.
23. Vaswani A. et al. Attention is all you need //Advances in neural information processing systems. - 2017. - C. 5998-6008.
24. Baeza-Yates R. et al. Modern information retrieval. - New York : ACM press, 1999. - T. 463. - C. 68-74.
25. Mikolov T. et al. Distributed representations of words and phrases and their compositionality //Advances in neural information processing systems.- 2013. - C. 3111-3119.
26. Howard J., Ruder S. Universal language model fine-tuning for text classification //arXiv preprint arXiv: 1801.06146. - 2018.
27. Johnson A. E. W. et al. MIMIC-III, a freely accessible critical care database //Scientific data. - 2016. - T. 3. - C. 160035.
28. Childs L. C. et al. Description of a rule-based system for the i2b2 challenge in natural language processing for clinical data //Journal of the
American Medical Informatics Association. - 2009. - T. 16. - №. 4. - C. 571-575.
29. Peter van Nederpelt, Piet Daas, 49 Factors that Influence the Quality of Secondary Data Sources //Statistics Netherlands, Paper Quality and Risk Management, 2012.
30. Yao L., Mao C., Luo Y. Clinical text classification with rule-based features and knowledge-guided convolutional neural networks //BMC medical informatics and decision making. - 2019. - T. 19. - №. 3. - C.
71.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ