Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА АВТОМАТИЧЕСКИХ МЕТОДОВ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ О ПОБОЧНЫХ РЕАКЦИЯХ ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ ИЗ ТЕКСТОВ СОЦИАЛЬНЫХ СЕТЕЙ

Работа №44094

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы50
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
234
Не подходит работа?

Узнай цену на написание


СОДЕРЖАНИЕ 1
ВВЕДЕНИЕ 1
2. ОБЗОР РАБОТ 5
3. МОДЕЛЬ NEURONER 8
3.1 Общая архитектура модели NeuroNER 9
3.2 Слой векторного представление токена 10
3.3 Двунаправленный LSTM 11
3.4 Метод условных случайных полей 11
4. МОДЕЛЬ INTERACTIVE ATTENTION NETWORK 13
5.1 Общая архитектура модели IAN 13
5. ДАННЫЕ 17
5.1 Корпус CADEC 18
5.2 Корпус PsyTAR 26
5.2.1 Классификация предложений 27
5.2.2 Выявление сущностей 29
5.3 Формат данных Conll 31
6. АРХИТЕКТУРА СИСТЕМЫ ИЗВЛЕЧЕНИЯ ПОБОЧНЫХ
ЭФФЕКТОВ 34
6.1 Извлечение сущностей 35
6.2 Классификация сущностей 36
6.3 Оценка результатов 38
7. ЭКСПЕРИМЕНТЫ И РЕЗУЛЬТАТЫ 39
8. ЗАКЛЮЧЕНИЕ 43
ГЛОССАРИЙ 44
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 45

Выявление побочных эффектов является одной из основных задач в фармацевтической индустрии. Перед выпуском лекарственного препарата проводится ряд клинических испытаний с целью выявить побочные эффекты. Однако клинические испытания не всегда позволяют обнаружить побочные эффекты, так как некоторые из них проявляются только после продолжительного использования и действуют только на определенной группе пациентов, не участвовавших в клинических исследованиях. В период с 1950 по 2014 год 462 лекарственных препарата были изъяты из продаж [1]. Более того, побочные эффекты, обнаруженные после выпуска лекарства в продажу могут иметь серьезные последствия и привести к летальному исходу [2-5]. Таким образом, обнаружение побочных эффектов после выпуска лекарства является важной проблемой для фармаконадзора.
Одним из методов обнаружения побочных эффектов лекарственных препаратов, поступивших в продажу, является анализ данных из социальных сетей [6]. Пользователи часто пишут о своих проблемах связанных с использованием лекарств в таких социальных сетях как Твиттер и на различных форумах на тему здоровья и медикаментов. Обработка такого объема информации вручную не представляется возможной, в связи с этим для получения информации о побочных эффектах широкое распространение получили методы обработки текстов на естественном языке [7-10].
Одной из задач обнаружения побочных эффектов является классификация информации, относящейся к болезни. Это необходимо,
чтобы удалить ненужную информацию и обнаружить упоминания о побочных эффектах. При решении данной задачи предполагается, что в тексте выделены сущности, относящиеся к состоянию здоровья и системам классификации необходимо выделить среди сущностей определенные группы: побочные эффекты, показания к применению, симптомы и т.д. Существующие работы оценивали системы классификации на правильной разметке, полученной вручную. При таком подходе не учитываются ошибки, возникающие на этапе выделения сущностей.
Целью данной работы является разработка метода автоматического извлечения информации о побочных эффектах, комбинирующего две модели: на первом этапе извлекаются сущности, связанные с состоянием здоровья при помощи модели NeuroNer [11], на втором этапе производится бинарная классификация выделенных сущностей с целью определить побочные эффекты при помощи нейронной сети с интерактивным вниманием Interactive Attention Neural Network (IAN) [12]. В качестве корпусов в работе использовались CSIRO Adverse Drug Event Corpus (CADEC), состоящий из отзывов пользователей о лекарственных препаратах с сайта askapatient.com [13], и корпус отзывов пациентов о психиатрических лекарственных средствах PsyTAR [14].
Для достижения цели были поставлены следующие задачи:
1) Препроцессинг данных. Необходимо перевести используемые в использующийся системами формат.
2) Объединить модели NeuroNER и IAN в единую модель.
3) Оценить результаты работы системы NeuroNER на корпусах PsyTAR и CADEC с выделенными сущностями ADR, DIS и О
4) Оценить результаты работы системы NeuroNER на корпусах PsyTAR и CADEC с сущностями DIS и О, где DIS объединяет в себе сущности ADR и DIS.
5) Оценить результаты работы модели IAN на корпусах PsyTAR и CADEC с сущностями ADR и DIS.
6) Оценить результаты работы объединения модели NeroNER и IAN на корпусах PsyTAR и CADEC, где IAN принимает на вход результаты работы NeuroNER.
7) Провести сравнительный анализ полученных результатов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе была рассмотрена задача извлечения побочных эффектов из текстов социальных медиа. В рамках этой задачи, была оценена модель, состоящая из комбинации 2-х архитектур нейронных сетей: NeuroNER для извлечения сущностей, связанных со здоровьем пользователя, и IAN для классификации извлеченных сущностей на побочные эффекты и другие. Модель оценивалась на корпусах CADEC и PsyTAR. Проведенные эксперименты показали, что комбинирование моделей привело к ухудшению результата по сущности ADR, но к улучшению по сущности DIS по сравнению с результатами, полученными только при помощи IAN. При комбинации моделей результаты стали незначительно ниже для сущностей ADR на обоих корпусах, но значительно ниже для сущностей DIS, чем при использовании NeuroNER отдельно.
Дальнейшее направление исследований может быть связано с проверкой модели в условиях, когда обучающая и тестовая выборки будут принадлежать разным корпусам с описанием лекарственных препаратов различных групп.


1. Onakpoya, I. J. Post-marketing withdrawal of 462 medicinal products because of adverse
drug reactions: a systematic review of the world literature / I.J. Onakpoya, C.J. Heneghan, J.K. Aronson // BMC medicine. — 2016. — № 14.
2. Pirmohamed, M. Adverse drug reactions as cause of admission to hospital: prospective
analysis of 18 820 patients / M. Pirmohamed, S. James, S. Meakin, C. Green, A.K. Scott, T.J. Walley, K. Farrar, B.K. Park, A.M. Breckenridge // Bmj. — 2004. — № 329(7456). — C. 15-19.
3. Classen, D.C. Adverse drug events in hospitalized patients: excess length of stay, extra
costs, and attributable mortality / D.C. Classen, S.L. Pestotnik, R.S. Evans, J.F. Lloyd,
J.P. Burke // Jama. — 1997. — № 277(4). — C. 301-306.
4. Lazarou, J. Incidence of adverse drug reactions in hospitalized patients: a meta-analysis
of prospective studies / J. Lazarou, B.H. Pomeranz, P.N. Corey // Jama. — 1998. — № 279(15). — C. 1200-1205.
5. Bates, D.W. Incidence of adverse drug events and potential adverse drug events: implications for prevention / D.W. Bates, D.J. Cullen, N. Laird, L.A. Petersen, S.D. Small, D. Servi, G. Laflfel, B.J. Sweitzer, B.F. Shea, R. Hallisey // Jama. — 1995. — № 274(1). — C. 29-34
6. Sloane, R. Social media and pharmacovigilance: a review of the opportunities and challenges / R. Sloane, O. Osanlou, D. Lewis, D. Bollegala, S. Masked, M. Pirmohamed // British journal of clinical pharmacology. — 2015. — № 80(4). — C. 910-920.
7. Tutubalina, E. Automated prediction of demographic information from medical user reviews / E. Tutubalina, S. Nikolenko // Cham. — 2016. — C. 174-184.
8. Solovyev, V. Knowledge-driven event extraction in russian: corpus based linguistic resources / V. Solovyev, V. Ivanov // Computational intelligence and neuroscience. — 2016. — № 16.
9. Sayfullina, L. Android malware detection: Building useful representations / L. Sayfullina, E. Eirola, D. Komashinsky, P. Palumbo, J.Karhunen // IEEE International Conference on Machine Learning and Applications (ICMLA). — № 15. — 2016. — C. 201-206.
10. Ivanov, V. Extracting aspects, sentiment and categories of aspects in user reviews about restaurants and cars / V. Ivanov, E. Tutubalina, N. Mingazov, I. Alimova // Proceedings of International Conference Dialog. — 2015. — Volume 2. — C. 22-34.
11. Dernoncourt, F. NeuroNER: an easy-to-use program for named-entity recognition based on neural networks [Электронный ресурс] / F. Dernoncourt, J. Young Lee, P. Szolovits // 2017. — Режим доступа: https://arxiv.org/pdf/1705.05487.pdf
12. Alimova, I. Interactive Attention Network for Adverse Drug Reaction Classification /1. Alimova, V. Solovyev // Artificial Intelligence and Natural Language. — Springer. — 2018. — C. 36—48.
13. Karimi, S. A corpus of adverse drug event annotations / Metke-Jimenez, A., Kemp, M., Wang, C. // Journal of biomedical informatics — 2015. — № 55. — C. 73-81.
14. Jagannatha, A. Overview of the first natural language processing challenge for extracting medication, indication, and adverse drug events from electronic health record notes / A. Jagannatha, F. Liu, W. Liu, H. Yu // Drug safety — 2018. — C. 1-13.
15. Benton, A. Identifying potential adverse effects using the web: A new approach to medical hypothesis generation. / A.Benton, L. Ungar, S. Hill, S. Hennessy, J. Mao, A. Chung, C.E. Leonard, J.H. Holmes // Journal of biomedical informatics 44(8). — 2011. — P. 989-996.
16. Liu, X. Azdrugminer: an information extraction system for mining patient-reported adverse drug events in online patient forums. / X. Liu, H. Chen // International Conference on Smart Health. — Springer. — 2013. — P. 134-150.
17. Nikfarjam, A. Pattern mining for extraction of mentions of adverse drug reactions from user comments. / A. Nikfaijam, G.H. Gonzalez // American Medical Informatics Association. — AMIA Annual Symposium Proceedings. — 2011. — Vol. 2011. —P. 1019.
18. Na, J.C. Sentiment classification of drug reviews using a rule-based linguistic approach / J.C. Na, W.Y.M. Kyaing, C.S. Khoo, S. Foo, Y.K. Chang, Y.L. Theng // International Conference on Asian Digital Libraries. — Springer. — 2012. — P. 189-198.
19. Melzi, S. Patient’s rationale: Patient knowledge retrieval from health forums. / S. Melzi, A. Abdaoui, J. Aze, S. Bringay, P. Poncelet, F. Galtier// eTELEMED: eHealth, Telemedicine and Social Medicine. — 2014.
20. Sarker, A. Utilizing social media data for pharmacovigilance: a review. / A. Sarker, R. Ginn, A. Nikfaijam, K. OConnor, K. Smith, S. Jayaraman, T. Upadhaya, G. Gonzalez // Journal of biomedical informatics. — 54. — 2015. — P. 202-212.
21. Niu, Y. Analysis of polarity information in medical text. / Y. Niu, X. Zhu, J. Li, Hirst, G. // AMIA annual symposium proceedings. — Vol. 2005. — American Medical Informatics Association. — 2005. — P 570.
22. Bian, J. Towards large-scale twitter mining for drug-related adverse events. / J. Bian, U. Topaloglu, F. Yu // Proceedings of the 2012 international workshop on Smart health and wellbeing. — ACM. — 2012. — P. 25-32.
23. Alimova, I. Automated detection of adverse drug reactions from social media posts with machine learning. / I. Alimova, E. Tutubalina // International Conference on Analysis of Images, Social Networks and Texts. — Springer. — 2017. — P. 3-15.
24. Aramaki, E. Extraction of adverse drug effects from clinical records. / E. Aramaki, Y. Miura, M. Tonoike, T. Ohkuma, H. Masuichi, K. Waki, K. Ohe // Medlnfo. — 2010. — P. 739-743.
25. Miftahutdinov, Z. Identifying disease-related expressions in reviews using conditional random fields. / Z. Miftahutdinov, E. Tutubalina, A. Tropsha // Computational Linguistics and Intellectual Technologies: Papers from the Annual conference Dialogue 1(16). —2017. —P. 155-166.
26. Hou, Y National adr monitoring system in china. / Hou, Y., Li, X., Wu, G., Ye, X. //Drug Safety. — 39(11). — 1043-1051, — 2016.
27. Dai, H.J. Feature engineering for recognizing adverse drug reactions from twitter posts. / H.J. Dai, M. Touray, J. Jonnagaddala, S. Syed-Abdul // Information 7(2). — 27. — 2016.
28. Sarker, A. Social media mining shared task workshop / A. Sarker, A. Nikfarjam, G. Gonzalez // Proceedings of the Pacific Symposium on Biocomputing — 2016. — C. 581-592.
29. Rastegar-Mojarad, M. Detecting signals in noisy data-can ensemble classifiers help identify adverse drug reaction in tweets / M. Rastegar-Mojarad, R. Komandur Elayavilli, Y. Yu, H. Hiu // Proceedings of the Social Media Mining Shared Task Workshop at the Pacific Symposium on Biocomputing — 2016.
30. Zhang, Z. An ensemble method for binary classification of adverse drug reactions from social media / Z. Zhang, J. Nie, X. Zhang // Proceedings of the Social Media Mining Shared Task Workshop at the Pacific Symposium on Biocomputing — 2016.
31. Ofoghi, B. Read-biomed-ss: Adverse drug reaction classification of microblogs using emotional and conceptual enrichment / B. Ofoghi, S. Siddiqui, K. Verspoor // Proceedings of the Social Media Mining Shared Task Workshop at the Pacific Symposium on Biocomputing — 2016.
32. Jonnagaddala, J. Binary classification of twitter posts for adverse drug reactions / J. Jonnagaddala, T.R. Jue, H. Dai // Proceedings of the Social Media Mining Shared Task Workshop at the Pacific Symposium on Biocomputing — 2016. — C. 4-8.
33. Egger, D. Adverse drug reaction detection using an adapted sentiment classifier / D. Egger, F. Uzdilli, M. Cieliebak, L. Derczynski // Proceedings of the Social Media Mining Shared Task Workshop at the Pacific Symposium on Biocomputing — 2016.
34. Miranda D.S. Automated detection of adverse drug reactions in the biomedical literature using convolutional neural networks and biomedical word embeddings. [Электронный ресурс] / D.S. Miranda // 2018. — Режим доступа:
https://arxiv.org/pdf/1804.09148.pdf
35. Huynh T. Adverse drug reaction classification with deep neural networks. / T. Huynh, He Y., Willis A., Riiger S. // Proceedings of COLING. — 2016. — 26th International Conference on Computational Linguistics: Technical Papers. — C. 877-887.
36. Chowdhury, S. Multi-task pharmacovigilance mining from social media posts. [Электронный ресурс] / S. Chowdhury, C. Zhang, P.S. Yu // 2018. — Режим доступа: https://arxiv.org/pdf/1801.06294.pdf
37. de la Pena, S. Adrspanishtool: a tool for extracting adverse drug reactions and indications. / , Segura-Bedmar, L, Martinez, P., Martinez, J.L./ Procesamiento del Lenguaje Natural. — 53. — 2014. — P. 177-180.
38. Oliveira, J.L. The eu-adr web platform: delivering advanced pharmacovigilance tools. / J.L. Oliveira, P. Lopes, T. Nunes, D. Campos, S. Boyer, E.Ahlberg, E.M. Mulligen, J.A. Kors
40. K. Greff Lstm: A search space odyssey / Greff K., Srivastava R. K., Koutnik J., Steunebrink B. R., Schmidhuber J. // IEEE Trans Neural Netw Learn Syst. doi: 10.1109/TNNLS.2016.2582924 — 2016.
42. Stenetorp P. Brat: a web-based tool for NLP-assisted text annotation. /Р. Stenetorp, S. Pyysalo, G. Topic, T. Ohta, S. Ananiadou, J. Tsujii// The Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics, Avignon, France. — 2012. — C. 102-107.

Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ