В настоящее время сложно переоценить роль искусственного интеллекта в современном мире. Изобилие форм и областей применения демонстрирует силу и огромные возможности машинного обучения: от роботов,
побеждающих международных гроссмейстеров в шахматы, до автопилотируемых девайсов и автоматизированных игроков на фондовых рынках.
Большое количество исследований в научном мире, связанных с машинным обучением, ведется в области здравоохранения. Вопросы медицины вряд ли когда-либо потеряют свою важность, так как одной из основных целей современного общества является улучшение качества жизни, что
тесно связано со здоровьем населения планеты. Именно поэтому актуально
проводить исследования в области машинного обучения, связанные медициной, и разрабатывать программы и алгоритмы, способствующие развитию здравоохранения.
Разработанные инструменты медицинской диагностики не могут заменить всю работу врача. Это было бы рискованно и неэтично полагаться на пусть даже хорошо разработанный искусственный интеллект. Однако подобные программы могут существенно помочь доктору и ускорить зачастую длительный процесс диагностирования пациентов. Применение подобных инструментов необходимо, когда постановка диагноза усложняется большим количеством медицинских данных или редким заболеванием.
В данной выпускной квалификационной работе создавалась система автоматизированной медицинской диагностики. Ее работа демонстрируется на примере анализа голоса и речи пациентов с подозрением на заболевание Паркинсона. В настоящее время данная болезнь неизлечима и сложно диагностируется на ранних этапах. Поэтому для демонстрации работы системы была выбрана именно она.
С использованием современных технологий было разработано веб-приложение, с помощью которого лаборант, принимающий анализы у пациентов, мог бы пользоваться системой, получая результаты анализов в короткие сроки.
В результате проделанной работы была спроектирована и разработана система автоматизированной медицинской диагностики. Для достижения этой цели был проведен сравнительный анализ эффективности метода
опорных векторов, метода дерева решений, метода k наиближайших соседей и многослойной нейронной сети. По результатам анализа, наилучший показатель среднего гармонического Precision и Recall был у многослойной
нейронной сети. На ее основе и было разработано веб-приложение. Демоверсию программы можно протестировать на сайте:
https://smartmed2017.herokuapp.com.
На данный момент приложение обладает набором функций для лаборанта, принимающего анализы у пациентов. Лаборант может узнать диагноз, загрузив в систему результаты анализа, просмотреть результаты уже
проведенных анализов, добавить данные для нового, еще не зарегистрированного в системе вида анализа.
В ходе дальнейшей работы планируется добавить новые модели пользователей: доктор и пациент; расширить для них функционал приложения. Улучшить работу нейронной сети: эмпирическим путем — с помощью
скользящего контроля — подобрать наилучшее количество скрытых слоев и нейронов внутри них
[1] Scikit-learn http://scikit-learn.org/stable/
[2] Wu X., Kumar V. Top 10 algorithms in data mining // Knowl Inf Syst,
2008. Vol. 14(1). P. 1–37
[3] Bishop C. M. Neural Networks for Pattern Recognition. 2 ed. Oxford:
Oxford University Press, 1995. 482 p.
[4] Madjarov G., Kocev D. An extensive experimental comparison of methods
for multi-label learning // Pattern Recognition, 2012. Vol. 45, P. 3084–
3104.
[5] Lewis D. D. Evaluating Text Categorization // Computer and Information
Science Dept., 1991. P. 312–318.
[6] Geisser S. Predictive Inference. Predictive Inference. New York: Chapman
and Hall, 1993. 240 p.
[7] Fowler M. Patterns of Enterprise Application Architecture. 1 ed. Boston:
Addison-Wesley, 2003. 533 p.
[8] Хо К., Харроп Р. Spring 3 для профессионалов. М.: Вильямс, 2013. 880
с.
[9] Bauer C., King G. Java Persistence with Hibernate. Greenwich: Manning,
2005. 841 p.
34[10] Erdogdu Sakar, B., Isenkul, M.Collection and Analysis of a Parkinson
Speech Dataset with Multiple Types of Sound Recordings // IEEE Journal
of Biomedical and Health Informatics, 2013. Vol. 17(4). P. 828–834.
[11] UCI — Machine Learning Repository https://archive.ics.uci.edu