ВВЕДЕНИЕ 3
ЦЕЛЬ И ЗАДАЧИ 4
МАШИННОЕ ОБУЧЕНИЕ 4
МАШИННОЕ ОБУЧЕНИЕ В МЕДИЦИНЕ 4
Random Forest 7
ОБЗОР НАРУШЕНИЙ АКТИВНОСТИ ГОЛОВНОГО МОЗГА 9
МЕТОДЫ 12
МАТРИЦА ПАРАМЕТРОВ 12
Параметры 13
ОПИСАНИЕ КЛАССОВ 15
МЕТОДЫ 15
СПИСОК ЛИТЕРАТУРЫ 78
В современном мире имеют широкое распространение заболевания, связанные с активностью головного мозга. Такие заболевания могут иметь психологическую природу (депрессия - около 121 миллиона [1]) и физиологическую (эпилепсия - около 65 миллионов людей всех возрастов [2]). Также с возрастов возрастом возрастает риск появления нарушений активности головного мозга, что вызывается появлением таких болезней как деменция [Ernst Niedermeyer, Fernando Lopes da Silva MD PhD- Electroencephalography _ basic principles, clinical applications, and related fields- Lippincott Williams & Wilkins (2005)].
Современная медицина может определить наличие заболеваний головного мозга с помощью молекулярного анализа [3,4], однако не каждый человек может позволить это себе. Следовательно, необходимо иметь предварительные исследования, позволяющие определить симптомы заболевания и вероятность наличия конкретного заболевания или группы заболеваний. Для этого можно использовать электроэнцефалографию (ЭЭГ).
Из-за сложного устройства головного мозга и биологии заболеваний (совокупность симптомов, биологических механизмов протекания, индивидуальности пациента) по ЭЭГ практически невозможно распознать болезнь с точностью в 100%, но можно точно установить здоров ли пациент или имеет какое-либо отклонение. Так, болезнь Альцгеймера (AD) и сосудистая деменция (VaD) имеют похожие клинические симптомы, но различные патофизиологические механизмы [7] и сравнение спектрограмм AD и VaD не покажут существенных визуальных различий.
На данный момент существует множество работ, которые предлагают различные способы классификации сигналов ЭЭГ, но в большинстве случаем случаев классификация происходит по небольшому количеству классов или на относительно небольшом количестве пациентов. Например, в работе [5] для классификации использовалось 6 параметров, более 16000 пациентов и больше 30000 записей, что не дало высокую точность (максимум около 80%), а в работе [6] были использованы записи только от 5 пациентов, и классификация происходит лишь по двум-трем классам (болезнь А, болезнь Б и контрольная группа).
В работе использовался алгоритм Random Forest Classification. Этот алгоритм уже применялся для классификации таких заболеваний как: seizure припадки [2, 13, Early Seizure Detection], epilepsy эпилепсия [12, 13], dementia деменция [Random forest to differentiate dementia], Alzheimer—болезнь Альцгеймера [Random forest to differentiate dementia]. В результате была показана достаточная точность для выбранных групп болезней. Однако, недостатком является то, что не было показано как точность классификации зависит от количество классов и как повлияет на точность обучение на абсолютно разных классах.
Помимо Random Forest для классификации используются другие алгоритмы, такие как Support Vector Machine и Neural Networks: seizure
припадки [2, 13, Early Seizure Detection], epilepsy эпилепсия [12, 13, Classification of EEG signals], Alzheimer болезнь Альцгеймера [Searching for signs of aging, Classification of Healthy Subjects], dementia—деменция [Classification of Healthy Subjects].
Цель и Задачи
Как уже упоминалось выше, большинство работ по классификации сигналов ЭЭГ проводятся на небольшом количестве заболеваний. Поэтому целью данной работы является создание метода классификации признаков ЭЭГ на наличие отклонений в активности головного мозга и влияния количества классов на точность при постоянных параметрах, с помощью алгоритма Random Forest.
К задачам относится:
• Обработка ЭЭГ сигналов и формирование входных параметров;
• Создание модели классификации на сформированных параметрах;
• Оценка точности обучающей выборки и тестовой;
• Предсказание классов тестовой выборки.
1. Behshad Hosseinifarda. Classifying depression patients and normal subjects using machine learning techniques and nonlinear features from EEG signal / Behshad Hosseinifarda, Mohammad Hassan Moradi, Reza Rostami // Computer Methods and Programs in Biomedicine. - 2013. - Volume 109. -
Issue 3. - p.339-345
2. Suvadeep Bose. EEG signal analysis for Seizure detection using Discrete Wavelet Transform and Random Forest / Suvadeep Bose, B.Tech, NIT Warangal, V Rama, Assistant Professor, NIT Warangal, and Dr. C.B.Rama Rao, Associate Professor, NIT Warangal // International Conference on Computer and Applications (ICCA). - 2017. - p.369-378.
3. Keiro Shirotani. Paradigm shift from diagnosing patients based on common symptoms to categorizing patients into subtypes with different pathogenic mechanisms to guide treatment for Alzheimer's disease / Keiro Shirotani, Masashi Asai, Nobuhisa Iwata // The Journal of Biochemistry. - 2016. - p.1¬8.
4. Carly Oboudiyat. Cerebrospinal fluid markers detect Alzheimer's disease in nonamnestic dementia / Carly Oboudiyat, Tamar Gefen, Eleni Varelas, Sandra Weintraub, Emily Rogalski, Eileen H. Bigio, M.-Marsel Mesulam // Alzheimer's & Dementia. - 2017. - Volume 13. - Issue 5. - p.598-601.
5. S. Yang. Semi-Automated annotation of signal events in clinical EEG data / S. Yang, S. Lopez, M. Golmohammadi, I. Obeid and J. Picone // Signal Processing in Medicine and Biology Symposium (SPMB). - 2016. - p.?-?.
6. Alexandros T. Tzallas. Classification of EEG signals using feature creation produced by grammatical evolution / Alexandros T. Tzallas, Ioannis Tsoulos, Markos G. Tsipouras, Nikolaos Giannakeas, Iosif Androulidakis and Elena Zaitseva // Telecommunications Forum (TELFOR). - 2016. - p.?-?.
7. Emanuel Neto. EEG spectral features discriminate between Alzheimer's and vascular dementia / Emanuel Neto, Elena A. Allen Harald Aurlien, Helge Nordby,Tom Eichele // Frontiers in Neurology. - 2015. - Volume 6. - Article 25. - p.1-9.
8. Meenakshi Dauwana. Random forest to differentiate dementia with Lewy bodies from Alzheimer's disease / Meenakshi Dauwana, Jessica J. van der Zandec, Edwin van Dellena, Iris E. C. Sommerb, Philip Scheltensc, Afina W. Lemstrac , Cornelis J. Stam // Diagnostic Assessment & Prognosis. - 2016. - p.1-8.
9. Chanakya Reddy Patti. Application of Random Forest Classifier for Automatic Sleep Spindle Detection / Chanakya Reddy Patti, Sobhan Salari Shahrbabaki, Chamila Dissanayaka, Dean Cvetkovic // Biomedical Circuits and Systems Conference (BioCAS). - 2015. - p.?-?.
10.Sylvain Arlot. Analysis of purely random forests bias / Sylvain Arlot, Robin Genuer // ???. - 2014. - p1-57 .
11. Leo Breiman. Random Forest / Leo Breiman // ??? - 2001. - p.1-33.
12. J.E. Le Douget. Surface and intracranial EEG spike detection based on discrete wavelet decomposition and random forest classification / J.E. Le
Douget, A. Fouad, M. Maskani Filali, J. Pyrzowski and M. Le Van
Quyen // Engineering in Medicine and Biology Society (EMBC). - 2017.
13. Md Mursalin. Automated Epileptic Seizure Detection Using Improved
Correlation-based Feature Selection with Random Forest Classifier / Md Mursalin, Yuan Zhang,mYuehui Chen, Nitesh V. Chawla // Neurocomputing. - 2017. - Volume 241. - p.204-214.