ВВЕДЕНИЕ 3
ЦЕЛЬ И ЗАДАЧИ 4
МАШИННОЕ ОБУЧЕНИЕ 4
МАШИННОЕ ОБУЧЕНИЕ В МЕДИЦИНЕ 4
Random Forest 7
ОБЗОР НАРУШЕНИЙ АКТИВНОСТИ ГОЛОВНОГО МОЗГА 9
МЕТОДЫ 12
МАТРИЦА ПАРАМЕТРОВ 12
Параметры 13
ОПИСАНИЕ КЛАССОВ 15
МЕТОДЫ 15
СПИСОК ЛИТЕРАТУРЫ 78
В современном мире имеют широкое распространение заболевания, связанные с активностью головного мозга. Такие заболевания могут иметь психологическую природу (депрессия - около 121 миллиона [1]) и физиологическую (эпилепсия - около 65 миллионов людей всех возрастов [2]). Также с возрастов возрастом возрастает риск появления нарушений активности головного мозга, что вызывается появлением таких болезней как деменция [Ernst Niedermeyer, Fernando Lopes da Silva MD PhD- Electroencephalography _ basic principles, clinical applications, and related fields- Lippincott Williams & Wilkins (2005)].
Современная медицина может определить наличие заболеваний головного мозга с помощью молекулярного анализа [3,4], однако не каждый человек может позволить это себе. Следовательно, необходимо иметь предварительные исследования, позволяющие определить симптомы заболевания и вероятность наличия конкретного заболевания или группы заболеваний. Для этого можно использовать электроэнцефалографию (ЭЭГ).
Из-за сложного устройства головного мозга и биологии заболеваний (совокупность симптомов, биологических механизмов протекания, индивидуальности пациента) по ЭЭГ практически невозможно распознать болезнь с точностью в 100%, но можно точно установить здоров ли пациент или имеет какое-либо отклонение. Так, болезнь Альцгеймера (AD) и сосудистая деменция (VaD) имеют похожие клинические симптомы, но различные патофизиологические механизмы [7] и сравнение спектрограмм AD и VaD не покажут существенных визуальных различий.
На данный момент существует множество работ, которые предлагают различные способы классификации сигналов ЭЭГ, но в большинстве случаем случаев классификация происходит по небольшому количеству классов или на относительно небольшом количестве пациентов. Например, в работе [5] для классификации использовалось 6 параметров, более 16000 пациентов и больше 30000 записей, что не дало высокую точность (максимум около 80%), а в работе [6] были использованы записи только от 5 пациентов, и классификация происходит лишь по двум-трем классам (болезнь А, болезнь Б и контрольная группа).
В работе использовался алгоритм Random Forest Classification. Этот алгоритм уже применялся для классификации таких заболеваний как: seizure припадки [2, 13, Early Seizure Detection], epilepsy эпилепсия [12, 13], dementia деменция [Random forest to differentiate dementia], Alzheimer—болезнь Альцгеймера [Random forest to differentiate dementia]. В результате была показана достаточная точность для выбранных групп болезней. Однако, недостатком является то, что не было показано как точность классификации зависит от количество классов и как повлияет на точность обучение на абсолютно разных классах.
Помимо Random Forest для классификации используются другие алгоритмы, такие как Support Vector Machine и Neural Networks: seizure
припадки [2, 13, Early Seizure Detection], epilepsy эпилепсия [12, 13, Classification of EEG signals], Alzheimer болезнь Альцгеймера [Searching for signs of aging, Classification of Healthy Subjects], dementia—деменция [Classification of Healthy Subjects].
Цель и Задачи
Как уже упоминалось выше, большинство работ по классификации сигналов ЭЭГ проводятся на небольшом количестве заболеваний. Поэтому целью данной работы является создание метода классификации признаков ЭЭГ на наличие отклонений в активности головного мозга и влияния количества классов на точность при постоянных параметрах, с помощью алгоритма Random Forest.
К задачам относится:
• Обработка ЭЭГ сигналов и формирование входных параметров;
• Создание модели классификации на сформированных параметрах;
• Оценка точности обучающей выборки и тестовой;
• Предсказание классов тестовой выборки.