Введение 3
Постановка задачи 5
Обработка материала 7
Глава 1. Дискриминантный анализ 9
1.1 Принцип дискриминации 9
1.2 Канонический дискриминантный анализ 10
1.2.1 Дискриминантные функции 10
1.2.2 Коэффициенты канонической дискриминантной функции 11
1.2.3 Ограничения 16
1.3 Пошаговый дискриминантный анализ 17
1.3.1 Отбор информативных признаков 17
1.3.2 Критерии отбора 18
1.3.3 Алгоритм Forward Stepwise 21
Глава 2. Результаты исследования 23
Пошаговый дискриминантный анализ 23
Канонический анализ 25
Визуализация 27
Классификация наблюдений 29
Выводы 32
Заключение 34
Список литературы 35
Приложения 36
В настоящее время медицина в своих исследованиях все чаще обращается к достижениям математических наук, которые позволяют точнее выявлять и трактовать многообразные скрытые связи основных клинико-лабораторных параметров, а также их комбинаций.
Реактивный артрит - воспалительное негнойное заболевание суставов, причины возникновения которого доподлинно неизвестны. Замечено, что это заболевание развивается одновременно или в течение 2-4 недель после перенесенной внесуставной инфекции [1]. Данное заболевание не связано с распространением инфекции по организму и её попаданием в сустав, инфекция здесь играет роль только пускового фактора. То есть артрит - это реакция организма на микроб. Существует предположение, что в основе реактивного артрита лежит генетически детерминированная аномалия иммунной системы (заболевание в 50 раз чаще диагностируется у носителей антигена гистосовместимости HLA-B27 [2]), которая реализуется при инфицировании некоторыми микроорганизмами. Инфекция, вызывающая развитие реактивного артрита, обычно поражает носоглотку, мочевыводящие пути и половые органы, желудочно-кишечного тракт. Таким образом, можно сделать предположение о природе возникновения реактивного артрита и выделить четыре «формы» болезни, разделенные по этиологическому принципу (типу инфекции-возбудителя): носоглоточная, кишечная, урогенитальная и группа с не выявленным возбудителем.
В нашем распоряжении имеются результаты клинического исследования больных реактивным артритом, представленные в виде табличных данных. В таблице отражена информация по 104 индивидуумам, каждый из которых характеризуется набором из 58 признаков. Признаками здесь являются клинические, лабораторные и категориальные показатели, зафиксированные при обращении в медицинское учреждение.
С математической точки зрения, основная цель исследования состоит в нахождении способа, позволяющего на основании этих характеристик определить группу, к которой относится каждый из объектов в имеющейся совокупности. Сопутствующей задачей является задача снижения размерности исходного пространства признаков, или, иначе говоря, формирование оптимального множества признаков, по которым различение по группам внутри имеющегося набора данных осуществлялась бы наиболее верно.
С медицинской точки зрения, целью данной работы является выявление наиболее значимых признаков, на основании значений которых можно было бы с минимальной вероятностью ошибки определить форму реактивного артрита у любого нового пациента.
В данной выпускной квалификационной работе был рассмотрен один из видов многомерного статистического анализа – дискриминантный анализ, с помощью которого производилось исследование медицинских данных на примере больных реактивным артритом, возникающим после некоторых инфекций. Реактивный артрит характеризуется классическими отличиями от других воспалительных заболеваний суставов. При этом, важным вопросом остается поиск возможных клинико-лабораторных различий в группах пациентов в зависимости от инфекции после которой возникает заболевание. В результате применения методов канонического дискриминантного анализа удалось установить отличие группы реактивного артрита, развившегося после достоверной кишечной инфекции, от других форм. Значимого различения в остальных группах, сформированных по этиологическому фактору (после урогенитальной, носоглоточной инфекции или без достоверного этиологического фактора), выявлено не было. С помощью пошагового дискриминантного анализа были отобраны наиболее значимые, с точки зрения различения типов заболевания, характеристики. Результаты исследования могут быть использованы при дальнейшем изучении патогенеза реактивного артрита.
Реактивные артриты. Методические рекомендации / Ставрополь. Изд. СГМА, 2003. 2-10 с
[2] Причины реактивного артрита. https://health.mail.ru/disease/reaktivnyi_artrit/
[3] Mark S. Aldenderef, Roger K. Blashfield. Cluster Analysis (Second Printing, 1985) p.143-146
[4] William R.Klecka. Discriminant Analysis (Seventh Printing, 1986) p.89-109
[5] Медик В.А., Токмачев М.С. Статистика здоровья населения и здравоохранения: учеб.пособие / М.: Финансы и статистика, 2009. 104 с
[6] Lachenbruch P.A. Some unsolved practical problems in discriminant analysis. (Chapel Hill: University of North Carolina, 1975) p.10
[7] Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA” // Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики», 2007. 74-88 с
[8] Ланг Т.А. Как описывать статистику в медицине / М.: Практическая медицина, 2011. 333 с