Введение 5
Глава 1. Одномерная модель распределения 6
1.1. Модель гамма-распределения 6
1.2. Оценка параметров гамма-распределения с помощью метода максимального правдоподобия (ММП) 7
1.3. Построение доверительных интервалов 7
1.4. Критерий хи-квадрат Пирсона для проверки согласия эмпирического распределения с теоретическим 8
Глава 2. Методы получения однородных выборок 11
2.1. Расстояние Кульбака-Лейблера 11
2.2. Информационные метрики 12
2.3. Симптомно-синдромальный подход к анализу данных 13
2.3.1. Результаты 15
2.4. Псевдорандомизация как статистический метод устранения систематических различий сравниваемых групп 18
2.5. Применение псевдорандомизации 21
Глава 3. Степенная модель 25
3.1. Модель степенного гамма-распределения 25
3.1.1. Синонимичные степенные гамма-распределения 25
3.2. Теорема Кульбака-Санова 27
3.3. Построение доверительных интервалов для параметров степенного распределения 30
3.4. Доверительные интервалы по методу максимума правдоподобия для параметров степенного распределения 31
3.5. Сравнение параметров степенного гамма-распределения для групп ... 33
Глава 4. Двумерная модель 36
4.1. Обоснование модели двумерного гамма-распределения 36
4.2. Вывод плотности двумерного гамма-распределения 39
4.3. Исследование изменения состояния пациентов, проходящих лечение от
наркомании 41
4.3.1. Анализ изменения содержания фермента АЛТ в группах, принимавших плацебо и налтрексон 42
4.3.2. Анализ изменения содержания фермента АСТ в группах, принимавших плацебо и налтрексон 45
4.3.3. Анализ изменения содержания фермента АЛТ в группах, которым был назначен налтрексон и налтрексон-имплант 47
4.3.4. Анализ изменения содержания фермента АОТ в группах, которым был назначен налтрексон и налтрексон-имплант 49
Заключение 52
Список литературы 53
Приложение А. Сравнение гистограм и плотностей 55
Приложение Б. Графическая диагностика баланса 58
Медико-биологические системы обладают свойством изменчивости. При анализе подобных систем интерес может представлять изучение динамики развития биологических процессов. Сами наблюдаемые данные обычно характеризуются наличием большого числа признаков. Если эти признаки являются категориальными, то их обработка невозможна с помощью линейных статистических методов.
В данной работе рассмотрены методы исследования систем с большим числом факторов с точки зрения сбалансированности. Первый такой инструмент — симптомно-синдромальный анализ, второй — псевдорандомизация. Второй метод получил широкое распространение в медицинских исследованиях благодаря простоте своего применения. Рассмотрению и применению этих методов на практике посвящена глава 2.
Вопросу поиска модели, наиболее точно удовлетворяющей особенностям рассматриваемой системы, посвящены остальные три главы. Базовая модель одномерного гамма-распределения, ее свойства, способы получения оценок параметров и проверки гипотезы о подчинении теоретическому закону распределения приведены в главе 1. В ситуации, когда данные могут быть описаны несколькими моделями сразу имеет место неопределенность и синонимия. Так и в случае согласия с гамма-распределением может наблюдаться согласие с целым семейством степенных гамма-распределений. Проблема поиска наилучшего представителя этого семейства рассматривается в главе 3.
Модель двумерного гамма распределения, рассмотренная в главе 4, была предложена Н. П. Алексеевой. Эта модель может быть полезна для изучения динамики процесса, который отражают изучаемые данные. Так же в главе 4 приведено применение модели к реальным данным на примере показателей состояния организма наркоманов, проходящих реабилитацию. Для пациентов известна динамика показателей, отвечающих за состояние организма и тяги к наркотическим средствам. Пациентов так же можно разделить на три группы в зависимости от получаемого лекарственного препарата. Подробное описание изучаемых признаков находится в разделе 4.3. С помощью модели исследовались значимость и направленность изменений показателей состояния здоровья, как в зависимости от времени измерения, так и от вида лечения или лекарственного препарата, которое получает пациент.
В работе были рассмотрены три модели: одномерное гамма-распределение, степенное гамма-распределение и двумерное гамма-распределение. Приведены способы получения оценок параметров распределения. В частности для двумерного распределения построена плотность распределения, которая затем используется для получение оценок максимального правдоподобия.
Практическая часть работы представляет собой изучение изменения содержания ферментов печени АЛТ и АСТ пациентов, проходивших лечении от наркотической зависимости. Для корректного сравнения разных групп пациентов (принимавших разный препарат) необходимо исключить влияние сопутствующих факторов. С помощью симптомно-синдромального анализа можно убедиться, что группы однородны по пред-ставленным признакам. А с помощью метода псевдорандомизации можно добиться сбалансированности групп. Эти методы были применены до основного анализа динамики содержания ферментов.
Основной анализ включал: проверку согласия с гамма-распределением с помощью критерия Пирсона (p.value > 0.5) и boostrap выборок, получение оценок параметров распределения по методам моментов и максимума правдоподобия, построение доверительных интервалов для оценок параметров двумерного распределения. После сравнения интервальных оценок получено различие на уровне значимости 0.2 для параметра экстенсивности фермента АСТ для пациентов, получавших плацебо и препарат налтрексон.