Введение 4
Глава 1. Постановка задачи 5
1.1. Исследование эквивалентности перестановочных критериев 5
1.2. Постановка задачи сравнения методов проверки гипотез с помощью стохастического моделирования 7
Глава 2. Анализ численных результатов 9
2.1. Нормальное распределение А(д,а) 9
2.2. Распределение Коши (т0,д) 9
2.3. Распределение Стьюдента t(n, Xq) 10
2.4. Распределение Фишера F(di,d2) 11
2.5. Бета-распределение В (о, 0) 12
2.6. Гамма-распределение G(k, О') 13
2.7. Равномерное распределение U(а,Ъ) 13
2.8. Распределение Вейбулла W(k,X) 14
2.9. Резюме 14
Заключение 16
Список литературы 17
Приложение А. Табличные результаты мощности тестов 18
Приложение Б. Графическое представление мощности тестов 25
Приложение В. Реализация алгоритма 32
Задача сравнения двух распределений является классической задачей математической статистики и имеет большой теоретический и практический интерес. Хорошо известно (см., например, [1]), что в случае, когда оба распределения являются нормальными и имеют одинаковые дисперсии, классический тест Стыодспта(Стсст) обладает рядом оптимальных свойств, по па практике распределения часто таковыми не являются и, вообще говоря, неизвестны. При этом сильную конкуренцию t-тесту составляют пепараметрические тесты, важным классом которых являются тесты, основанные па перестановках.
В работе представлены результаты исследования мощности четырех перестановочных тестов, а так же тестов Стыодспта, Колмогорова-Смирнова и Маппа-Уитпи. Исследования были проведены для широкого класса стандартных распределений, которые отличались либо отдельными параметрами, либо сдвигом плотности, либо утяжелением хвостов распределения.
Неперестаповочпые тесты были выбраны из следующих соображений: тест Колмогорова-Смирнова — наиболее универсальный пепараметрический тест, основанный, в случае проверки однородности двух выборок, па сравнении эмпирических функций распределения. Тест Маппа-Уитпи — пепараметрический ранговый тест, позволяющий выявлять различия распределений даже для малых объемов выборок и, по сообщениям стандартных руководств, — наиболее мощный пепараметрический тест в случае распределений, отличающихся только сдвигом.
Работа осуществлена в рамках темы СПбГУ 6.38.435.2015.
Стохастическое моделирование является универсальным методом исследования, который позволяет оценивать эффективность статистических процедур в случаях, когда это не удается сделать аналитическими методами.
В работе были реализованы алгоритм и программа для численного исследования мощности перестановочных тестов и классических тестов Стьюдента, Колмогорова- Смирнова и Манна-Уитни для решения задачи проверки гипотезы о равенстве двух распределений. Полученные результаты представлены в виде таблиц мощностей и с помощью графиков. Таблицы мощностей позволяют увидеть точные результаты моделирования, а графики — наглядно сравнить мощности тестов.
Опираясь на полученные численные результаты можно заключить, что тест, основанный на сумме модулей разностей элементов двух выборок, в большинстве случаев превосходит по мощности все другие рассмотренные тесты. Особенно велико преимущество этого теста, если центры сравниваемых распределений совпадают.
Среди неперестановочных тестов тест Колмогорова-Смирнова является наиболее универсальным, его разумно использовать в случае, когда нет никакой априорной информации о распределениях. В случае только сдвига плотности он уступает в мощности тесту Манна-Уитни в среднем 10% мощности, однако при отсутствии сдвига преимущество теста Колмогорова-Смирнова очень велико.
1. Леман Э. Проверка статистических гипотез, — М. : Наука, 1979, — 408 с.
2. Sirsky М. On the Statistical Analysis of Functional Data Arasing from Designed Experiments : Ph. D. thesis / M. Sirsky ; University of Manitoba. — 2012.
3. New insights on permutation approach for hypothesis testing on functional data / L. Corain, V. Melas, A. Pepelyshev, L. Salmaso // Advances in Data Analysis and Classification. — 2013. — P. 1-18.
4. Statistical methods for comparative phenomics using high-throughput phenotype microarrays / J. Sturino, I. Zorych, B. Mallick et al. // The International Journal of Biostatistics. — 2010. — Vol. 6. — P. 3-4.
5. Cox D., Lee J. Pointwise testing with functional data using the Westfall-Young randomization method // Biometrika. — 2008. — Vol. 95. — P. 621-634.
6. Ramsay J., Hooker G., Graves S. Functional Data Analysis with R and Matlab. — 2009.
7. Мелас В.Б., Сальников Д.И., Гудулина А.О. Численное сравнение перестановочных и классических методов проверки статистических гипотез // Вестник СПбГУ, сер.1, вып.З. — готовится к публикации.
8. Keller-McNulty S., Higgins J. Effect of tail weight and outliers on power and type-I error of robust permutation tests for location // Communications in Statistics - Simulation and Computation. — 1987. — Vol. 16. — P. 17-35.
9. Некоторые оценки параметров распределения Коши / Е.Д. Галкина, С.В. Лещева, Н.С. Лукичев, В.Е. Рыков // Труды НГТУ им. Р.Е. Алексеева .V"3. — 2015.
10. Edgington Е. S. Approximate randomization tests // The Journal of Psychology. — 1969. - Vol. 72. - P. 143-149.
11. Good P. I. Resampling Methods: A Practical Guide to Data Analysis. — 3 edition.— Birkhauser, 2006.