Задача сравнения двух распределений является классической задачей математической статистики и имеет большой теоретический и практический интерес. Хорошо известно (см,, например, [1]), что в случае, когда оба распределения являются нормальными и имеют одинаковые дисперсии, классический тест Стьюдента(t-тест) обладает рядом оптимальных свойств, но на практике распределения часто таковыми не являются и, вообще говоря, неизвестны. При этом сильную конкуренцию t-тесту составляют непараметрические тесты, важным классом которых являются тесты, основанные на перестановках,
В работе представлены результаты исследования мощности четырех перестановочных тестов, а так же тестов Стьюдента, Колмогорова-Смирнова и Манна-Уитни, Исследования были проведены для широкого класса стандартных распределений, которые отличались либо отдельными параметрами, либо сдвигом плотности, либо утяжелением хвостов распределения.
Неперестановочные тесты были выбраны из следующих соображений: тест Колмогорова-Смирнова — наиболее универсальный непараметрический тест, основанный, в случае проверки однородности двух выборок, на сравнении эмпирических функций распределения. Тест Манна-Уитни — непараметрический ранговый тест, позволяющий выявлять различия распределений даже для малых объемов выборок и, по сообщениям стандартных руководств, — наиболее мощный непараметрический тест в случае распределений, отличающихся только сдвигом.
Работа осуществлена в рамках темы СПбГУ 6,38,435,2015,
Стохастическое моделирование является универсальным методом исследования, который позволяет оценивать эффективность статистических процедур в случаях, когда это не удается сделать аналитическими методами,
В работе были реализованы алгоритм и программа для численного исследования мощности перестановочных тестов и классических тестов Стьюдента, Колмогорова- Смирнова и Манна-Уитни для решения задачи проверки гипотезы о равенстве двух распределений. Полученные результаты представлены в виде таблиц мощностей и с помощью графиков. Таблицы мощностей позволяют увидеть точные результаты моделирования, а графики — наглядно сравнить мощности тестов.
Опираясь на полученные численные результаты можно заключить, что тест, основанный на сумме модулей разностей элементов двух выборок, в большинстве случаев превосходит по мощности все другие рассмотренные тесты. Особенно велико преимущество этого теста, если центры сравниваемых распределений совпадают.
Среди неперестановочных тестов тест Колмогорова-Смирнова является наиболее универсальным, его разумно использовать в случае, когда нет никакой априорной информации о распределениях, В случае только сдвига плотности он уступает в мощности тесту Манна-Уитни в среднем 10% мощности, однако при отсутствии сдвига преимущество теста Колмогорова-Смирнова очень велико.
1, Леман Э, Проверка статистических гипотез, — М, : Наука, 1979, — 408 е,
2, Sirskv М, On the Statistical Analysis of Functional Data Arasing from Designed Experiments : Ph, D, thesis / M, Sirskv ; University of Manitoba, — 2012,
3, New insights on permutation approach for hypothesis testing on functional data / L, Corain, V, Melas, A, Pepelvshev, L, Salmaso // Advances in Data Analysis and Classification, — 2013, — P, 1-18,
4, Statistical methods for comparative phenomies using high-throughput phenotype mieroarravs / J, Sturino, I, Zorveh, B, Malliek et al, // The International Journal of Biostatisties, — 2010, — Vol, 6, — P, 3-4,
5, Cox D,, Lee J, Pointwise testing with functional data using the Westfall-Young randomization method // Biometrika. - 2008. - Vol. 95. - P. 621-634.
6, Ramsay J,, Hooker G,, Graves S, Functional Data Analysis with R and Matlab, — 2009,
7, Мелае В.Б., Сальников Л И.. Гуду, пша А,О, Численное сравнение перестановочных и классических методов проверки статистических гипотез // Вестник СПбГУ, сер. 1. вып.З, — готовится к публикации,
8, Keller-MeNulty S,, Higgins J, Effect of tail weight and outliers on power and tvpe-I error of robust permutation tests for location // Communications in Statistics - Simulation and Computation, — 1987, — Vol, 16, — P, 17-35,
9, Некоторые оценки параметров распределения Коши / Е.Д. Галкина, С,В, Лехцева, Н.С, Лукичев, В.1C Рыков // Труды НГТУ им, Р.Е, Алексеева Д'"3. — 2015,
10, Edgington Е, S, Approximate randomization tests // The Journal of Psychology.— 1969. - Vol. 72. - P. 143-149.
11, Good P, I, Resampling Methods: A Practical Guide to Data Analysis, — 3 edition,— Birkhauser, 2006,