Введение 2
2 Процедура контроля и ее риск 5
2.1 Функция риска критерия, основанного на максимальном значении 5
2.2 Асимптотическое поведение функции риска 7
2.3 Численная иллюстрация 11
3 Оптимальные правила различения многих гипотез 12
3.1 Процедура, основанная на достаточной статистике 14
3.1.1 Симметричное разбиение пространства 0 15
3.1.2 Графическая интерпритация 17
3.1.3 Несимметричное разбиение пространства 0 около нуля . 17
3.1.4 Графическая интерпритация 19
3.1.5 Произвольное разбиение пространства 0 19
3.1.6 Графическая иллюстрация 20
3.2 Процедура, основанная на медиане выборки 20
3.2.1 Графическая иллюстрация 23
3.3 Сравнение первой и второй процедуры 23
4 Заключение
Список литературы
В работе проводится сравнительный анализ некоторых естественных критериев различия нескольких гипотез в рамках d-апостериорного подхода. Этот подход применяется в ситуациях, когда имеется последовательность статистических экспериментов, в каждом из которых необходимо принять решение о значении некоторого выводного параметра. Если в этих ситуациях полагаться на подход, основанный на управлении классическими вероятностями первого и второго рода, то возникает ряд проблем, одну из которых иллюстрирует следующий простой пример.
Предположим, что выходной контроль на некотором предприятии обеспечивает уровень вероятности ошибки второго рода в 5%. Если так случилось, что предприятие выпускает только некачественную продукцию, то некоторая ее часть, в пределах 5%, будет поступать потребителю. Таким образом, истинный риск потребителя равен 100%. Другими словами, вся полученная потребителем продукция не будет соответствовать его требованиям на качество. С точки зрения потребителя процедура контроля абсолютна бесполезна. Можно сделать вывод, что такая процедура неприемлема с точки зрения ее гарантийности, и нужно управлять не вероятностью пропуска плохой продукции, а долей качественной продукции среди принятой. Описание этого подхода, ориентированного на контроль вероятностей ошибок среди экспериментов, закончившихся тем или иным решением, можно найти в [1, 2]. Этот подход называется d-апостериорным (т.е. после принятого решения).
Известно (см. [1]), что оптимальный критерий для двух гипотез, т.е. критерий, минимизирующий d-апостериорную вероятность ошибки второго рода при ограничении на вероятность ошибки первого рода, основан на статистике, равной апостериорной вероятности одной из различаемых гипотез. Для основных вероятностных моделей, используемых на практике, этот критерий эквивалентен критерию, основанному на достаточной статистике. С другой стороны, на практике (по многим причинам) чаще всего применяются процедуры, эксплуатирующие идеи непараметрической статистики, каковые (идеи) приводят к рассмотрению ранговых, в частности, экстремальных порядковых статистик. В связи с этим возникает естественная задача анализа d-апостериорных свойств критериев, основанных на экстремальных значениях выборки. Ещё более актуально эта задача звучит в проблеме различения многих гипотез, для которой на данный момент не существует утверждения о виде оптимального критерия. Во второй части работы проведено сравнение свойств критерия различения трёх гипотез, основанного на порядковых статистиках, и естественного критерия, основанного на достаточной статистике.
В первой части рассматривается так называемый «тестированный критерий», используемый чаще всего в практике контроля качества. Этот критерий основан на порядковых статистиках, построенных по выборочным данным, точнее на максимальном (или минимальном) значении. Он обладает хорошими статистическими качествами при отсутствии у “контролера” четких пониманий о вероятностной модели наблюдений. В частности, если в выборке с большой вероятностью могут присутствовать аутлайеры (резко выделяющиеся наблюдения, появляющиеся по непонятным причинам). Из практики применения этой процедуры возникли сомнения в ее качестве с точки зрения указанных рисков потребителя и производителя. В данной работе изучаются свойства подобных критериев с точки зрения поведения ее d-апостериорных вероятностей ошибок. Рассматривается ситуация, когда объем выборки увеличивается, при этом возникают две основные задачи:
а) поиск асимптотики d-рисков первого и второго рода гостированного критерия;
б) отыскание асимптотики критической константы, при которой достигаются заданные ограничения на величину риска потребителя.
Как следствие этих вопросов, можно сделать вывод о состоятельности этого критерия. При решении первой задачи используется “метод перевала” исследования асимптотик лапласовских интегралов. Интегралы, возникающие в данной работе, имеют не совсем классический вид, поэтому их изучение требует предварительных преобразований. Отметим, что численный анализ здесь так же затруднителен, т.к. при большом объеме выборки риск может вычисляется только с помощью высокоточных средств и требует дополнительных разработок. В данной работе найдены асимптотики для критической константы и полученный результат применен к анализу риска поставщика. Было установлено, что этот риск не стремится к нулю с ростом объема выборки, таким образом, эта процедура не обладает свойством состоятельности в смысле d-апостериорного подхода. Другими словами, при некоторых ограничениях на обе d-апостериорные вероятности ошибок не существует гарантийной процедуры, основанной на крайних членах вариационного ряда.
Вторая часть работы посвящена анализу критериев различия многих гипотез, основанных на некоторых естественных, в частности на порядковых статистиках. Во многих моделях апостериорная вероятность представляет собой функцию достаточной статистики, которая и была использована в первой процедуре. Для некоторых вариантов расположения проверяемых гипотез удалось построить “максиминное” решающее правило в классе правил, основанных на апостериорных вероятностях. Вторая процедура была основана на ранговой статистике. Основная задача - сравнить два критерия и дать рекомендации по использованию указанных процедур. Было установлено, что для достижения заданных гарантий необходимый объем выборки для второго критерия оказывался всегда выше, чем для первого.
В работе был проведен анализ процедуры статистического контроля качества, основанного на порядковых статистиках для некоторых вероятностных моделей. Рассматривалась конкретная процедура, чаще всего используемая практиками при контроле качества, так называемый «тестированный критерий». Эта процедура основана на порядковых статистиках, построенных по выборочным данным, точнее на их максимальных (минимальных) значениях. Она обладает хорошими статистическими качествами при отсутствии у “контролера” четких пониманий о вероятностных моделях наблюдений.
В нашем случае, когда Р ~exp(1), ^ ~exp(0), i= 1,... ,nи d-риск первого рода принимает вид (4) , используя методы математического анализа и анализа данных, мы можем показать, что c(n) = b •ln(n) и так подобрать константу b, чтобы d-риск первого рода rj (с; n)стабилизировался в районе в1. К сожалению d-риск второго рода гц(с; n)становится неконтролируемым даже при большом объеме выборки. Откуда можно сделать вывод о том, что тесты, основанные на экстремальных значениях не обладают свойствами состоятельности в смысле d-апостериорного подхода.
Вторая часть работы была посвящена поиску оптимальных правил различия нескольких гипотез. Было решено, что наиболее важным показателем является коэффициент надежности. В качестве задачи оптимизации был вы-
бран поиск максиминного решающего правила: правила ф*, которое максимизирует наихудшую надежность, т.е. необходимо найти значение -
Ф* = argmaxmin{ai(^>),..., am(ф)}.
В данной работе рассматривался случай трех гипотез для некоторых вероятностных моделей. Оптимальный критерий для двух гипотез основан на статистике равной апостериорной вероятности одной из гипотез. Для многих гипотез такого утверждения нет, поэтому были рассмотрены 2 критерия, основанных на некоторых естественных статистиках. Во многих моделях апостериорная вероятность представляет собой функцию достаточной статистики, которая и была использована в первой модели. Для первой процедуры были выведены правила принятия решения для различного вида разбиения пространства 0.
Вторая процедура была основана на популярной на практике ранговой статистике. В данной работе было проведено сравнение этих процедур по количеству необходимых испытаний для достижения заданных гарантий. В результате проведенных исследований можно сделать вывод: что процедура, основанная на ранговой статистике, достигает указанных ограничений за гораздо большее количество испытаний, чем процедура, которая основана на достаточной статистике.
[1] С. В. Симушкин, Оптимальный объем выборки при d-гарантийном различении гипотез, Изв.Вузов. Математика, 1982, №5, с. 47-52.
[2] И. Н. Володин, Оптимальные статистические решения. - Казань, 2012 - 182 с.
[3] N. L. Johnson, S. Kotz, and N. Balakrishnan Continuous Univariate Disrtibutions Volume 2. Second Edition, (A Wiley-Interscience Publication JOHN WILEY & SONS, INC., New York, 1995).
[4] М. В. Федорюк, Асимптотика Интегралы и Ряды, (“Наука”, Москва, 1987).
[5] М. В. Федорюк, Метод перевала, (“Наука”, Москва, 1977).
[6] Ш. Закс, Теория статистических выводов, (“МИР”, Москва, 1975).
[7] И. Н. Володин, Лекции по теории вероятностей и математической статистике, ( Казань, 2001).
[8] T. A. Fetisova, Inconsistency of tests based on extremal values, ( Lobachevskii Journal of Mathematics July 2016, Volume 37, Issue 4, pp 418-421).