Тема: Оптимальные правила различения многих гипотез при d-апостериорном подходе
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
2 Процедура контроля и ее риск 5
2.1 Функция риска критерия, основанного на максимальном значении 5
2.2 Асимптотическое поведение функции риска 7
2.3 Численная иллюстрация 11
3 Оптимальные правила различения многих гипотез 12
3.1 Процедура, основанная на достаточной статистике 14
3.1.1 Симметричное разбиение пространства 0 15
3.1.2 Графическая интерпритация 17
3.1.3 Несимметричное разбиение пространства 0 около нуля . 17
3.1.4 Графическая интерпритация 19
3.1.5 Произвольное разбиение пространства 0 19
3.1.6 Графическая иллюстрация 20
3.2 Процедура, основанная на медиане выборки 20
3.2.1 Графическая иллюстрация 23
3.3 Сравнение первой и второй процедуры 23
4 Заключение
Список литературы
📖 Введение
Предположим, что выходной контроль на некотором предприятии обеспечивает уровень вероятности ошибки второго рода в 5%. Если так случилось, что предприятие выпускает только некачественную продукцию, то некоторая ее часть, в пределах 5%, будет поступать потребителю. Таким образом, истинный риск потребителя равен 100%. Другими словами, вся полученная потребителем продукция не будет соответствовать его требованиям на качество. С точки зрения потребителя процедура контроля абсолютна бесполезна. Можно сделать вывод, что такая процедура неприемлема с точки зрения ее гарантийности, и нужно управлять не вероятностью пропуска плохой продукции, а долей качественной продукции среди принятой. Описание этого подхода, ориентированного на контроль вероятностей ошибок среди экспериментов, закончившихся тем или иным решением, можно найти в [1, 2]. Этот подход называется d-апостериорным (т.е. после принятого решения).
Известно (см. [1]), что оптимальный критерий для двух гипотез, т.е. критерий, минимизирующий d-апостериорную вероятность ошибки второго рода при ограничении на вероятность ошибки первого рода, основан на статистике, равной апостериорной вероятности одной из различаемых гипотез. Для основных вероятностных моделей, используемых на практике, этот критерий эквивалентен критерию, основанному на достаточной статистике. С другой стороны, на практике (по многим причинам) чаще всего применяются процедуры, эксплуатирующие идеи непараметрической статистики, каковые (идеи) приводят к рассмотрению ранговых, в частности, экстремальных порядковых статистик. В связи с этим возникает естественная задача анализа d-апостериорных свойств критериев, основанных на экстремальных значениях выборки. Ещё более актуально эта задача звучит в проблеме различения многих гипотез, для которой на данный момент не существует утверждения о виде оптимального критерия. Во второй части работы проведено сравнение свойств критерия различения трёх гипотез, основанного на порядковых статистиках, и естественного критерия, основанного на достаточной статистике.
В первой части рассматривается так называемый «тестированный критерий», используемый чаще всего в практике контроля качества. Этот критерий основан на порядковых статистиках, построенных по выборочным данным, точнее на максимальном (или минимальном) значении. Он обладает хорошими статистическими качествами при отсутствии у “контролера” четких пониманий о вероятностной модели наблюдений. В частности, если в выборке с большой вероятностью могут присутствовать аутлайеры (резко выделяющиеся наблюдения, появляющиеся по непонятным причинам). Из практики применения этой процедуры возникли сомнения в ее качестве с точки зрения указанных рисков потребителя и производителя. В данной работе изучаются свойства подобных критериев с точки зрения поведения ее d-апостериорных вероятностей ошибок. Рассматривается ситуация, когда объем выборки увеличивается, при этом возникают две основные задачи:
а) поиск асимптотики d-рисков первого и второго рода гостированного критерия;
б) отыскание асимптотики критической константы, при которой достигаются заданные ограничения на величину риска потребителя.
Как следствие этих вопросов, можно сделать вывод о состоятельности этого критерия. При решении первой задачи используется “метод перевала” исследования асимптотик лапласовских интегралов. Интегралы, возникающие в данной работе, имеют не совсем классический вид, поэтому их изучение требует предварительных преобразований. Отметим, что численный анализ здесь так же затруднителен, т.к. при большом объеме выборки риск может вычисляется только с помощью высокоточных средств и требует дополнительных разработок. В данной работе найдены асимптотики для критической константы и полученный результат применен к анализу риска поставщика. Было установлено, что этот риск не стремится к нулю с ростом объема выборки, таким образом, эта процедура не обладает свойством состоятельности в смысле d-апостериорного подхода. Другими словами, при некоторых ограничениях на обе d-апостериорные вероятности ошибок не существует гарантийной процедуры, основанной на крайних членах вариационного ряда.
Вторая часть работы посвящена анализу критериев различия многих гипотез, основанных на некоторых естественных, в частности на порядковых статистиках. Во многих моделях апостериорная вероятность представляет собой функцию достаточной статистики, которая и была использована в первой процедуре. Для некоторых вариантов расположения проверяемых гипотез удалось построить “максиминное” решающее правило в классе правил, основанных на апостериорных вероятностях. Вторая процедура была основана на ранговой статистике. Основная задача - сравнить два критерия и дать рекомендации по использованию указанных процедур. Было установлено, что для достижения заданных гарантий необходимый объем выборки для второго критерия оказывался всегда выше, чем для первого.
✅ Заключение
В нашем случае, когда Р ~exp(1), ^ ~exp(0), i= 1,... ,nи d-риск первого рода принимает вид (4) , используя методы математического анализа и анализа данных, мы можем показать, что c(n) = b •ln(n) и так подобрать константу b, чтобы d-риск первого рода rj (с; n)стабилизировался в районе в1. К сожалению d-риск второго рода гц(с; n)становится неконтролируемым даже при большом объеме выборки. Откуда можно сделать вывод о том, что тесты, основанные на экстремальных значениях не обладают свойствами состоятельности в смысле d-апостериорного подхода.
Вторая часть работы была посвящена поиску оптимальных правил различия нескольких гипотез. Было решено, что наиболее важным показателем является коэффициент надежности. В качестве задачи оптимизации был вы-
бран поиск максиминного решающего правила: правила ф*, которое максимизирует наихудшую надежность, т.е. необходимо найти значение -
Ф* = argmaxmin{ai(^>),..., am(ф)}.
В данной работе рассматривался случай трех гипотез для некоторых вероятностных моделей. Оптимальный критерий для двух гипотез основан на статистике равной апостериорной вероятности одной из гипотез. Для многих гипотез такого утверждения нет, поэтому были рассмотрены 2 критерия, основанных на некоторых естественных статистиках. Во многих моделях апостериорная вероятность представляет собой функцию достаточной статистики, которая и была использована в первой модели. Для первой процедуры были выведены правила принятия решения для различного вида разбиения пространства 0.
Вторая процедура была основана на популярной на практике ранговой статистике. В данной работе было проведено сравнение этих процедур по количеству необходимых испытаний для достижения заданных гарантий. В результате проведенных исследований можно сделать вывод: что процедура, основанная на ранговой статистике, достигает указанных ограничений за гораздо большее количество испытаний, чем процедура, которая основана на достаточной статистике.



