Введение………………………………………………………………………….3
Глава 1. Байесовская оценка для фиксированного числа наблюдений….7
1.1. Постановка задачи…………………………………………………….7
1.2. Вывод апостериорной плотности……………………………………8
1.3. Вывод апостериорной надежности………………………………….11
1.4. Построение байесовской оценки……………………………………11
Глава 2. Последовательная процедура оценки среднего значения……....13
2.1. Процедура первого пересечения…………………………………….13
2.2. Применение d-гарантийной процедуры на практике……………....14
Выводы и заключение…………………………………………………………16
Список литературы…………………………………………………………….17
Приложение……………………………………………………………………..18
Мы рассматриваем вычисление оценки среднего значения для нормального распределения с учетом его случайности и крайней малости, а также это предположение дополняется использованием нормального усеченного распределения в качестве априорного. Рассматривается проблема оценки с гарантированной относительной оценкой. Наблюдение происходит на основе фиксированного числа наблюдений и последовательных процедур оценки, которые гарантируют заданные ограничения на относительную ошибку и d-риск (d-гарантийная процедура). Принимая во внимание существование d-гарантийной процедуры, представлен простой метод для вычисления выборки минимального размера для построения оптимальной процедуры оценки с фиксированным числом наблюдений. Также описана последовательная процедура оценки, основанная на первом достижении постериор- ной вероятности оцениваемой надежности заданного уровня 1 — в- Проиллюстрированы результаты статистического моделирования в качестве распределения времени остановки. С практической точки зрения рассмотренных статистических процедур исследуется среднесуточная концентрация аммиака в атмосферном воздухе, которая не вызывает негативных последствий у живых организмов.
Мы рассматриваем типичную статистическую проблему контроля качества: содержание некоторого вредного вещества. К примеру, аммиака в атмосферном воздухе. Его количество не должно превышать указанного предела. Нормативы утверждаются в законодательном порядке и контролируются санитарно-эпидемиологическими службами (в России - Роспотребнадзор). Для проверки отсутствия нарушений мы проводим серию статистических экспериментов. В каждом из этих независимых повторяющихся наблюдений оценивается параметр в. Данный параметр может быть расценен, как индекс для семейства P = {PQ,в £ 0} возможных распределений случайной выборки X в измеримом пространстве (х, A). Предполагается, что соответствующая последовательность в, в2,... неизвестных (оцениваемых) величин параметра в в каждом статистическом эксперименте может быть проинтерпретирована, как последовательность v,v2,... независимых
одинаково распределенных случайных величин, имеющих распределение GA, которое принадлежит семейству G = {GA,A € Л} так называемых априорных распределений случайной величинах v.
Разумеется, решение данной статистической задачи оценки в будет про- исходитв в рамках Байесовской парадигмы. Байесовская методология заключается в том, что еще до получения данных определяется доверительный уровень к возможным моделям и представление ее в виде определенных вероятностей. Одним из главных преимуществ байесовского подхода является использование априорной информации относительно параметров модели.
Зададим L(0,d), (9,d) € О2, как функцию потерь. Она будет отражать некоторые значения в случае, когда значение d принимается, однако истинное значение в отлично от d, то есть в случае неправильного принятия решения на основе наблюдаемых данных. Крайне важным для решения статистического предположения является установить функцию риска (математического ожидания отрицательных последствий). Наш новый подход для нахождения оценки среднего значения нормального распределения основан на Байесовской парадигме. Это так называемый d-апостериорный подход к проблеме гарантийности статистического вывода. В отличие от классического подхода (такая задача решалась в статье [1]), в данном случае величина среднего значения потерь рассчитана среди экспериментов, в результате которых было принято значение d вместо статистических экспериментов с той же величиной выходного параметра в. Таким образом, решение проблемы гарантийности основано на вычислении фукнции d-риска: условное математическое ожидание функции потерь с учетом а-алгебры, смоделированной функцией принятия решений 6(Х). Заметим, что в нашем случае 5(Х) - оценка самого параметра.
Если мы предположим, что априорное распределение д известно, или у нас имеется оценка результатов существующей последовательности статистических экспериментов, тогда априорный риск статистической процедуры Rg = ЕL(v, 6(Х)) (среднее значение, вычислено с помощью совместного распределения и v) - слишком приблизительный для характеристики ка
чества оценки 6 (X). Функция d-риска является аналогом функции риска для решения проблем гарантийности статистического предположения:
R(d) = Е L(v, d)6(X) = d,d е 0
Функция может быть представлена в качестве среднего значения потери среди статистических экспериментов, которые закончи лиев принятием решения d е D.
Таким образом, гарантийности процедурв1 оценки основана не на отклонении вероятности оценки 6(X) от истинного значения параметра в, а на вероятности того, что для вычисленных наблюдений величина случайного параметра v отлична от резулвтата d = 6(ж).
Пусти, А - константа, которую мы будем исполвзоватв, чтобы контроли- роватв относителвную погрешности нашей оценки. В данном случае, проблема оценки среднего значения в нормалвного распределения с известной дисперсией будет решена при условии априорного - усеченного нормалвного распределения. То еств, неизвестное значение в является реализацией v с априорнвш нормальным усеченным распределением
(fl-м)2)
2т2 )
и функцией потерь L(e, d) = 0, если принятое решение d
1 в
1+А < d <1 + А’А >0
и L(e, d) = 1 в противном случае.
Также должно выполняться следующее условие:
1 в
рвЬ г < 1 + А} > 1 - в, Ve е R
{1 + А в(Х) }>
Представленная функция потерь показывает сколько раз было принято неверное решение (оценка была отлична от истинного значения параметра), то есть функция потерь отвечает за относительную ошибку оценки в.
Мы полагаем, что истинное значение в не может быть равным 0 (оцениваемое вредное вещество всегда будет содержаться в воздухе). Если мы предполагаем, что в0 = 0, тогда d-риск Байесовской оценки становится неограниченным, что типично для проблемы гарантийности оценки с заданными ограничениями на относительную ошибку.
Описывается формула для постериорной надежности оценки. Постери- орная надежность оценки вычислена при заданной относительной точности. Использование надежности является более удобным подходом для построения процедуры оценки, нежели использование постериорного риска. Также рассматривается Байесовская оценка для в в случае, когда число наблюдений п фиксировано и посчитана его d-надежность. Исследуется алгоритм для оценки с равномерно минимальным d-риском. Весьма важно, что нашем случае оценка обладает d-минимаксным свойством. Следовательно, принятие решения происходит при минимальном размере выборки, для которого существует процедура оценки в с заданными ограничениями на относительную ошибку и d-риск. Во второй главе представлена последовательная процедура для оценки в. Это так называемая универсальная процедура первого пересечения, предложенная в статье [2]. Также было произведено исследование ее свойств с помощью метода статистического моделирования Монте-Карло. Параметры модели выбраны в соответствии с ГОСТом. Все формулы, вычисленные для исследования оценки пронумерованы и представлены графически.
Построенная процедура адаптирована для проблемы оценивания содержания вредных веществ в атмосферном воздухе.
В диссертационной работе представлено решение проблемы оценки среднего значения нормального распределения с гарантированной относительной точностью и гарантированной надежностью.
Для решения поставленной задачи в работе предлагается к рассмотрению d-апостериорный подход. В этом подходе, в отличие от классического, величина средних потерь от принятия неправильного решения вычисляется не среди статистических экспериментов с одним и тем же значением выводного параметра, а среди тех экспериментов, которые закончились принятием одного и того же решения d. В работе предлагается последовательная процедура оценки среднего значения с гарантированной относительной ошибкой и d-надежностью. В качестве реализации в данной работе рассматривается задача оценки содержания аммиака в атмосферном воздухе.
Работа по вычислениям проводилась с использованием математического пакета Wolfram Mathematica. При построении графиков вычисления производились на языке программирования R.
Как видно по полученным гистограммам и результатам вычислений, использование последовательной процедуры для оценки неизвестного параметра дает существенный выигрыш относительно значения числа наблюдений.
[1] Володин И.Н. / К оценке среднего значения нормального распределения с гарантированными ограничениями на относительную ошибку // Изд-во Металлургия. М.: Заводская лаборатория,- 1978. - т.44, el. - С. 6972
[2] I.N. Volodin./ Optimum sample size in statistical inference procedures. // Soviet Math. (Iz. VUZ). - 1980. - Vol. 22, no 12. - C. 68-78.
[3] Volodin I. N, Salimov R.F., Turilova E.A., Yang S. -F, / Estimation of the mean value for the normal distribution with constrains on d-risk / Lobachevskii
J. Maths. - 2018. - Vol.39, no.3. - C. 377-387.