Тип работы:
Предмет:
Язык работы:


ОБ ОБНАРУЖЕНИИ "РАЗЛАДКИ" В ПАРАМЕТРАХ ЛИНЕЙНОЙ МОДЕЛИ

Работа №184466

Тип работы

Бакалаврская работа

Предмет

математика

Объем работы73
Год сдачи2018
Стоимость4370 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
14
Не подходит работа?

Узнай цену на написание


Введение 5
1 Доверительное оценивание для параметров биномиального
распределения 9
1.1 Понятие доверительного интервала 9
1.2 Построение доверительного интервала с помощью центральной
статистики 10
1.3 Построение доверительного интервала с использованием
распределения точечной оценки параметра 11
1.4 Асимптотические доверительные интервалы. 13
1.5 Доверительный интервал для параметра бернуллиевской модели 14
1.6 Доверительное оценивание и его использование для обнаружения
"разладки" 16
2 Обнаружение "разладки" в авторегрессионных моделях 26
2.1 Проверка гипотезы об обнаружении "разладки" в первом
коэффициенте модели AR(1) 27
2.1.1 Построение критерия обнаружения "разладки" 27
2.1.2. Асимптотическое распределение тестовой статистики 29
2.2 Проверка гипотезы об обнаружении "разладки" во втором
коэффициенте модели AR(1) 31
2.2.1 Построение критерия обнаружения "разладки" 31
2.2.2 Асимптотическое распределение тестовой статистики 33
2.3 Последовательный непараметрический метод обнаружения
"разладок" случайных процессов рекуррентного типа 35
2.3.1 Постановка задачи 3 5
2.3.2 Построение решающей процедуры 36
2.3.3 Выбор параметров и исследование свойств решающей
процедуры 39
3 Результаты численного моделирования 49
Вывод 58
Заключение 60
Список использованной литературы 62
Приложение А Первичная обработка данных

Описание и исследование временных рядов является одной из актуальных задач в статистике и ее приложениях. При моделировании временных рядов важное значение имеет сохранение вероятностных характеристик. Момент, когда свойства исследуемого процесса меняются можно считать моментом "разладки". Алгоритмы для решения такой задачи- задачи обнаружения "разладки"(change point) широко применяются в разных областях знаний, таких как контроль качества промышленности, финансовые рынки, медицинская диагностика.
История развития задач о "разладке" уходит в недалекое прошлое. Но, несмотря на столь небольшой промежуток времени, это направление развито достаточно хорошо и является актуальным по сей день. Учитывая, что уже опубликовано большое количество работ, сегодня есть над чем работать, что изучать и что развивать в данной области.
В 1960 году в городе Вильнюс на VI Всесоюзном совещании по теории вероятностей и математической статистике впервые была рассмотрена задача о "разладке" А.Н. Ширяевым. Результаты отражены в последующих его статьях [11],[12], [14]. Также Альберт Николаевич решал задачи о "разладке" для различных моделей: дифузионных и для временных рядов [8],[9],[10], [11].
Например, на производстве изготавливаются детали для каких-либо механизмов и нам важна точность размеров. В какой-то момент времени машина начинает изготавливать детали с небольшим отклонением. Нам требуется продиагностировать "разладку" вовремя и вызвать ремонтную службу иначе вся партия будет забракована и компания потерпит убытки.
Методы диагностики разладки можно использовать также при решении следующей задачи. В каждый час камерами магазина фиксируется количество посетителей. Необходимо исключить аномальное количество. Аномальные показатели могут возникать по разным причинам, одной из таких является появление паутины (движение шариков при ветре), и камера может принять это за группу людей.
На сегодняшний день компьютерная безопасность занимает одну из важных ролей в жизни человека. Потому что не станем обращаться, например, в банк, где систему безопасности можно легко обойти. Пусть нам известно как система работает в нормальном режиме. В какой-то момент в систему входит "хакер". Требуется продиагностировать взлом системы, быстро отреагировать и улучшить безопасность. Поэтому алгоритмы обнаружения "разладки" могут применяться при решении такой задачи.
Немаловажную роль занимает здоровье как человека так и наших четвероногих друзей. С появлением новых лекарств вирусы стремятся выжить путем мутации и приспособления к новым условиям. Поэтому, ведя контроль заболеваний, важно определить не выходит ли за границу количество заболевших. Если да, то следует объявить карантин. "Разладкой" в этой задаче считается выход за верхнюю границу количества заболевших на 10000 человек. О задаче такого типа речь пойдет в первой главе.
Вторая глава посвящена методам диагностики "разладки" для авторегерессионной модели AR(p). В ней рассматривается алгоритм, основанный на отношении правдоподобия и правило CuSum и производится их сравнение.
Задача о "разладке" допускает различные формы постановки:
1. Общая постановка задачи различения двух гипотез:
На некотором измеримом пространстве (Q,^) заданы две вероятностные меры Р°, F'и последовательность случайных величин <^,^2,..., совместное распределение которых есть РО, где параметр О принимает значение 0 и 1, и этот параметр неизвестен. Наша задача состоит в том, чтобы с минимальными "потерями" определить истинное значение неизвестного параметра по наблюдениям <£,£,....
Далее, отталкиваясь от того, какие сделаны предположения о структуре 5
параметра 0, рассматриваются две постановки: байесовская и условно экстремальная.
I. Байесовская постановка задачи.
Пусть на измеримом пространстве (О,У) заданы случайные величины 0, <£,£,... и вероятностная мера Рл, где л какое-то число из отрезка [0,1]. Предполагается, что случайная величина 0 принимает значения 0 и 1 с вероятностями л и 1 -л соответственно. Учитывая условие, что случайная величина 0 равна j, j = 0,1, величины независимы и одинаково распределены (причем функция распределения не зависит от л ).
Положим M * = {г} - совокупность марковских моментов г = т(а>), принимающих значения во множестве N= {0,1,2,...} .Относительно задачи различия двух гипотез выбор момента г означает выбор правила, по которому определяется момент, когда нужно прекратить наблюдения над величинами £„£,.... Функция заключительного решения d = d(щ), которая измерима относительно J-f = бг{щ:^,...,^}, показывает какую из гипотез нужно принять. Если d(щ) = 1, то принимаем гипотезу Н = 1, если d(щ) = 0, то гипотеза Но:0 = 0.
II. Условно экстремальная постановка.
В этой постановке о неизвестном параметре 0 никаких предположений не делается.
Положим, что на измеримом пространстве (О,У) заданы вероятностные меры Р, Р. Пусть также задана последовательность независимых случайных величин ^,£2,... (независимы по каждой из мер Р, Р).
Обозначим
^ = а{0,Q}, = ст{щ:^1,...,^г},n>1,
M$ ={г} -класс моментов остановки т = т(Ш) (относительно Ff= , п > 1),
Df = {d} - совокупность Т7/- измеримых функций d = d(ш), принимающих значение 0 и 1. Пусть еще Af(а, 3) -класс решающих правил 5 = (т, d), таких, что Ег< да и Ехт< да. Вероятности ошибок
а(5) = P {d(ш) = 0} <а, 3(5) = р {d(ш) = 0} <3,
где а, 3 > 0 и а + 3 < 1.
Относительно задачи различения двух гипотез постановка выглядит следующим образом.
Пусть заданы а, 3 > 0, такие что а+3 < 1. Необходимо в классе
Af(а, 3) найти правило 5 = (т,5) такое, чтобы одновременно выполнялось
Еот < оо и Exf<да
для всех 5 = (т, d) е Af(а, 3).
Работа содержит 70 страницы, 16 источников, 1 приложение.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящей работе были рассмотрены различные подходы к задаче об обнаружении "разладки".
В первой главе момент "разладке" определялся как момент выхода за границы 95% доверительного интервала, построенного для числа людей в зоне наблюдения. Вероятность однократного выхода за границы такого интервала равна 0,05. Вероятность двукратного и трехкратного выхода не более 0,0025 и 0,000125 соответственно. Таким образом, при двукратном выходе за границы доверительного интервала вероятность разладки фиксирующего оборудования 0,9975.
Вторая глава посвящена сравнительному численному исследованию двух алгоритмов обнаружения "разладки". Первый алгоритм, который был рассмотрен, основан на отношении правдоподобия. Проводя симуляционное моделирование, было выявлено, что при разнице в коэффициентах авторегрессионной модели AR(1) |ф0 -фх > 0.3 и |£0-£J > 0.3 алгоритм хорошо находит "разладку". Но, например, в промышленности, при производстве деталей ошибка даже на 0,001 может оказать значительное влияние на работу всего механизма. Поэтому этот алгоритм хорошо работает только в том случае, когда разница в коэффициентах больше 0,3. Второй алгоритм - алгоритм CuSum. Этот алгоритм разработан для более широкого класса моделей, включающих в том числе и модель авторегрессии AR(1), поэтому симуляционное моделирование было проведено на моделях , описывающих появление детерминированного сигнала на фоне независимых шумов и появление детерминированного сигнала на фоне зависимых шумов . То есть, были рассмотрены модели, в которых до момента "разладки" был шум, а после - появлялся какой-то сигнал. Этот алгоритм практически точно определяет, когда появляется сигнал при хорошем подборе коэффициентов а и р, где а - вероятность ложной тревоги, а ft - вероятность ложного спокойствия.
Соответственно, лучше определяет "разладку" второй алгоритм, чем алгоритм, основанный на отношении правдоподобия.



1. Ивченко Г.И., Медведев Ю.И. Математическая статистика -Москва: Высшая школа, 1984. С.81-84, С.89-92.
2. Исаева Н.А., Кривякова Э.Н. Оценивание параметров распределения: метод. пособие. -Томск-1990. С.9-10.
3. Конев В. В. Экспериментальное исследование непараметрической процедуры CUSUM для обнаружения разладки в авторегрессионных моделях с неизвестным конечным параметром / В. В. Конев, Б. Н. Назаренко // Материалы IV Международной молодежной научной конференции "Математическое и программное обеспечение информационных, технических и экономических систем", Томск, 20-21 мая 2016 г. Томск, 2016. С.66-67.
4. Конев В.В. Последовательные оценки параметров стохастических динамических систем - Томск: Томский университет, 1985. С. 134-151.
5. Конев В.В., Назаренко Б.Н. Экспериментальное исследование непараметрической процедуры CUSUM в неасимптотической постановке //Труды Томского государственного университета. Серия физико-математическая. Томск: Издательский Дом ТГУ, 2015. Т. 297. Математическое и программное обеспечение информационных, технических и экономических систем : материалы III Всероссийской молодежной научной конференции. Томск, 22-23 мая 2015 г.С.176-178.
6. Крамер Г. Математические методы статистики- Москва: Мир, 1975. С. 533 п.3.
7. Липцер И.Ш., Ширяев А.Н. Статистика случайных процессов - Москва: Наука, 1974.
8. Ширяев А.Н. Задача скорейшего обнаружения стационарного режима, ДАН СССР 138, 5 (1961), 1039-1042.
9. Ширяев А.Н. Некоторые точные формулы в задаче о "разладке", Теория вероятностей и ее применение 10, 2 (1965), 380-385.
10. Ширяев А.Н. О двух задачах последовательного анализа, Кибернетика 2, 1967, 79-80.
11. Ширяев А.Н. Об оптимальных методах в задачах скорейшего обнаружения, Теория вероятностей и ее применение 8, 1, 1963, 26-51.
12. Ширяев А.Н. Обнаружение спонтанно возникающих эффектов, ДАН СССР 138, 4 (1961), 794-801.
13. Ширяев А.Н. Статистический последовательный анализ - Моксва: Наука, 1976, С. 206.
14. Ширяев А.Н., О марковских достаточных статистиках в неаддитивных баессовских задачах последовательного анализа, Теория вероятностей и ее применение 9,4 (1964), 670-686.
15. Davis R., Huang D., Yao Y. Testing for a Change in the Parameter Values and R. Davis, D. Huang, and Y. Yao. Testing for a Change in the Parameter Values and Order of an Autoregressive Model. The Annals of Statistics, 1995
16. Fang Yuan. Tests for Change-Point of the AR(1) Model/ Fang Yuan , Kang Ling James - The UNIVERSITY OF MINNESOTA, 2013, p 5-21.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ