Оглавление
Введение 3
Глава 1. Общие понятия проверки статистических гипотез 5
1.1 Сущность и виды проверки статистических гипотез 5
1.2 Выбор критериев для проверки статистических гипотез 9
1.3 Основные принципы расчета критериев для проверки статистических
гипотез 13
Глава 2. Язык программирования R 15
2.1. Основные возможности языка R 15
2.2. Применение языка программирования R 19
Глава 3. Проверка статистических гипотез о параметре формы распределения Вейбулла 23
Глава 4 Практическая часть. Построение группового последовательного критерия и его численное исследование 29
Заключение 54
Список литературы 56
Естественные и технические науки используют статистические методы как средство анализа массовых явлений. Статистический метод основан на применении теории вероятностей. Способы статистической обработки полученных данных, обработка и применение которых имеют отношение к вероятностной природе этих данных, называют методами математической статистики.
Первая задача математической статистики состоит в собственно статистической обработке полученной совокупности экспериментальной информации. Результаты такой обработки представляются в виде таблиц распределения, рядов распределения или гистограмм.
Второй задачей математической статистики является определение законов распределения случайных величин, статистические данные для которых необходимо обработать. Для решения такой задачи по внешнему виду рядов или гистограмм распределения, выдвигают гипотезу о предполагаемом законе распределения изучаемой случайной величины, и затем исследуют соответствие выдвинутой гипотезы реальным данным при помощи тех или иных критериев согласия.
При решении третьей задачи определяют неизвестные параметры законов распределения, которые установлены с помощью критерия согласия, используя те же статистические данные.
Четвертая задача математической статистики дает возможность осуществить выбор наиболее предпочтительного поведения системы, для которой получены данные в условии существенных неопределенностей, которые обусловлены случайным характером величин.
Кроме нахождения решения вышеупомянутых основных задач, математическая статистика применяется для анализа погрешностей измерения и дает возможность получить рекомендации о необходимой точности измерительного прибора или системы.
Методы статистики применяют для установления взаимосвязи между случайными величинами (корреляция и регрессия), изучения рядов динамики или создания прогноза изменения того или иного параметра.
В данной дипломной работе рассматривается распределение Вейбулла. Это распределение играет важную роль в исследованиях теории надежности при определении «времени жизни» сложного технического изделия. Распределение Вейбулла реализует модель «слабого звена», которая является адекватной, например, для работы электромеханических устройств и приборов [1].
Актуальность исследования состоит в том, что задачи проверки гипотезы о параметрах масштаба являются весьма востребованными.
Целью дипломной работы является численное сравнение объема наблюдений, которые необходимы при использовании классических и последовательных схем проверки гипотезы при достижения одинаковой достоверности.
Объект исследования: проверка гипотезы о параметре формы распределения Вейбулла.
Для достижения цели работы поставлены следующие задачи:
1. Изучить предметную область;
2. Рассмотреть основные методы проверки статистических гипотез;
3. Выбрать среду программирования для проведения численного моделирования;
4. Создать программу;
5. Проверить работоспособность созданного программного обеспечения;
6. Проанализировать результаты и сделать выводы.
Теоретической базой для написания дипломного проекта являются работы отечественных и зарубежных авторов.
Распределение Вейбулла обладает двумя параметрами: параметр формы и параметр масштаба. Параметром масштаба характеризуется «растянутость» этого распределения вдоль оси времени. Параметром формы k характеризуется природа частоты отказов. Если параметр формы k<1, это значит, что интенсивность появления отказов с течением времени будет уменьшаться, а если параметр формы k>1 - то возрастать. В случае, когда k=1, то интенсивность отказов остается неизменной по времени (этот случай будет соответствовать экспоненциальному распределению). В случае, когда известен параметр формы распределения k, имеется возможность более точного предсказания количества отказов в зависимости от течения времени и, тем самым, эффективного планирования мероприятий по эксплуатации и ремонту оборудования.
При проведении проверки гипотез классическими методами предполагают, что все наборы данных поступают на обработку в полном объеме и в один момент (имеется выборка с фиксированным объемом). В данной работе рассматриваются последовательные критерии, при которых накопление информации производят последовательным образом, при этом процесс добавления информации может прерываться, если накопленный объем данных уже обеспечил требуемый уровень достоверности. Если провести сравнение с классической схемой, применение последовательной схемы дает возможность сокращения объема наблюдений, что приводит к значительной экономии ресурсов, средств и времени.
Проведенное в дипломной работе исследование подтвердило актуальность решения задачи проверки статистических гипотез о параметре формы распределения.
Достигнута цель дипломной работы. Проведено численное сравнение количества наблюдений, которые необходимы при применении классической и последовательной схемы проверки статистической гипотезы при получении одинаковой достоверности.
При достижении цели работы решены такие задачи:
1. Изучена предметная область;
2. Рассмотрены основные методы для осуществления проверки статистической гипотезы;
3. Создана программа на зыке программирования R;
4. Проверено функционирование созданного программного приложения;
5. Проанализированы результаты и сделаны выводы.
1. Тейлор Дж. Введение в теорию ошибок. Пер. с англ. - М.: Мир, 2009. - 272 с.
2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2011. - 816 с.
3. Боровков А.А. Теория вероятностей. - М.: Наука, 1986. - 432 с.
4. Буховец А.Г., Москалев П.В. Статистический анализ данных в системе R. - Воронеж: ВГАУ, 2014. - 124 с.
5. Меретилов М.А. Методические указания к лабораторным работам по курсу «Методы анализа данных». - Красноярск: КГТУ, 2006. - 15 с.
6. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2010. - 479 с.
7. Кокунин В.А. Статистическая обработка данных при малом числе опытов. - Киев, 1974. - 790 с.
8. Третьяк Л.Н. Обработка результатов наблюдений. - Оренбург: ГОУ ОГУ, 2004. - 171 с.
9. Аффи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Пер. с англ. - М.: Мир, 1982. - 488 с.
10.Зарядов И.С. Введение в статистический пакет R: типы переменных, структуры данных, чтение изапись информации, графика / И.С.Зарядов, Москва, 2010, 207с.
11. Новиков Ан.А. Элементарное введение в последовательный
статистический анализ / Ан.А.Новиков, Мехико, 2007, 25с.
12. Леман Э. Проверка статистических гипотез / Э.Леман, Москва, 1979, 404с.
13. Kumar V., Ligges U. Package "reliaR"/ V.Kumar, U.Ligges, 2015, 153.
14. Боровков А.А. Математическая статистика / А.А.Боровков,
Новосибирск:Наука, издательство института математики, 1997, 772с.
15. Де-Гроот М. Оптимальные статистические решения / М.Де-Гроот, М.:Мир, 1974
16. Ghosh M., Mukhopadhyay N., Sen P.K., Sequentional Estimation /M.Ghosh, N.Mukhopadhyay,P.K.Sen, New-York:Wiley, 1997.
17. Novikov A. Optimal sequential tests for two simple hypotheses. Sequential analysis. /A.Novikov ,2009.,28(2)., P. 188-217.
18. Wald A., Wolfowitz J. Optimum character of the sequential probability ratio test. Annals of Mathematical Statistics. / A.Wald, J.Wolfowitz, 19. , 1948. , P. 326-339.