Введение 3
Глава 1. Общие понятия проверки статистических гипотез 1
1.1 Сущность и виды проверки статистических гипотез 5
1.2 Выбор критериев для проверки статистических гипотез 9
1.3 Основные принципы расчета критериев для проверки статистических
гипотез 13
Глава 2. Язык программирования R 15
2.1. Основные возможности языка R 15
2.2. Применение языка программирования R 19
Глава 3. Проверка статистических гипотез о среднем нормального распределения 23
Глава 4 Практическая часть 30
Заключение 54
Список литературы
Последовательная проверка гипотез позволяет существенно сократить среднее количество наблюдений, тем самым экономя средства, ресурсы и т.п. В настоящей работе производится численное сравнение необходимого объема выборки критерия с фиксированным объемом выборки со средним объемом выборки последовательного критерия отношения вероятностей при проверке гипотезы о среднем нормального распределения.
Рассматривается задача проверки простой гипотезы относительно среднего нормального распределения при простой альтернативе. Статистические модели, основанные на нормальном распределении, являются самым распространенным типом статистических моделей, чем обуславливается актуальность работы. Для указанной задачи строится критерий с фиксированным объемом выборки и последовательный критерий. Для заданных ограничений на вероятности ошибок первого и второго рода, заданных значениях параметра при нулевой гипотезе и при альтернативе методом статистического моделирования находится необходимый объем выборки критерия с фиксированным объемом выборки и средний объем выборки последовательного критерия. Результаты численного исследования представлены в соответствующем разделе работы.
Целью дипломной работы является численное сравнение.
Объект исследования: проверка.
Для достижения цели работы поставлены следующие задачи:
1. Изучить предметную область;
2. Рассмотреть основные методы проверки статистических гипотез;
3. Выбрать среду программирования для проведения численного моделирования;
4. Создать программу;
5. Проверить работоспособность созданного программного обеспечения;
6. Проанализировать результаты и сделать выводы.
Теоретической базой для написания дипломного проекта являются работы отечественных и зарубежных авторов.
Задача проверки гипотезы в известном смысле напоминает задачу оценки параметров генеральной совокупности по данным выборки: высказывается некоторое утверждение и на основании данных выборки выносится суждение о справедливости этого утверждения.
Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй - о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае - параметрическими.
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
Статистические гипотезы утверждают что-либо о статистически устойчивых событиях (события, которые могут протекать многократно при идентичных условиях).
Критерии согласия требуют достаточно большой вычислительной работы, поэтому целесообразно перед тем, как их использовать, проверить с помощью более простых методов соответствие имеющихся экспериментальных данных нормальному распределению. Эти методы, естественно, обладают меньшей мощностью и позволяют установи только значительные расхождения с нормальным распределением, но если такие расхождения будут установлены, то необходимость в применении более точных, но более сложных критериев, как правило, отпадает.
В данной работе рассматриваются последовательные критерии, при которых накопление информации производят последовательным образом, при этом процесс добавления информации может прерываться, если накопленный объем данных уже обеспечил требуемый уровень достоверности. Если провести сравнение с классической схемой, применение последовательной схемы дает возможность сокращения объема наблюдений, что приводит к значительной экономии ресурсов, средств и времени.
Проведенное в дипломной работе исследование подтвердило актуальность решения задачи проверки статистических гипотез о параметре формы распределения.
Достигнута цель дипломной работы. Проведено численное сравнение количества наблюдений, которые необходимы при применении классической и последовательной схемы проверки статистической гипотезы при получении одинаковой достоверности.
При достижении цели работы решены такие задачи:
1. Изучена предметная область;
2. Рассмотрены основные методы для осуществления проверки статистической гипотезы;
3. Создана программа на зыке программирования R;
4. Проверено функционирование созданного программного приложения;
5. Проанализированы результаты и сделаны выводы.
1. Тейлор Дж. Введение в теорию ошибок. Пер. с англ. - М.: Мир, 2009. - 272 с.
2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2011. - 816 с.
3. Боровков А.А. Теория вероятностей. - М.: Наука, 1986. - 432 с.
4. Буховец А.Г., Москалев П.В. Статистический анализ данный в системе R. - Воронеж: ВГАУ, 2014. - 124 с.
5. Меретилов М.А. Методические указания к лабораторным работам по курсу «Методы анализа данный». - Красноярск: КГТУ, 2006. - 15 с.
6. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2010. - 479 с.
7. Кокунин В.А. Статистическая обработка данный при малом числе опытов. - Киев, 1974. - 790 с.
8. Третьяк Л.Н. Обработка результатов наблюдений. - Оренбург: ГОУ ОГУ, 2004. - 171 с.
9. Аффи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Пер. с англ. - М.: Мир, 1982. - 488 с.
10.Зарядов И.С. Введение в статистический пакет R: типы переменных, структуры данных, чтение изапись информации, графика / И.С.Зарядов, Москва, 2010, 207с.
11. Новиков Ан.А. Элементарное введение в последовательный
статистический анализ / Ан.А.Новиков, Мехико, 2007, 25с.
12. Леман Э. Проверка статистических гипотез / Э.Леман, Москва, 1979, 404с.
13. Kumar V., Ligges U. Package "reliaR"/ V.Kumar, U.Ligges, 2015, 153.
14. Боровков А.А. Математическая статистика / А.А.Боровков,
Новосибирск: Наука, издательство института математики, 1997, 772с.
15. Де-Гроот М. Оптимальные статистические решения / М.Де-Гроот, М.:Мир, 1974
16. Ghosh M., Mukhopadhyay N., Sen P.K., Sequentional Estimation /M.Ghosh, N.Mukhopadhyay,P.K.Sen, New-York:Wiley, 1997.
17. Novikov A. Optimal sequential tests for two simple hypotheses. Sequential analysis. /A.Novikov ,2009.,28(2)., P. 188-217.
18. Wald A., Wolfowitz J. Optimum character of the sequential probability ratio test. Annals of Mathematical Statistics. / A.Wald, J.Wolfowitz, 19. , 1948. , P. 326-339.
19. Novikov A. Optimal sequential tests for two simple hypotheses based on independent observations, International Journal of Pure and Applied Mathematics 45 (2), 291--314 (2008).
20. Novikov A. Optimal sequential procedures with Bayes decision rnles, Kybernetika 46 (4), 754--770 (2010).
21. Novikov A. Optimal sequential multiple hypothesis tests, Kybernetika 45 (2), 309--330 (2009).