Тип работы:
Предмет:
Язык работы:


МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА КАЧЕСТВА ПАРАМЕТРИЧЕСКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ

Работа №186498

Тип работы

Бакалаврская работа

Предмет

математика и информатика

Объем работы70
Год сдачи2016
Стоимость4700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
19
Не подходит работа?

Узнай цену на написание


РЕФЕРАТ 2
ВВЕДЕНИЕ 4
1. Методы проверки качества однопараметрической регрессионной модели 7
1.1. Построение однопараметрической регрессионной модели 7
1.2. Проверка гипотезы о значимости параметров модели 10
1.3. Проверка согласия модели с экспериментальными данными 12
1.3.1. Критерий Фишера для проверки гипотезы об адекватности модели 13
1.4. Анализ остатков 16
1.4.1 Проверка нарушений основных предположений 17
1.4.2. Выбросы 18
1.5. Анализ эмпирического моста 21
2. Методы проверки качества множественной регрессионной модели 26
2.1. Построение множественной регрессионной модели 26
2.2. Проверка гипотезы о значимости параметров модели 31
2.3. Проверка согласия модели с экспериментальными данными 36
2.3.1. Критерий Фишера для проверки гипотезы об адекватности модели 36
2.4. Анализ остатков 40
2.4.1 Проверка нарушений основных предположений 40
2.4.2. Выбросы 42
2.5. Мультиколлинеарность 45
2.6. Анализ эмпирического моста 47
3. Прогнозирование данных с помощью выявленных качественных моделей 51
ЗАКЛЮЧЕНИЕ 54
ЛИТЕРАТУРА 55
Приложение А. Исходные данные курсов валют 56
Приложение Б. Критерий Фишера 66


В настоящее время для обработки и исследования данных все чаще используют математический аппарат, одним из них является регрессионный анализ. Он позволяет исследовать зависимость одной переменной от другой, а так же её влияние, с учетом некоторой погрешности. Преимущество регрессионных моделей для обработки данных состоит как в простоте их построения, так и в богатстве интерпретаций. Одним из ключевых вопросов является качество построенных моделей [1].
Регрессия - это функция описывающая зависимость условного среднего значения случайной величины от заданных фиксированных значений другой величины или нескольких величин [2]. Этот термин в статистике впервые был использован Френсисом Гальтоном в 1886 г.
Регрессионной моделью, прежде всего, является гипотеза, которую необходимо проверить статистически, после чего она либо принимается, либо отвергается. Таким образом, объединяется достаточно широкий класс функций, описывающих некоторую закономерность регрессора и отклика. При этом для построения модели используются экспериментальные данные. Недостатками регрессионного анализа являются модели, имеющие как простую, так и сложную структуры. При простой структуре модель может оказаться недостаточно точной, а при сложной, замедлить процесс работы при оценке неизвестных параметров, проверке гипотез и получении результатов. При использовании регрессионного анализа необходимо определить задачи, необходимые для получения наилучшего результата:
а) выбор типа и структуры модели;
б) определение гипотезы порождения данных, определить, какое распределение имеют случайные величины;
в) выбрать функцию для оценки качества аппроксимации;
г) выбрать статистические методы идентификации оценивания неизвестных параметров модели.
Таким образом, модель описывает вероятностное соотношение между регрессором (независимыми переменными) и откликом (зависимыми переменными). Первым приближением для функции регрессии является линейная однопараметрическая регрессионная модель, которая имеет следующий вид
Yi = GXi + Ei, i = 1,..., n,
где X[ - значения регрессора, 6ER - неизвестный параметр регрессии, г{,...,гп - регрессионные ошибки, независимые одинаково распределенные случайные величины с нулевым математическим ожиданием и конечной ненулевой дисперсией <т2. Ц - значения отклика. Неизвестный параметр регрессионной модели в обычно оценивают с помощью метода наименьших квадратов, получая оценку в.
Регрессионный анализ позволяет узнать, насколько точно были подобраны неизвестные параметры модели, хорошо ли подобрана сама модель описывающая зависимость. Регрессионные модели бывают следующих типов: линейные;
однопараметрические; множественные; с мультиколлинеарностью. В данной работе с практической точки зрения изучены однопараметрические и множественные линейные регрессионные модели.
Целью работы является построение регрессионных моделей и проведения сравнительного анализа существующих подходов к оценке их качества на примере исследования зависимостей. В первом случае рассматривается зависимость курсов американского доллара, и евро через их относительные курсы к рублю. Во втором случае рассматривается зависимость курса американского доллара, и евро от других валют через их относительные курсы к рублю.
Для этого необходимо решить следующие задачи:
а) Изучить теоретико-методическую литературу построения регрессионных моделей, в частности линейных однопараметрических и множественных моделей;
б) Вычислить параметры и остатки регрессионных моделей;
в) Изучить качество моделей с помощью следующих методов:
1. проверка значимости параметров модели;
2. проверка гипотезы о согласованности модели с экспериментальными данными;
3. анализ остатков;
4. мультиколлинеарность;
5. анализ эмпирического моста;
г) Практическое использование полученных качественных моделей.
Идентификация регрессионных моделей осуществляется на основе реальных данных за период с 1 марта 2014 до 1 марта 2015, а для практической проверки за период с 1 марта 2015 до 1 марта 2016, взятых с официального сайта ЦБ РФ http://www.cbr.ru.
Данная работа состоит из введения, трех разделов, заключения, списка использованной литературы и двух приложений.
В первом разделе данной работы изучается построение линейных однопараметрических регрессионных моделей описывающих зависимость курсов доллара США и евро. Формулируются две гипотезы для статистического исследования и аппроксимации данных, и проводится первичный анализ моделей. Изучены методы проверки качества однопараметрических линейных регрессионных моделей. Для каждого метода были произведены численные расчеты на основе реальных данных и подведены итоги о качестве построенных моделей. После анализа качества каждым из методов был проведен их сравнительный анализ, для выявления их преимуществ и недостатков. По полученным результатам выбраны те модели, которые при исследовании оказались наиболее подходящими для аппроксимации.
Во втором разделе рассматривается построение множественных линейных регрессионных моделей описывающих зависимость курсов доллара США и евро от других различных валют. Проведен выбор двух гипотез для описания зависимостей. Первичное исследование качества построенных моделей. Исследуется качество множественных регрессионных моделей различными статистическими методами, в том числе и методами, использовавшихся для проверки качества однопараметрических моделей. Используемые методы статистически сравниваются между собой, для выявления погрешности каждого из методов. После получения результатов сделан вывод о качестве первой и второй множественных моделях.
В третьем разделе модели, которые по результатам используемых методов оказались качественными были использованы на практике для прогнозирования. Прогнозирование проводилось для курсов доллара США и евро, как для однопараметрических, так и для множественных регрессионных моделей на период с 1 марта 2015 до 1 марта 2016. Затем проведен сравнительный анализ полученных значений по модели с реальными данными за тот же период.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Мною в ходе данной работы были изучены регрессионные модели, их разновидности и методы исследования их качества. На основе реальных данных построены четыре регрессионные модели, проверяющие две гипотезы. Статистическими методами была выполнена проверка качества построенных регрессионных моделей. В результате получилось, что однопараметрические регрессионные модели во всех случаях проверки качества показали хорошие результаты, что нельзя сказать о моделях множественной регрессии. В моделях множественной регрессии при исследовании их качества вызвала сомнения в использовании второй модели, так как в каждом исследовании были получены не утешительные результаты её качества. Первая модель множественной регрессии после анализа значимости параметров стала однопараметрической, что значительно упростило работу с ней.
Таким образом, можно сделать вывод, что из выше изученных методов лучше описывает качество моделей анализ значимости параметров, анализ на наличие выбросов и анализ эмпирического моста. В результате были выявлены три качественные регрессионные модели:
1) зависимость логарифмов курса доллара от логарифмов курса евро;
2) зависимость логарифмов курса евро от логарифмов курса доллара;
3) зависимость логарифмов курса доллара от логарифмов курсов евро, юаня, фунта, иены и франка (в частном случае зависимость только от логарифмов курса фунта).
Используя качественные регрессионные модели, были спрогнозированные данные для подтверждения гипотезы о том, что данные модели подходят не только для аппроксимации экспериментальных данных, но так же и для прогнозирования.
В ходе работы были получены знания по работе с пакетом MatLab. В этом пакете достаточно удобно использовать встроенные статистические функции, а так же программировать гипотезы. Для статистики в настоящее время это очень хороший инструмент для работы и исследований. Исследование качества с помощью эмпирических мостов позволяет по-новому оценить качество линейных параметрических регрессионных моделей. Полученные результаты, несомненно, вызывают существенный интерес к дальнейшим исследованиям в данной области.



1. Айвазян С., Мхитарян В. Прикладная статистика и основы эконометрики.-М.:Юнити- дата, 2001. - 656 с.
2. Зарубина В.С. Крищенко А.П. Математическая статистика XVII- М.: МГТУ им. Н.Э.Баумана, 2001. - 424с.
3. Большев Л.Н., Смирнов Н.В.Таблицы математической статистики.- М.: Наука, 1983. - 417с.
4. Ковалевский А.П., Шаталин Е.В. Ассимптотика сумм остатков однопараметрической линейной регрессии, построенной по порядковым статистикам // - Новосибирск, 2014.
5. Gastwirth J.L. A general definition of the Lorenz curve // Econometrica, Vol.39, pp 1037¬1039, 1971.
6. Billingsley P. Convergence of Probablity Measures. -Moscow: Science, 1977.
7. Шаталин Е. В. Исследование регрессионных моделей зависимости курсовамериканского доллара и евро с помощью эмпирического моста; Институт математики им. С.Л.Соболева CO РАН. - Новосибирск, 2014. - 6 с.
8. Коновалов Ю. В. Статистическое моделирование с использованиемрегрессионного анализа: Электронное учебное издание. - М.: МГТУ им. Н.Э.Баумана, 2013. - 72с.
9. Кибзун А. И. Теория вероятности и математическая статистика: Базовый курс с примерами и задачами. / А. И. Кибзун, Е. Р. Горяинова, А. В. Наумов, А. Н. Сиротин. - М.:Физматлит, 2002. - 224с.
10. Кремер Н. Ш. Теория вероятности и математическая статистика. - М.: Юнити, 2004. - 575с.
11. Фёрст Э. Методы корреляционного и регрессионного анализа: пер. с нем. и предисловие В. М. Ивановой. / Э. Фёрст, Б. Рёнц. - М.: Финансы и статистика, 1983.- 302 с. 



Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ