Введение 3
Задачи 4
1. Теоретическая часть 4
1.1 Математическая постановка задачи построения множественной
линейной регрессионной модели (МЛРМ) 4
1.2 Мультиколлинеарность 6
1.3 Признаки мультиколлинеарности 8
1.4 Обзор существующих методов решения проблемы
мультиколлинеарности 11
2. Практическая часть 18
2.1 Обоснование и выбор среды разработки 18
2.2 Реализация примеров 19
2.3 Выводы по практической части работы 73
2.4 Практические рекомендации 75
3. Приложения 77
3.1 Приложение к теории 77
3.1.1 Критерий Стьюдента 77
3.1.2 Критерий Фишера (F-статистика) 80
3.1.3 Предположения регрессионного анализа 81
3.1.4 Коэффициент парной (частной) корреляции 81
3.2 Код программ 82
4. Список использованной литературы
На практике часто возникают случаи, когда для результативного признака требуется узнать зависимость от каких-то факторов, признаков, влияющих на него. Конечно, чаще всего это будет не один фактор, а совокупность. Поэтому возникает проблема определения данных факторов: как определить какие факторы влияют на результативный признак, и как сильно. Например, платежеспособность клиента в скоринговых системах банка при оформлении кредита, диагноз больного по результатам различных анализов, стоимость недвижимости в зависимости от параметров квартиры, самого дома, местоположения и т.д. и т.д.
Для решения данной проблемы используют математическую постановку задачи в виде множественной линейной регрессионной модели. Однако при решении задачи может возникнуть проблема в нахождении линейной зависимости переменной отклика от факторов, включаемых в модель, из-за зависимости между факторами. Мультиколлинеарность - тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат, которая затрудняет оценивание регрессионных параметров. Поэтому перед построением модели задачи, нужно определить какие из факторов следует включать в модель для решения задачи.
В данной работе рассмотрены признаки наличия мультиколлинеарности в модели; обзор способов решения данной проблемы; анализ экспериментов по выбору факторов, включаемых в МЛРМ с помощью применения метода LASSO; составлены рекомендации по решению проблемы мультиколлинеарности в МЛРМ на основе экспериментов.
Цель работы
Целью данной работы является выработка рекомендаций по решению проблемы мультиколлинеарности в множественной линейной регрессионной модели.
Задачи
Для достижения поставленной цели необходимо решить следующие задачи.
-сделать обзор существующих подходов к решению данной проблемы мультиколлинеарности в множественной линейной регрессионной модели (МЛРМ);
- изучить метод LASSO (Least absolute shrinkage and selection operator);
- провести в среде R численный эксперимент по выбору факторов, включаемых в МЛРМ (для задач с разным количеством факторов);
- составить рекомендации по решению проблемы мультиколлинарности в многофакторной линейной регрессии.