Тип работы:
Предмет:
Язык работы:


ПРИМЕНЕНИЕ МЕТОДА LASSO ДЛЯ ВЫБОРА ФАКТОРОВ, ВКЛЮЧАЕМЫХ В МНОЖЕСТВЕННУЮ РЕГРЕССИОННУЮ МОДЕЛЬ

Работа №38532

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы94
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
202
Не подходит работа?

Узнай цену на написание


Введение 3
Задачи 4
1. Теоретическая часть 4
1.1 Математическая постановка задачи построения множественной
линейной регрессионной модели (МЛРМ) 4
1.2 Мультиколлинеарность 6
1.3 Признаки мультиколлинеарности 8
1.4 Обзор существующих методов решения проблемы
мультиколлинеарности 11
2. Практическая часть 18
2.1 Обоснование и выбор среды разработки 18
2.2 Реализация примеров 19
2.3 Выводы по практической части работы 73
2.4 Практические рекомендации 75
3. Приложения 77
3.1 Приложение к теории 77
3.1.1 Критерий Стьюдента 77
3.1.2 Критерий Фишера (F-статистика) 80
3.1.3 Предположения регрессионного анализа 81
3.1.4 Коэффициент парной (частной) корреляции 81
3.2 Код программ 82
4. Список использованной литературы


На практике часто возникают случаи, когда для результативного признака требуется узнать зависимость от каких-то факторов, признаков, влияющих на него. Конечно, чаще всего это будет не один фактор, а совокупность. Поэтому возникает проблема определения данных факторов: как определить какие факторы влияют на результативный признак, и как сильно. Например, платежеспособность клиента в скоринговых системах банка при оформлении кредита, диагноз больного по результатам различных анализов, стоимость недвижимости в зависимости от параметров квартиры, самого дома, местоположения и т.д. и т.д.
Для решения данной проблемы используют математическую постановку задачи в виде множественной линейной регрессионной модели. Однако при решении задачи может возникнуть проблема в нахождении линейной зависимости переменной отклика от факторов, включаемых в модель, из-за зависимости между факторами. Мультиколлинеарность - тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат, которая затрудняет оценивание регрессионных параметров. Поэтому перед построением модели задачи, нужно определить какие из факторов следует включать в модель для решения задачи.
В данной работе рассмотрены признаки наличия мультиколлинеарности в модели; обзор способов решения данной проблемы; анализ экспериментов по выбору факторов, включаемых в МЛРМ с помощью применения метода LASSO; составлены рекомендации по решению проблемы мультиколлинеарности в МЛРМ на основе экспериментов.
Цель работы
Целью данной работы является выработка рекомендаций по решению проблемы мультиколлинеарности в множественной линейной регрессионной модели.
Задачи
Для достижения поставленной цели необходимо решить следующие задачи.
-сделать обзор существующих подходов к решению данной проблемы мультиколлинеарности в множественной линейной регрессионной модели (МЛРМ);
- изучить метод LASSO (Least absolute shrinkage and selection operator);
- провести в среде R численный эксперимент по выбору факторов, включаемых в МЛРМ (для задач с разным количеством факторов);
- составить рекомендации по решению проблемы мультиколлинарности в многофакторной линейной регрессии.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


1. Johannes Ledolter. Wiley,«DATA MINING AND BUSINESS ANALYTICS WITH R», , University of Iowa, 2013.p.71-82
2. Abhijit Ghatak “Machine Learning with R” p.95-102,107-115
3. https://compscicenter.ru/media/slides/math stat 2014 spring/2014 04 09 math stat 2014 spring 1.pdf
4. http://statsoft.ru/home/textbook/modules/stmulreg.html#assumptions
5. http://statistica.m/theory/mnozhestvennaya-lineynaya-regressiya/
6. https: //ranalytics. github. io/data-mining/042-Re gularization. html
7. https://logic,pdmi.ras.ru/~sergey/teaching/mlhse17/07-lasso.pdf
8. http://lib.qrz.ru/book/export/html/11304
9. http://www■machinelearning■ru/wiki/index■php?title=Лассо
10. vigg.ru/fileadmin/user_upload/Rubanovich_regression_analysis2016.ppt
11 .https://basegroup.m/community/articles/feature-selection
12. http://statsoft.ru/home/textbook/modules/stgenregmod.html#best subset
13. Кремер Наум Шевелевич, “Теория вероятностей и математическая статистика”, 5-е издание, стр.425-430
14. https://kpfu.ru/docs/F407025247/metodichka R 2.pdf
15. http://www.sthda.com/english/articles/36-classification-methods- essentials/149-penalized-logistic-regression-essentials-in-r-ridge-lasso-and- elastic-net/
16. https://scikit-
learn.org/stable/auto examples/applications/plot tomography l1 reconstruc
tion.html#sphx-glr-auto-examples-applications-plot-tomography-l1-
reconstruction-py
17. https://www.rstatisticsblog.com/data-science-in-action/lasso-regression/
18. https://www.r-bloggers.com/ridge-regression-and-the-lasso/
19. http://www. ccas. ru/voron/download/Re gression. pdf
20. http://repo .ssau. ru/bitstream/Informacionnye-tehnologii-i- nanotehnologii/Sravnenie-metodov-Ridzhregressii-i-LASSO-v-zadachah- obrabotki-dannyh-64145/1/paper%20315 1748-1755.pdf
21 ■https://craftappmobile.com/l1-vs-l2-regularization/
http://www.machinelearning.ru/wiki/images/7/7e/VetrovSem11 LARS.pdf S.pdf
23. https://pro glib.io/p/feature-selector/
24. https://pro glib.io/p/python-data-science/
25. https://proglib.io/p/google-ml-recipes/
26. https://pro glib.io/p/machine-learning-concepts/
27. https://proglib.io/p/11-ml-algorithms/
2 8. http s: //pro gl ib. io/p/r-and-python/
29. Видеохостинг : https: //www.youtube. com/watch?v=pi QqsoLY eNM
30. http://www.sthda.com/english/articles/36-classification-methods- essentials/149-penalized-logistic-regression-essentials-in-r-ridge-lasso-and- elastic-net/
31 .https://vk.com/doc506116 437088370 32.http://eos.ibi.spb.ru/umk/4 5/5/print/5 R1 T2.pdf


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ