АННОТАЦИЯ 4
Введение 3
1 Особенности рынка коммерческой недвижимости в РФ 5
1.1 Понятие и классификация коммерческой недвижимости 5
1.2 Анализ нормативно-правовых документов 10
1.3 Анализ подходов к экономической оценке коммерческой недвижимости 12
2 Теоретические основы машинного обучения 23
2.1 Основные понятия и методы машинного обучения 23
2.2 Обзор инструментов реализации 36
2.3 Оценка качества построения модели машинного обучения 40
3 Построение модели прогнозирования 45
3.1 Проверка и преобразование данных 45
3.2 Реализация модели 49
Заключение 56
Литература 58
Приложение А - Таблица признаков исходных данных 63
Приложение Б - Диаграммы рассеяния относительно целевого признака 65
Приложение В - Корреляционная зависимость относительно целевого признака 68
Приложение Г - График дерева принятия решений 69
Приложение Д - Графики точности модели при изменении количества деревьев 70
Приложение Е - Графики точности модели при изменении глубины деревьев 71
Приложение Ж - Программный код реализации 72
Приложение И - Предметный указатель компетенций 77
В условиях развития рынка коммерческой недвижимости оценка и прогнозирование стоимости объектов недвижимости приобретает все большую необходимость. Инициаторами оценки стоимости коммерческого объекта могут выступать различные экономические агенты, обладающие отличающимися друг от друга мотивами. Собственнику необходимо проводить оценку в случаях реструктуризации, реорганизации, совершения сделок по слиянию или поглощению для обоснования размера эмиссии новых акций, а также при ликвидации компании. Инвестор, рассматривает ценность бизнеса с точки зрения текущего выражения будущих выгод от деятельности предприятия, обосновывая тем самым целесообразность осуществления инвестиций. Для кредиторов важным является непосредственная оценка имущественного комплекса компании для определения возможного размера денежных средств, которое они смогут взыскать в случае неисполнения заемщиком своих обязательств.
При оценке отдельные специалисты обычно рассматривают небольшой сегмент рынка, включающий несколько ближайших аналогов, что приводит к высокой степени ошибок. Именно поэтому важно независимое, точное и быстрое ценовое представление на данном рынке. Основная трудность заключается в ограниченном количестве данных по коммерческим объектам, а также сильное ценовое различие при схожих характеристиках объектов, что в дальнейшем затрудняет обоснование корректности результатов.
Актуальность выбранной темы заключается в том, что полноценного автоматизированного инструмента для массовой оценки коммерческой недвижимости в настоящий момент не существует. В данной работе машинное обучение выступает эффективным инструментом для решения прогнозирования стоимости коммерческих объектов на основе анализа рыночных данных.
Объектом исследования данной работы выступает рынок коммерческой недвижимости.
Предметом исследования выступает использование методов машинного обучения для прогнозирования стоимости объектов недвижимости.
Цель данной работы - создание модели прогнозирования стоимости коммерческой недвижимости с применением методов машинного обучения. Для достижения поставленной цели были определены следующие задачи:
1. Рассмотреть состояние рынка коммерческой недвижимости.
2. Изучить существующие методы оценки стоимости коммерческой недвижимости.
3. Провести анализ факторов, влияющих на достоверность результата оценки коммерческой недвижимости и выявить проблемы при оценке коммерческой недвижимости.
4. Определить набор используемых средств для дальнейшей разработки модели.
5. Построить модель прогнозирования стоимости коммерческой недвижимости, используя различные алгоритмы машинного обучения.
6. Провести анализ работы построенных моделей, оценить качество и сделать выводы относительно их предсказательной способности.
7. Определить наиболее важные признаки, влияющие на точность прогнозирования цен коммерческой недвижимости.
Практическая значимость исследования заключается в получении адекватной модели прогнозирования стоимости для объектов коммерческой недвижимости.
Для решения поставленных в работе задач использовались различные методы, в частности, аналитический метод, который применялся для изучения литературы и нормативно-правовых актов. Сравнительный - был необходим для сопоставления подходов и методов оценки изучения научной литературы. Теоретическую базу составили монографии, учебники и статьи.
Текст работы структурирован следующим образом. В первой главе рассматриваются теоретические основы методов оценки стоимости коммерческой недвижимости и описание состояния рынка. Во второй главе проведен анализа инструментов построения и последующий выбор для реализации. В третьей главе происходит построение прогнозной модели, используя различные алгоритмы машинного обучения: линейная множественная регрессия, дерево принятия решений и Random Forest. Определяются наиболее важные признаки относительно целевого атрибута, и проводится оценка предсказательной точности модели на основе полученных признаков. В результате модель Random Forest на основе важных признаков, показывает наилучший результат в прогнозировании цен коммерческой недвижимости.
В ходе исследования была реализована модель прогнозирования цен коммерческой недвижимости.
Поставленные цели были достигнуты следующим образом. Для освоения темы оценки коммерческой недвижимости было изучено и проанализировано множество научной литературы. Для понимания актуальности применения машинного обучения к прогнозированию стоимости коммерческой недвижимости были рассмотрены статьи, использующие машинное обучение в качестве методологии исследования. Была дана характеристика рынка коммерческой недвижимости и сформулирована необходимость применения методов машинного обучения.
Продемонстрированы подходы к описанию и построению прогнозной модели, а также рассмотрены основные методы машинного обучения и задачи, которые они могут решать. Изучены основные категории ошибок при рассмотрении моделей прогнозирования и описаны метрики для оценки предсказательной способности модели.
Сформулирована задача для построения моделей, а также способы построения алгоритмов машинного обучения. В результате анализа инструментов построения моделей был выбран наиболее подходящий для данной задачи язык программирования «Python». Основной средой разработки был выбран «GoogleColab», так как данная среда позволяет осуществлять реализацию, требуя меньших усилий, чем требуется при использовании других платформах.
Была сформирована выборка данных путем заполнения пропущенных переменных и подготовлена для построения выбранными алгоритмами машинного обучения . Для последующего обучения модели было произведено разделение набора данных на обучающий и тестовый набор соответственно.
Проведено построение модели, используя различные алгоритмы машинного обучения: линейная множественная регрессия, дерево принятия решений и Random Forest. Проанализирована и сопоставлена их предсказательная точность. Наиболее точной прогнозной моделью оказался Random Forest.
Были определены наиболее важные признаки относительно целевого атрибута и проведена оценка предсказательной точности модели на основе полученных признаков . В результате чего можно сделать вывод, что построение модели Random Forest на основе наиболее важных признаков показало наилучший результат в прогнозировании цен коммерческой недвижимости.
Реализация модели подтвердила допустимость применения метода машинного обучения для прогнозирования цен коммерческой недвижимости. Благодаря машинному обучению удалось решить задачи, в которых обычные алгоритмические решения оказались бы менее эффективны. По результатам тестирования сделаны выводы о применении алгоритма: применение метода машинного обучения в связи с оценкой цен на коммерческую недвижимость оказалось очень эффективным, но требует больших ресурсов и строгого подхода, ориентированного на данные. Без правильного и глубокого понимания данных и лежащих в их основе структур было бы невозможно разработать адекватную прогнозную модель.
Ввиду всего вышеперечисленного можно подвести итог данной работы. Все цели, поставленные перед началом исследования можно считать достигнутыми, задачи выполненными, а результатом исследования является построенная модель машинного обучения, с помощью которой можно прогнозировать стоимость коммерческой недвижимости.
1. Федеральный закон от 29 июля 1998 г. № 135-ФЗ «Об оценочной деятельности в
Российской Федерации» [Электронный ресурс] // «Система Гарант»: справочная правовая система. URL: http://base.garant.rU/12112509/#ixzz6Mymq22LZ (дата обращения:
02.03.2022).
2. Приказ Минэкономразвития России от 20.05.2015 № 297 «Об утверждении
Федерального стандарта оценки «Общие понятия оценки, подходы и требования к проведению оценки (ФСО № 1)» [Электронный ресурс] // «Консультант Плюс»:
справочная правовая система. URL:
http://www.consultant.rU/document/cons_doc_LAW_180064/#dst100009 (дата обращения: 02.03.2022).
3. Приказ Минэкономразвития России от 20.05.2015 № 298 «Об утверждении Федерального стандарта оценки «Цель оценки и виды стоимости (ФСО № 2)» [Электронный ресурс] // «Консультант Плюс»: справочная правовая система. URL: http://www.consultant.rU/document/cons_doc_LAW_180061/#dst100009 (дата обращения: 02.03.2022).
4. Приказ Минэкономразвития России от 20.05.2015 № 299 (ред. от 06.12.2016) «Об утверждении Федерального стандарта оценки «Требования к отчету об оценке (ФСО № 3)» [Электронный ресурс] // «Консультант Плюс»: справочная правовая система. URL: http://www.consultant.ru/document/cons_doc_LAW_180059/#dst100009 (дата обращения: 02.03.2022).
5. Приказ Минэкономразвития России от 01.06.2015 № 326 «Об утверждении
Федерального стандарта оценки «Оценка бизнеса (ФСО № 8)» [Электронный ресурс] // «Консультант Плюс»: справочная правовая система.
URL:http://www.consultant.ru/document/cons_doc_LAW_180654/#dst100009 (дата
обращения: 02.02.2020).
8. Приказ Минэкономразвития России от 17.11.2016 № 721 «Об утверждении Федерального стандарта оценки «Определение ликвидационной стоимости (ФСО № 12)» [Электронный ресурс] // «Консультант Плюс»: справочная правовая система. URL: http://www.consultant.rU/document/cons_doc_LAW_207684/#dst100008 (дата обращения: 02.02.2020).
9. Анализ малых данных [Электронный ресурс] // Научный блог Александр
Дьяконов «Анализ малых данных» - Электрон. дан. - 2022. - URL: https://alexanderdyakonov.files.wordpress.com/2018/10/book_08_metrics_12_blog1.pdf (дата обращения: 28.04.2022)
10. Асаул А. Н. Экономика недвижимости: учебник для вузов / А. Н. Асаул, С. Н. - Санкт-Петербург, 2019. - 158 с.
11. Баранов С. В. Оценка недвижимости: учебное пособие / С. В. Баранов; под ред. д-ра экон. наук, проф. М. А. Федотовой. - М.:КНОРУС, - 2011. - 344 с.
12. Вандерплас Д. Python для сложных задач: наука о данных и машинное обучение. - СПб: Питер, 2018. - 576 с.
13. Вычислительные методы обучения по прецедентам [Электронный ресурс] //
Лекции «Вычислительные методы обучения по прецедентам» - Электрон. дан. - 2022. Вычислительные методы обучения по прецедентам - URL:
http://www.machinelearning.rU/wiki/images/6/6d/voron-ml-1.pdf (дата обращения: 28.04.2022)
14. Введение в машинное обучение [Электронный ресурс] - Электрон. дан. - 2022. Введение в машинное обучение - URL: http://bioinformaticsinstitute.ru/ (дата обращения: 28.04.2022)
15. Грибоевский С. В. Оценка доходной недвижимости. / С.В. Грибоевский. - СПб: Питер, 2007. - 325 с.
...57