Аннотация 2
Abstract 3
Введение 5
Глава 1 Анализ проблематики определения справедливых цен на недвижимость 7
1.1 Обзор особенностей оценки недвижимости 7
1.2 Обзор моделей для описания зависимостей между входными
параметрами и выходными 8
Глава 2 Разработка алгоритма для оценки недвижимости на основе машинного обучения 14
2.1 Оценка недвижимости как задача регрессионного анализа
данных 14
2.2 Ансамблевые алгоритмы машинного обучения 16
2.3 Применение гибридного машинного обучения для увеличения
точности прогнозирования цен на недвижимость 20
2.5 Алгоритм прогнозирования цен на недвижимость 22
Глава 3 Разработка интеллектуальной системы для оценки недвижимости .. 25
3.1 Особенности реализации системы 25
3.2 Тестирование системы и определение оптимальных параметров ее
работы 39
Заключение 45
Список используемой литературы и используемых источников 47
Оценка стоимости недвижимости применяется как организациями при реализации своей коммерческой деятельности, так и физическими лицами планирующих покупку или продажу жилья. Например, банки проводят оценку квартиры перед выдачей своему клиенту ипотечного кредита на ее покупку, чтобы понять за какую сумму возможна ее реализация, если клиент не справится с оплатой кредита. В рамках судебных заседаний в рамках гражданских процессов также может потребоваться оценка стоимости квартиры в рамках рассмотрения дела о наследстве или выплате компенсаций. Физические лица, выбирающие себе квартиру для покупки, также проводят оценку квартир, чтобы определить ее справедливую цену. Брокеры недвижимости для формирования коммерческих предложений своим клиентам также производят оценку квартир.
Благодаря развитию технологий искусственного интеллекта стало возможным автоматизация некоторых видов деятельности человека [1]. В рамках данной бакалаврской работы предлагается автоматизировать процесс оценки недвижимости.
Цель выпускной квалификационной работы - разработка интеллектуальной системы для определения справедливых цен на жилую недвижимость.
Задачами исследования является:
- анализ проблем определения справедливых цен на недвижимость;
- разработка алгоритма определения цен на квартиры;
- программная реализация интеллектуальной системы и ее тестирование.
Данная работа состоит из введения, трех глав, заключения и списка используемой литературы...
При выполнении бакалаврской работы были получены следующие результаты:
- определение стоимости квартиры используется: банками для снижения своих рисков при принятии решения о выдаче на нее ипотеки, брокерами недвижимости для формирования коммерческих предложений своим клиентам, покупателями недвижимости для определения справедливой стоимости жилья, судебными органами при решении вопросов наследования и определении размеров компенсации;
- процесс определения стоимости квартиры можно автоматизировать за счет применения алгоритмов машинного обучения. Для этого необходимо обучить регрессионную модель, которая на вход будет получать параметры квартиры, а на выходе будет выдавать ее прогнозную стоимость;
- проведен сравнительный анализ регрессионных моделей, реализуемых с помощью свободно распространяемых библиотек, результаты сравнения представлены в таблице 1;
- предложен алгоритм оценки стоимости квартиры, который включает в себя 4 этапа: подготовка данных, которые будут использоваться в качестве примеров при обучении регрессионных моделей; независимое обучение на этих данных двух регрессионных моделей Random forest и XGBoost; настройка совместной работы этих регрессионных моделей для формирования итогового прогноза цены квартиры; использование полученной гибридной модели для прогнозирования цены квартиры с заданными пользователем параметрами недвижимости;
- этап подготовки данных включает в себя сбор данных, кодирование категориальных признаков, отсеивание записей с аномальными значениями и расчет производных признаков. Этап построения регрессионных моделей включает в себя обучение модели Random forest и обучение модели XGBoost. Этап настройки совместной работы моделей включает в себя подбор оптимального коэффициента k. Этап прогнозирования включает в себя получение от пользователя параметров квартиры и расчет итоговой цены с учетом параметра k.
- с использованием языка программирования python разработано программное обеспечение для определения стоимости квартир. Стоимость квартир определяется на основе прогнозов двух ансамблевых регрессионных моделей Random forest и XGBoost;
- в разработанном программном обеспечении оценка стоимости квартир проводится на основе анализа таких признаков, как материал стен, номер этажа, этажность дома, площадь квартиры, площадь кухни, расстояние до центра города, азимут;
- для имеющегося набора данных определено оптимальное значение коэффициента k, влияющего на долю участия каждой из двух моделей в формировании конченой оценки стоимости квартиры. Оптимальным значением является k=0,2, так как при этом значении обеспечивается минимальная ошибка MAE=7,5% и максимальное значение коэффициента детерминации R2=0,84;
- тестирование разработанного программного обеспечения проводилось на объявлениях сервиса cian.ru для квартир в городе Москва. Результаты тестирования доказали состоятельность предложенных в исследовании подходов.
1. Алханов А.А. Машинное обучение и его применение в
современном мире // Проблемы науки. 2021. №7 (66). URL:
https:ZZcyberleninka.ru/articleZn/mashinnoe-obuchenie-i-ego-primenenie-v- sovremennom-mire (дата обращения: 04.04.2023).
2. Григорьев Е.А. Разведочный анализ данных с помощью Python /
Григорьев Е.А., Климов Н.С // E-Scio. 2020. №2 (41). URL:
https:ZZcyberleninka.ru/articleZn/razvedochnyy-analiz-dannyh-s-pomoschyu-python (дата обращения: 22.09.2022).
3. Г ришков, Д.Ю. Язык высокого уровня программирования Python /
Гришков Данила Юрьевич, Аусилова Назерке Мырзабековна // НИР/SfeR. 2022. №1 (9). URL: https://cyberleninka.ru/article/n/yazyk-vysokogo-urovnya-
programmirovaniya-python (дата обращения: 22.09.2022).
4. Есбаганбетов М.Б. Применение нейросетевых методов машинного обучения к задаче решения дифференциальных уравнении разных видов / Есбаганбетов Манас Байрамбаевич, Иманбаев Кайрат Советович, Тергеуов Олжас Серикович // Universum: технические науки. 2022. №5-2 (98). URL: https:ZZcyberleninka.ru/articleZn/primenenie-neyrosetevyh-metodov-mashinnogo- obucheniya-k-zadache-resheniya-differentsialnyh-uravnenii-raznyh-vidov (дата обращения: 04.04.2023).
5. Невзорова В. А. Методы машинного обучения в прогнозировании исходов и рисков сердечно-сосудистых заболеваний у пациентов с артериальной гипертензией (по материалам эссе-рфв Приморском крае) / Невзорова В. А., Плехова Н. Г., Присеко Л. Г., Черненко И. Н., Богданов Д. Ю., Мокшина М. В., Кулакова Н. В. // РКЖ. 2020. №3. URL: https:ZZcyberleninka.ru/articleZn/metody-mashinnogo-obucheniya-v- prognozirovanii-ishodov-i-riskov-serdechno-sosudistyh-zabolevaniy-u-patsientov- s-arterialnoy (дата обращения: 04.04.2023).
6. Негодин В.А. Машинное обучение в языке программирования
Python // Форум молодых ученых. 2019. №8 (36). URL:
https:ZZcyberleninka.ru/articleZn/mashinnoe-obuchenie-v-yazyke- programmirovaniya-python (дата обращения: 04.04.2023).
7. Разин С.А. Что должен знать разработчик на языке python, работая
в сфере Data Science // E-Scio. 2020. №8 (47). URL:
https:ZZcyberleninka.ru/articleZn/chto-dolzhen-znat-razrabotchik-na-yazyke-python- rabotaya-v-sfere-data-science (дата обращения: 04.04.2023).
8. Чибирова, М.Э. Анализ данных и регрессионное моделирование с
применением языков программирования Python и R / Чибирова Марина Эльбрусовна // Научные записки молодых исследователей. 2019. №2. URL: https:ZZcyberleninka.ru/articleZn/analiz-dannyh-i-regressionnoe-modelirovanie-s- primeneniem-yazykov-programmirovaniya-python-i-r (дата обращения:
22.09.2022).
9. Li, S. Research on orthopedic auxiliary classification and prediction model based on XGBoost algorithm Z Shenglong Li, Xiaojing Zhang ZZ Neural Computing and Applications: Deep Learning & Neural Computing for Intelligent Sensing and Control. - Springer Nature Switzerland AG, 2020. - №32. - pp. 1971— 1979.
10. Bentejac, C. A comparative analysis of gradient boosting algorithms / Candice Bentejac, Anna Csorgo, Gonzalo Martinez-Munoz // Artificial Intelligence Review. - Springer Nature Switzerland AG, 2021. - №54. - pp. 1937-1967.
11. Bernard, S. Forest-RK: A New Random Forest Induction Method Z Simon Bernard, Laurent Heutte, Sebastien Adam // International Conference on Intelligent Computing ICIC 2008: Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence. - Springer-Verlag Berlin Heidelberg, 2008. - pp. 430-437.
12. Cascaded Random Forest for Fast Obj ect Detection Z Florian Baumann, Arne Ehlers, Karsten Vogt, Bodo Rosenhahn ZZ Scandinavian Conference on Image Analysis SCIA 2013: Image Analysis. - Springer-Verlag Berlin Heidelberg, 2013. - pp. 131-142.
13. Demir, S. An investigation of feature selection methods for soil liquefaction prediction based on tree-based ensemble algorithms using AdaBoost, gradient boosting, and XGBoost / Selcuk Demir, Emrehan Kutlug Sahin // Neural Computing and Applications. - Springer Nature Switzerland AG, 2023. - №35. - pp. 3173-3190
14. Devan, P. An efficient XGBoost-DNN-based classification model for network intrusion detection system / Preethi Devan, Neelu Khare // Neural Computing and Applications. - Springer Nature Switzerland AG, 2020. - №32. - pp. 12499-12514.
15. Lasota, T. Investigation of Random Subspace and Random Forest Methods Applied to Property Valuation Data / Tadeusz Lasota, Tomasz Luczak, Bogdan Trawinski // International Conference on Computational Collective Intelligence ICCCI 2011: Computational Collective Intelligence. Technologies and Applications. - Springer-Verlag Berlin Heidelberg, 2011. - pp. 142-151...21