Тема: Разработка программного модуля для предсказания уровня популярности объявлений о сдаче квартир в аренду
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 3
Глава 1 Функциональное моделирование предметной области 6
1.1 Характеристика деятельности агентства недвижимости 6
1.2 Выбор технологии концептуального моделирования исследуемой
области 7
1.3 Моделирование бизнес-процессов предметной области для
постановки задачи автоматизированного варианта решения 8
1.4 Постановка задачи на разработку программной реализации и ее
внедрения в деятельность компании 11
1.5 Общая характеристика организации решения задачи на ЭВМ 11
Глава 2 Проектирование программного модуля 13
2.1 Прогнозирование популярности объявлений как задача
классификации 13
2.2 Описание набора данных 15
Глава 3 Разработка программного обеспечения для анализа данных 18
3.1 Описание средств разработки и программного кода модуля 18
3.2 Программный код для настройки работы программного модуля ... 34
3.3 Тестирование и сравнение результатов работы алгоритмов 38
3.4 Интерфейс программного обеспечения 45
Заключение 49
Список используемой литературы 50
📖 Введение
Пользователи сайта об аренде недвижимости, формируя запрос через веб-форму, получают список объявлений, отсортированный по дате создания объявлений. Для того чтобы повысить вероятность аренды жилья через сайт компании (а, следовательно, и прибыль компании) предлагается сортировать объявления по прогнозируемой популярности.
Актуальность темы исследования состоит в разработке классификатора популярности объявлений на исторических данных, предоставленных компанией по аренде жилья. Подобных систем разработано мало. Разработанный программный модуль позволит значительно сократить трудовые и временные затраты на прогнозирование популярности объявлений, что позволит упростить и ускорить работу компании.
Таким образом, цель работы - разработка программного модуля обучения классификатора для прогнозирования популярности объявлений.
Объект - процессы поиска и вывода объявлений по аренде квартир.
Предмет - автоматизация процесса вывода объявлений удовлетворяющих запросу пользователю с учетом прогнозируемой популярности.
Поставленная цель в работе достигается за счет решения следующих задач:
- анализ бизнес-процессов компании по аренде жилья для обоснования необходимости прогнозирования популярности объявлений;
- описание прогнозирование популярности объявлений как задачи классификация;
- разработка программного обеспечения для обучения
классификатора популярности объявлений с использованием
различных алгоритмов машинного обучения, основанных на
концепции деревьев решений;
- определение алгоритма машинного обучения, обеспечивающего максимальную точность работы классификатора на имеющихся данных.
Бакалаврской работа состоит из введения, трёх глав, заключения и списка литературы.
Во введении содержатся краткие сведения о работе компании по организации аренды недвижимости. Отражены актуальность темы, цели и задачи бакалаврской работы.
В первой главе проводится анализ предметной области. Целью аналитической части является рассмотрение существующего состояния рынка недвижимости, характеристики их объекта и аппарата управления, выявления проблем и недостатков в работе систем и обоснование предложений по устранению выявленных недостатков, внедрению новых подходов, новых технологий.
Во второй главе описывается задача классификации, а также проводится сравнение алгоритмов машинного обучения, основанных на концепции деревьев решений.
В третьей главе описывается программная реализация построения классификационных моделей (Decision Tree, Random Forest, Gradient Boosting и XGBoost) на данных объявлений аренды жилья и сравнивается их точность классификации на тестовых данных. На языке Python разработано 4
программное обеспечение, реализующее предсказания класса популярности недвижимости (high, medium, low) на основе разнородного содержания объявления о квартире: текстовом описании, фотографиях, количестве спален, цене и т.д. Данные поступают с сайта по аренде квартир (renthop.com).
В заключении сделаны основные выводы по результатам бакалаврской работы, определено, какие задачи были решены, определены пути их внедрения и направления дальнейшего совершенствования работы фирмы.
Общий объем выпускной квалификационной работы составляет 56 страниц и включает 47 рисунков, 1 таблицу, 21 источник.
✅ Заключение
Достижению поставленной цели способствовало успешное решение основных задач исследования. В частности, был произведен анализ бизнес- процессов компании renthop, предоставляющей информационные услуги по поиску объявлений об аренде жилья. Для усовершенствования исследуемого бизнес-процесса, связанного с выводом результатов поиска объявлений пользователю, предложено разработать и внедрить программное обеспечение для прогнозирования популярности объявлений.
Прогнозирование популярности объявлений о сдаче квартир в аренду представлено в виде задачи классификации. Для прогнозирования обучен классификатор, способный на основе входных параметров объявлений, определять класс его популярности.
Рассмотрены алгоритмы машинного обучения, способные решать задачи классификации и основанные на использовании деревьев принятия решений. На основе их различий и особенностей составлена сводная таблица.
На языке Python разработано программное обеспечение, реализующее предсказания класса популярности недвижимости (high, medium, low) на основе разнородного содержания объявления о квартире: текстовом описании, фотографиях, количестве спален, цене и т.д. Данные поступают с сайта по аренде квартир (renthop.com). Разработанное программное обеспечение обеспечивает построение классификаторов в соответствии с алгоритмами Decision Tree, Random Forest, Gradient Boosting и XGBoost.
Проведены вычислительные эксперименты по оценки точности работы 4 классификаторов. Лучшие результаты показал классификатор на основе XGBoost, а худшие результаты - на основе Decision Tree.



