Тип работы:
Предмет:
Язык работы:


Разработка программного модуля для предсказания уровня популярности объявлений о сдаче квартир в аренду

Работа №106073

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы56
Год сдачи2021
Стоимость4350 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
139
Не подходит работа?

Узнай цену на написание


Введение 3
Глава 1 Функциональное моделирование предметной области 6
1.1 Характеристика деятельности агентства недвижимости 6
1.2 Выбор технологии концептуального моделирования исследуемой
области 7
1.3 Моделирование бизнес-процессов предметной области для
постановки задачи автоматизированного варианта решения 8
1.4 Постановка задачи на разработку программной реализации и ее
внедрения в деятельность компании 11
1.5 Общая характеристика организации решения задачи на ЭВМ 11
Глава 2 Проектирование программного модуля 13
2.1 Прогнозирование популярности объявлений как задача
классификации 13
2.2 Описание набора данных 15
Глава 3 Разработка программного обеспечения для анализа данных 18
3.1 Описание средств разработки и программного кода модуля 18
3.2 Программный код для настройки работы программного модуля ... 34
3.3 Тестирование и сравнение результатов работы алгоритмов 38
3.4 Интерфейс программного обеспечения 45
Заключение 49
Список используемой литературы 50


В данной бакалаврской работе рассматривается деятельность компании по аренде жилья (сайт renthop.com). На сайте компании размещена информация о квартирах, которые можно арендовать. В объявлениях приведена различная информация о квартирах (дата размещения объявлений, описание квартир, фотографии). В течение длительного времени данная компания накапливала статистическую информацию об объявлениях и их популярности. Данная информация выложена в открытый доступ на сайте kaggle.com.
Пользователи сайта об аренде недвижимости, формируя запрос через веб-форму, получают список объявлений, отсортированный по дате создания объявлений. Для того чтобы повысить вероятность аренды жилья через сайт компании (а, следовательно, и прибыль компании) предлагается сортировать объявления по прогнозируемой популярности.
Актуальность темы исследования состоит в разработке классификатора популярности объявлений на исторических данных, предоставленных компанией по аренде жилья. Подобных систем разработано мало. Разработанный программный модуль позволит значительно сократить трудовые и временные затраты на прогнозирование популярности объявлений, что позволит упростить и ускорить работу компании.
Таким образом, цель работы - разработка программного модуля обучения классификатора для прогнозирования популярности объявлений.
Объект - процессы поиска и вывода объявлений по аренде квартир.
Предмет - автоматизация процесса вывода объявлений удовлетворяющих запросу пользователю с учетом прогнозируемой популярности.
Поставленная цель в работе достигается за счет решения следующих задач:
- анализ бизнес-процессов компании по аренде жилья для обоснования необходимости прогнозирования популярности объявлений;
- описание прогнозирование популярности объявлений как задачи классификация;
- разработка программного обеспечения для обучения классификатора популярности объявлений с использованием различных алгоритмов машинного обучения, основанных на концепции деревьев решений;
- определение алгоритма машинного обучения, обеспечивающего максимальную точность работы классификатора на имеющихся данных.
Бакалаврской работа состоит из введения, трёх глав, заключения и списка литературы.
Во введении содержатся краткие сведения о работе компании по организации аренды недвижимости. Отражены актуальность темы, цели и задачи бакалаврской работы.
В первой главе проводится анализ предметной области. Целью аналитической части является рассмотрение существующего состояния рынка недвижимости, характеристики их объекта и аппарата управления, выявления проблем и недостатков в работе систем и обоснование предложений по устранению выявленных недостатков, внедрению новых подходов, новых технологий.
Во второй главе описывается задача классификации, а также проводится сравнение алгоритмов машинного обучения, основанных на концепции деревьев решений.
В третьей главе описывается программная реализация построения классификационных моделей (Decision Tree, Random Forest, Gradient Boosting и XGBoost) на данных объявлений аренды жилья и сравнивается их точность классификации на тестовых данных. На языке Python разработано 4
программное обеспечение, реализующее предсказания класса популярности недвижимости (high, medium, low) на основе разнородного содержания объявления о квартире: текстовом описании, фотографиях, количестве спален, цене и т.д. Данные поступают с сайта по аренде квартир (renthop.com).
В заключении сделаны основные выводы по результатам бакалаврской работы, определено, какие задачи были решены, определены пути их внедрения и направления дальнейшего совершенствования работы фирмы.
Общий объем выпускной квалификационной работы составляет 56 страниц и включает 47 рисунков, 1 таблицу, 21 источник.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Целью работы являлась разработка программного модуля обучения классификатора для прогнозирования популярности объявлений.
Достижению поставленной цели способствовало успешное решение основных задач исследования. В частности, был произведен анализ бизнес- процессов компании renthop, предоставляющей информационные услуги по поиску объявлений об аренде жилья. Для усовершенствования исследуемого бизнес-процесса, связанного с выводом результатов поиска объявлений пользователю, предложено разработать и внедрить программное обеспечение для прогнозирования популярности объявлений.
Прогнозирование популярности объявлений о сдаче квартир в аренду представлено в виде задачи классификации. Для прогнозирования обучен классификатор, способный на основе входных параметров объявлений, определять класс его популярности.
Рассмотрены алгоритмы машинного обучения, способные решать задачи классификации и основанные на использовании деревьев принятия решений. На основе их различий и особенностей составлена сводная таблица.
На языке Python разработано программное обеспечение, реализующее предсказания класса популярности недвижимости (high, medium, low) на основе разнородного содержания объявления о квартире: текстовом описании, фотографиях, количестве спален, цене и т.д. Данные поступают с сайта по аренде квартир (renthop.com). Разработанное программное обеспечение обеспечивает построение классификаторов в соответствии с алгоритмами Decision Tree, Random Forest, Gradient Boosting и XGBoost.
Проведены вычислительные эксперименты по оценки точности работы 4 классификаторов. Лучшие результаты показал классификатор на основе XGBoost, а худшие результаты - на основе Decision Tree.



1. Александров, Д. В. Инструментальные средства
информационного менеджмента : CASE-технологии и распределенные информационные системы : учебное пособие / Д. В. Александров. - М. : Финансы и статистика, 2011 - 224 с. - Текст : непосредственный.
2. Аусабаев, Д.М. Использование машинного обучения в поддержке принятия решений / Д.М. Аусабаев, О.П. Волобуев // Прикладная математика и информатика: современные исследования в области естественных и технических наук - материалы III научно-практической всероссийской конференции (школы-семинара) молодых ученых. Тольятти, 24-25 апреля 2017 года. - Издатель Качалин Александр Васильевич, 2017. - с. 43-47. -
Текст : непосредственный.
3. Власов, А.В. Машинное обучение применительно к задаче
классификации семян зерновых культур в видеопотоке / А.В. Власов, А.С. Федеев // Молодежь и современные информационные технологии - сборник трудов XIV Международной научно-практической конференции студентов, аспирантов и молодых учёных, 07-11 ноября 2016. - Национальный
исследовательский Томский политехнический университет (Томск), 2016. - с. 133-135. - Текст : непосредственный.
4. Жуков, Д.А. Формирование контрольных выборок при технической диагностике объекта с применением машинного обучения / Д.А. Жуков, А.С. Хорева, Ю.Е. Кувайскова, В.Н. Клячкин // Математические методы и модели: теория, приложения и роль в образовании - международная научно-техническая конференция : сборник научных трудов, 28-30 апреля 2016 года. - Ульяновский государственный технический университет (Ульяновск), 2016. - с. 44-48. - Текст : непосредственный.
5. Иванников Ю.Ю. Применение методов машинного обучения для выявления бот-трафика среди запросов к веб-приложению / Ю.Ю. Иванников, Е.Ю. Митрофанова // Сборник студенческих научных работ факультета компьютерных наук ВГУ, Факультет компьютерных наук, 2017. - ФГБОУ ВО «Воронежский государственный университет», 2017. - с. 119¬123. - Текст : непосредственный.
6. Клячин В.Н. Использование агрегированных классификаторов
при технической диагностике на базе машинного обучения / В.Н. Клячин, Ю.Е. Кувайскова, Д.А. Жуков // Информационные технологии и нанотехнологии (ИТНТ-2017) - сборник трудов III международной
конференции и молодежной школы. Самарский национальный исследовательский университет имени академика С.П. Королева. 2017. - Предприятие «Новая техника» (Самара), 2017. - с. 1770-1773. - Текст : непосредственный.
7. Кононова, Н.В. Исследование подсистемы контентной
фильтрации с использованием методов машинного обучения / Н.В. Кононова, Ю.А. Андрусенко, Т.А. Самокаева // Студенческая наука для развития информационного общества - сборник материалов VI Всероссийской научно-технической конференции. 22-26 мая 2017. - Северо-Кавказский федеральный университет (Ставрополь), 2017. - с. 268-270. - Текст :
непосредственный.
8. Мелдебай, М.А. Анализ мнений покупателей на основе
машинного обучения / М.А. Мелдебай, А.К. Сарбасова // Прикладная математика и информатика: современные исследования в области
естественных и технических наук - материалы III научно-практической всероссийской конференции (школы-семинара) молодых ученых. 24-25 апреля 2017 года. - Издатель Качалин Александр Васильевич, 2017. - с. 360¬363. - Текст : непосредственный.
9. Наумов, Д.П. Регулятор CAP на основе машинного обучения / Д.П. Наумов, Д.П. Стариков // Информационные технологии в управлении, автоматизации и мехатронике - сборник научных трудов Международной научно-технической конференции. 06-07 апреля 2017 года. - ЗАО
«Университетская книга» (Курск), 2017. непосредственный.
10. Осколков, В.М. Использование метода машинного обучения для
повышения продуктивности на предприятии / В.М. Осколков, Н.И. Шаханов, И.А. Варфоломеев, О.В. Юдина, Е.В. Ершов // Автоматизация и энергосбережение машиностроительного и металлургического производств, технология и надежность машин, приборов и оборудования - материалы XII Международной научно-технической конференции, 21 марта 2017. -
Вологодский государственный университет (Вологда), 2017. - с. 177-180. -
Текст : непосредственный.
11. Осколков, В.М. Применение параллельных вычислений для прогнозирования на основе алгоритма машинного обучения Random Forest / В.М. Осколков, Н.И. Шаханов, И.А. Варфоломеев, О.В. Юдина, Л.Н. Виноградова, Е.В. Ершов // Сборник трудов конференции Оптико¬электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание, Курск, 16-19 мая 2017 года. - Юго-Западный государственный университет (Курск), 2017. - с. 267-269. - Текст : непосредственный.
12. Соловьев, А.Ю. Применение машинного обучения для
прогнозирования неблагоприятных исходов в ургентной хирургии / Соловьев А.Ю., Берегов М.М., Вахеева Ю.М., Баутин А.Н., Гусев А.В. // Медико-биологические, клинические и социальные вопросы здоровья и патологии человека - материалы III Всероссийской образовательно-научной конференции студентов и молодых ученых с международным участием в рамках XIII областного фестиваля "Молодые ученые - развитию Ивановской области". 2017. - Ивановская государственная медицинская академия
(Иваново), 2017. - с. 129-130. - Текст : непосредственный.
13. Ткач, Т.Ч. Машинное обучение и обработка больших данных - обучение в основной и средней школе / Т.Ч. Ткач // Актуальные проблемы методики обучения информатике и математике в современной школе - материалы международной научно-практической интернет-конференции. Московский педагогический государственный университет, Москва, 24 апреля 2020 года. - Московский педагогический государственный университет (Москва), 2020. - с. 217-223. - Текст : непосредственный.
14. Федотов, И.А. Применение технологий машинного обучения для прогнозирования ситуации на финансовых рынках / И.А. Федотов // Студенческая наука для развития информационного общества - сборник материалов VI Всероссийской научно-технической конференции. 22-26 мая 2017. - Северо-Кавказский федеральный университет (Ставрополь), 2017. - с. 361-363. - Текст : непосредственный.
15. Якимчук, А.А. Глубокое обучение как эффективный метод машинного обучения / А.А. Якимчук // Научное сообщество студентов XXI столетия. Технические науки - сборник статей по материалам XCII студенческой международной научно-практической конференции. 2020. - ООО “Сибирская академическая книга” (Новосибирск), 2020. - с. 40-43. -
Текст : непосредственный.
16. Ярыгин, А.А. Актуальные вопросы машинного обучения с
подкреплением интеллектуальных агентов в задачах принятия решений / А.А. Ярыгин // Автоматизация: проблемы, идеи, решения - сборник статей по итогам Международной научно-практической конференции 2017. - ООО "Агентство международных исследований", 2017. - с. 62-68. - Текст :
непосредственный.
17. Bartczuk, Г. A New Version of the Fuzzy-ID3 Algorithm / Lukasz Bartczuk, Danuta Rutkowska // International Conference on Artificial Intelligence and Soft Computing - 8th International Conference, Zakopane, Poland, June 25-29, 2006. Proceedings: Artificial Intelligence and Soft Computing - ICAISC 2006. - Springer-Verlag Berlin Heidelberg 2006. - pp. 1060-1070. -
Текст : непосредственный.
18. Chang, J. Genetic Algorithm Based Fuzzy ID3 Algorithm [Text] / Jyh-Yeong Chang, Chien-Wen Cho, Su-Hwang Hsieh, Shi-Tsung Chen // International Conference on Neural Information Processing - 11th International Conference, ICONIP 2004, Calcutta, India, November 22-25, 2004. Proceedings: Neural Information Processing. - Springer-Verlag Berlin Heidelberg 2004. - pp. 989-995. - Текст : непосредственный.
19. Jiang, S. A Combined Classification Algorithm Based on C4.5 and NB / ShengYi Jiang, Wen Yu // International Symposium on Intelligence Computation and Applications - Third International Symposium, ISICA 2008 Wuhan, China, December 19-21, 2008. Proceedings: Advances in Computation and Intelligence. - Springer-Verlag Berlin Heidelberg 2008. - pp. 350-359. -
Текст : непосредственный.
20. Min, F. A Competition Strategy to Cost-Sensitive Decision Trees / Fan Min, William Zhu // International Conference on Rough Sets and Knowledge Technology - 7th International Conference, RSKT 2012, Chengdu, China, August 17-20, 2012. Proceedings: Rough Sets and Knowledge Technology. - Springer-Verlag Berlin Heidelberg 2012. - pp. 359-368. - Текст : непосредственный.
21. Zheng, Z. Scaling up the rule generation of C4.5 / Zijian Zheng // Pacific-Asia Conference on Knowledge Discovery and Data Mining - Second Pacific-Asia Conference, PAKDD-98 Melbourne, Australia, April 15-17, 1998. Proceedings: Research and Development in Knowledge Discovery and Data Mining. - Springer-Verlag Berlin Heidelberg 1998. - pp. 348-359. - Текст : непосредственный. - Текст : непосредственный.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ