ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 3
ВВЕДЕНИЕ 4
Глава 1. Постановка цели и задач 7
Описание предметной области 7
Описание цели и задач 14
Глава 2. Подготовка и описание входного набора данных 17
Архитектура интеграции сервиса 17
Извлечение данных из первичного источника 19
Анализ исходных данных 21
Разведочный анализ данных (Exploratory Data Analysis, EDA) 24
Глава 3. Формирование входных признаков модели прогнозирования 39
Реализация процедур очистки данных 39
Feature Selection и Feature Engineering 40
Формирование входного набора данных 45
Глава 4. Разработка модуля прогнозирования отмены бронирования 49
Выбор модели прогнозирования и показатели качества прогноза 49
Случайный лес (Random Forest, RF) 56
Логистическая регрессия (Logistic Regression, LG) 58
Метод опорных векторов (Support Vector Machine, SVM) 60
Классификатор голосования (Voting Classifier, VC) 61
Построение модели прогнозирования и оценка качества прогноза 62
Методы реализации модели прогнозирования в системе PMS 67
ЗАКЛЮЧЕНИЕ 70
СПИСОК ЛИТЕРАТУРЫ 71
ПРИЛОЖЕНИЕ 76
На протяжении десятилетий гостиничная индустрия была ключевой отраслью во многих развитых странах. Ожидается, что с непрерывным ростом международного туризма гостиничная индустрия будет расти устойчивыми темпами. Несмотря на эту перспективу, в отрасли давно существуют проблемы. Одной из наиболее важных проблем является отмена бронирования отелей. Данная проблема может быть серьезной для владельцев этих отелей, особенно если это происходит регулярно.
Когда клиенты отменяют бронирование в последний момент, отель может потерять значительную прибыль и иметь проблемы с управлением загрузкой номеров и точным прогнозированием своих будущих доходов. Владельцы отелей также могут столкнуться с проблемами, связанными с ухудшением репутации отеля. Если клиенты недовольны отменой бронирования или политикой возврата денег, они могут оставить отрицательный отзыв в Интернете, что может повредить имидж отеля и привести к убыткам.
Таким образом, частые отмены могут быстро стать дорогостоящими и негативно повлиять на работу отеля. И в целом, владельцы отелей должны принимать меры для снижения рисков и управления своими бронированиями более эффективно.
В свете этого были проведены исследования, чтобы предсказать, произойдет ли отмена бронирования или нет. Мы стремимся расширить такие исследования, используя методы машинного обучения, чтобы классифицировать, будет ли отменено бронирование или нет. Чтобы решить эту проблему бинарной классификации, мы используем логистическую регрессию, дерево решений, случайный лес и классификатор голосования.
Модели не только предсказывают, будет ли отменено бронирование или нет, они также предоставят дополнительную информацию о том, какие независимые переменные играют важную роль в определении того, будет ли отменено бронирование. Такая информация будет полезна менеджерам и владельцам отелей. Это позволит более точно прогнозировать доходы и эффективно применять методы управления доходами. Кроме того, эта информация может иметь ключевое значение для предотвращения будущих отмен, поскольку менеджеры будут лучше понимать переменные, которые играют роль в отмене бронирования.
Текущие практики показывают, что отели склонны использовать строгие правила отмены бронирования и стратегии чрезмерного бронирования, что, как правило, негативно сказывается на доходах и репутации отеля. Наша модель системы, основанная на машинном обучении, может помочь гостиницам преодолеть эту проблему.
В последнее время машинное обучение приобрело большое значение в мире автоматизации. Машинное обучение не только сокращает объем ручной работы, но и генерирует соответствующие результаты. Вместо жесткого кодирования машинное обучение помогает машине самой учиться, принимать решения и выдавать точные результаты. Для обработки данных для получения лучших результатов используются сценарии реального времени. После того как модель готова, ее необходимо обучить на наборе данных. Это используется для проверки точности алгоритма и способности предсказывать результат. Получив желаемые результаты, легко предпринять необходимые шаги, чтобы избежать дальнейших отмен и предложить клиентам лучший опыт.
Для успешной подготовки и защиты выпускной квалификационной работы обучающимся использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающую высокую умственную и физической работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма...
Разработан модуль прогнозирования отмены бронирования в отелях, с помощью которого можно спрогнозировать загруженность отелей. Все построенные модели достигли значений AUC выше 80%, а классификатор голосования достиг 86,5%, что считается отличным. Инструментарий реализован на базе Python и включает в себя процедуры первичной загрузки и очистки данных (выявление и обработка пропусков, ошибок и противоречий), вычисление признаков прогнозирования, методы избавления от дисбаланса классов.
Разработаны инструменты позволяют менеджерам отелей:
смягчить потерю дохода, связанную с отменой бронирования, это связано с тем, что непредсказуемые отмены ограничивают производство точных прогнозов, поэтому результаты этого исследования позволяют менеджерам отелей точно прогнозировать чистый спрос и строить более точные прогнозы;
снизить риски, связанные с избыточным бронированием (затраты на перераспределение, денежные компенсации или компенсации за услуги и, что особенно важно сегодня, затраты на социальный имидж);
добиться лучшей видимости приведет к увеличению продаж, поскольку менее жесткие правила отмены бронирования генерируют больше бронирований;
принимать меры в отношении бронирований, которые определены как «потенциально подлежащие отмене», а также составлять более точные прогнозы спроса и загруженности.
При появлении коммерческого интереса, планируется установка и запуск вебсервиса для интеграции модуля прогнозирования с PMS-системой разных отелей. По итогам выполненной работы статья готовится к публикации.
Kimes S.E., Wirtz J. Has revenue management become acceptable? Findings from an International study on the perceived fairness of rate fences. Journal of Service Research, 2003. Раздел 6(2). С. 125-135. URL: http://dx.doi.org/10.1177/1094670503257038 (дата обращения: 20.05.2023)
Chiang W.C., Chen J.C., Xu X. An overview of research on revenue management: current issues and future research. International Journal of Revenue Management, 2007. Раздел 1(1). С. 97-128. URL: http://dx.doi.org/10.1504/IJRM.2007.011196 (дата обращения: 20.05.2023)
Mehrotra R., Ruttley J. Revenue management (2nd edition). Вашингтон, округ Колумбия, США: American Hotel & Lodging Association (AHLA), 2006. URL: https://www.scribd.com/document/292066294/Revenue-Management-AHLA-2006 (дата обращения: 20.05.2023)
Talluri K.T., Van Ryzin G. The theory and practice of revenue management. Бостон, Массачусетс, США: Kluwer Academic Publishers, 2004. URL: https://download.e- bookshelf.de/download/0000/0046/37/L-G-0000004637-0002369102.pdf (дата обращения: 20.05.2023)
Smith S. J., Parsa H. G., Bujisic M., van der Rest J.P. Hotel cancelation policies, distributive and procedural fairness, and consumer patronage: A study of the lodging industry. Journal of Travel & Tourism Marketing, 2015. Раздел 32(7). С. 886-906. URL: http://dx.doi.org/10.1080/10548408.2015.1063864 (дата обращения: 20.05.2023)
Chen C.C., Xie Lijia K. Differentiation of cancellation policies in the U.S. hotel industry. International Journal of Hospitality Management, 2013. Раздел 34. С. 6672. URL: http://dx.doi.org/10.1016/j.ijhm.2013.02.007 (дата обращения: 20.05.2023)
Chen C.C., Schwartz Z., Vargas P. The search for the best deal: How hotel cancellation policies affect the search and booking decisions of deal-seeking customers. International Journal of Hospitality Management, 2011. Раздел 30(1). С. 129-135. URL: https:ZZdoi.org/10.1016Zj.ijhm.2010.03.010 (дата обращения: 20.05.2023)
Noone B.M., Lee C.H. Hotel overbooking: The effect of overcompensation on customers’ reactions to denied service. Journal of Hospitality & Tourism Research, 2010. Раздел 35(3). С. 334-357. URL: https:ZZdoi.org/10.1177Z1096348010382238 (дата обращения: 20.05.2023)
Morales D.R., Wang, J. Forecasting cancellation rates for services booking revenue management using data mining. European Journal of Operational Research, 2010. Раздел 202(2). С. 554-562. URL: http:ZZdx.doi.orgZ10.1016Zj.ejor.2009.06.006 (дата обращения: 20.05.2023)
Liu P.H. Hotel demandZcancellation analysis and estimation of unconstrained demand using statistical methods. In I. Yeoman & U. McMahon-Beattie (Eds.), Revenue management and pricing: Case studies and applications (pp. 91-101). Cengage Learning EMEA, 2004. (дата обращения: 20.05.2023)
Hayes D.K., Miller A.A. Revenue management for the hospitality industry. Хобокен, Нью-Джерси, США: John Wiley & Sons, Inc, 2011. (дата обращения: 20.05.2023)
Kimes S.E. The future of hotel revenue management. Cornell Hospitality Reports, 2010. Раздел 10(14). URL: https:ZZrb.gyZusdum (дата обращения: 20.05.2023)
Dhar V. Data science and prediction. Communications of the ACM, 2013. Раздел 56(12). С. 64-73. URL: https:ZZdoi.orgZ10.1145Z2500499 (дата обращения: 20.05.2023)
O’Neil C., Schutt R. Doing data science. Севастополь, Калифорния, США: O’Reilly Media, 2013. URL: https:ZZrb.gyZks0np (дата обращения: 20.05.2023)
Yangyong Z., Yun X. Dataology and data science: Up to now. 2011. URL: https:ZZrb.gyZ8qcwj (дата обращения: 20.05.2023)...37