ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 3
ВВЕДЕНИЕ 4
ОСНОВНАЯ ЧАСТЬ 6
1 Общее описание задачи 6
2 Методы оценки эффективности методов прогнозирования 7
3 Анализ исходных данных 11
4 Формальная постановка задачи 14
5 Разбор и сравнение методов прогнозирования 15
6 Обзор Facebook Prophet 18
7. Определение структуры сервиса прогнозирования 27
8. Настройка модели и сравнение результатов 38
ЗАКЛЮЧЕНИЕ 41
Приложение 1. Интерфейс сервиса настройки модели 42
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 52
В современном мире все больше операций может быть осуществлено через информационно-телекоммуникационную сеть Интернет: от простого входа в личный аккаунт социальной сети до подачи документов в различные государственные органы. Все больше организаций предпочитают электронный документооборот бумажному. Для выполнения большинства подобных операций необходимо получить сертификат.
Выдача Сертификата осуществляется Удостоверяющими центрами в порядке и на условиях, установленных Федеральным законом «Об электронной подписи» от 06.04.2011 № 63-ФЗ. Одним из крупнейших Удостоверяющих центров в России является СКБ Контур.
Ежедневно в УЦ СКБ Контур приходит от нескольких сотен до нескольких тысяч заявок на выдачу сертификата, каждая из которых должна пройти проверку оператором УЦ. В связи с постоянным ростом клиентской базы, поток заявок увеличивается, что провоцирует также расширение штата операторов УЦ. Также растет и меняется список типов сертификатов, усложняя процесс распределения, так как не все операторы УЦ могут работать со всеми типами сертификатов. Кроме того, помимо проблемы увеличения штата в связи с ростом входящей нагрузки, остро стоит вопрос распределения штата в течение года, месяца и даже в пределах одного дня. Вручную контролировать весь этот процесс становится все труднее. При планировании необходимо учитывать такие факторы как рост среднего числа заявок, насыщенность рынка, наличие сезонных колебаний, рост и падение рынков, пики нагрузки в преддверье отчетности и многие другие. При этом выраженность каждого фактора зависит от типа заявки. Таким образом, возникает потребность в разработке сервиса прогнозирования нагрузки на операторов УЦ.
На текущий момент прогнозирование нагрузки осуществляется вручную путем визуального анализа данных за прошедший период. При этом используются сервисы, которые не представляют информацию в формате удобном для прогнозирования (Рисунок 1). Поэтому такие прогноз нельзя считать точными.
Задачей, которая легла в основу данной квалификационной работы, стало создание инструмента, который позволяет не только автоматизировать процесс прогнозирования, но и сделать сам прогноз практичным.
В процессе решения задачи были проанализированы различные методы прогнозирования временных серий и выбран единственный, наиболее полно удовлетворяющей поставленным требованиям. Был разработан и реализован прототип многофункционального сервиса для прогнозирования временных серий, в частности, данных по нагрузке на удостоверяющий центр. Была разработана модель взаимодействия с сервисом как в краткосрочном, так и в долгосрочном плане. Был сделан вывод о необходимости разработки интуитивно понятного пользовательского интерфейса для настройки сервиса. Была разработана внутренняя структура сервиса, и структура пользовательского интерфейса, основная цель которого - максимальное облегчение процесса настройки модели и наблюдения динамики прогнозов. Был разработан сервер прогнозирования и сервис настройки модели с использованием современных языков и технологий программирования. Были реализованы методы как автоматической, так и визуальной оценки эффективности настроенной модели прогноза. С использованием разработанного интерфейса были настроены два класса прогнозирования, и затем была произведена повторная оценка эффективности реализованных методов. Основные выводы из проделанной работы можно сформулировать следующим образом:
• Нагрузка на Удостоверяющий Центр имеет слишком разнородную структуру, чтобы эффективно её прогнозировать ручными методами
• Библиотека Facebook Prophet лучше других методов прогнозирования подходит для решения задачи прогнозирования данных временных серий
• Для получения более эффективных прогнозов необходимо участие в процессе аналитиков с большими знаниями в предметной области.
Полученные выводы и созданный инструмент в дальнейшем можно использовать для прогнозирования большого числа временных серий, имеющих самую разную природу и характеристики. Полученный сервис можно превратить в отдельный внутренний продукт, сочетающий в себе высокую гибкость настройки с простотой использования.
[1] Чучуева И.А. МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ ПО ВЫБОРКЕ МАКСИМАЛЬНОГО ПОДОБИЯ, диссертация... канд. тех. наук / Московский государственный технический университет им. Н.Э. Баумана. Москва, 2012.
[2] De Gooijer, J. G. & Hyndman, R. J. (2006), ‘25 years of time series forecasting’, International Journal of Forecasting 22(3), 443-473.
[3] Vladik Kreinovich, Hung T. Nguyen и Rujira Ouncharoen. How to Estimate Forecasting Quality: A System-Motivated Derivation of Symmetric Mean Absolute Percentage Error (SMAPE) and Other Similar Characteristics / Vladik Kreinovich; University of Texas at El Paso El Paso, TX 79968, USA, 2014.
[4] J. Scott Armstrong PRINCIPLES OF FORECASTING: A Handbook for Researchers and Practitioners / J. Scott Armstron; University of Pennsylvania, The Wharton School Philadelphia, Pennsylvania USA, 2001
[5] Harvey, A. & Peters, S. (1990), ‘Estimation procedures for structural time series models’, Journal of Forecasting 9, 89-108.