ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 3
ВВЕДЕНИЕ 4
ОСНОВНАЯ ЧАСТЬ 6
1 Общее описание задачи 6
2 Методы оценки эффективности методов прогнозирования 7
3 Анализ исходных данных 11
4 Формальная постановка задачи 14
5 Разбор и сравнение методов прогнозирования 15
6 Обзор Facebook Prophet 18
7. Определение структуры сервиса прогнозирования 27
8. Настройка модели и сравнение результатов 38
ЗАКЛЮЧЕНИЕ 41
Приложение 1. Интерфейс сервиса настройки модели 42
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 52
В современном мире все больше операций может быть осуществлено через информационно-телекоммуникационную сеть Интернет: от простого входа в личный аккаунт социальной сети до подачи документов в различные государственные органы. Все больше организаций предпочитают электронный документооборот бумажному. Для выполнения большинства подобных операций необходимо получить сертификат.
Выдача Сертификата осуществляется Удостоверяющими центрами в порядке и на условиях, установленных Федеральным законом «Об электронной подписи» от 06.04.2011 № 63-ФЗ. Одним из крупнейших Удостоверяющих центров в России является СКБ Контур.
Ежедневно в УЦ СКБ Контур приходит от нескольких сотен до нескольких тысяч заявок на выдачу сертификата, каждая из которых должна пройти проверку оператором УЦ. В связи с постоянным ростом клиентской базы, поток заявок увеличивается, что провоцирует также расширение штата операторов УЦ. Также растет и меняется список типов сертификатов, усложняя процесс распределения, так как не все операторы УЦ могут работать со всеми типами сертификатов. Кроме того, помимо проблемы увеличения штата в связи с ростом входящей нагрузки, остро стоит вопрос распределения штата в течение года, месяца и даже в пределах одного дня. Вручную контролировать весь этот процесс становится все труднее. При планировании необходимо учитывать такие факторы как рост среднего числа заявок, насыщенность рынка, наличие сезонных колебаний, рост и падение рынков, пики нагрузки в преддверье отчетности и многие другие. При этом выраженность каждого фактора зависит от типа заявки. Таким образом, возникает потребность в разработке сервиса прогнозирования нагрузки на операторов УЦ.
На текущий момент прогнозирование нагрузки осуществляется вручную путем визуального анализа данных за прошедший период. При этом используются сервисы, которые не представляют информацию в формате удобном для прогнозирования (Рисунок 1). Поэтому такие прогноз нельзя считать точными.
Задачей, которая легла в основу данной квалификационной работы, стало создание инструмента, который позволяет не только автоматизировать процесс прогнозирования, но и сделать сам прогноз практичным.
В процессе решения задачи были проанализированы различные методы прогнозирования временных серий и выбран единственный, наиболее полно удовлетворяющей поставленным требованиям. Был разработан и реализован прототип многофункционального сервиса для прогнозирования временных серий, в частности, данных по нагрузке на удостоверяющий центр. Была разработана модель взаимодействия с сервисом как в краткосрочном, так и в долгосрочном плане. Был сделан вывод о необходимости разработки интуитивно понятного пользовательского интерфейса для настройки сервиса. Была разработана внутренняя структура сервиса, и структура пользовательского интерфейса, основная цель которого - максимальное облегчение процесса настройки модели и наблюдения динамики прогнозов. Был разработан сервер прогнозирования и сервис настройки модели с использованием современных языков и технологий программирования. Были реализованы методы как автоматической, так и визуальной оценки эффективности настроенной модели прогноза. С использованием разработанного интерфейса были настроены два класса прогнозирования, и затем была произведена повторная оценка эффективности реализованных методов. Основные выводы из проделанной работы можно сформулировать следующим образом:
• Нагрузка на Удостоверяющий Центр имеет слишком разнородную структуру, чтобы эффективно её прогнозировать ручными методами
• Библиотека Facebook Prophet лучше других методов прогнозирования подходит для решения задачи прогнозирования данных временных серий
• Для получения более эффективных прогнозов необходимо участие в процессе аналитиков с большими знаниями в предметной области.
Полученные выводы и созданный инструмент в дальнейшем можно использовать для прогнозирования большого числа временных серий, имеющих самую разную природу и характеристики. Полученный сервис можно превратить в отдельный внутренний продукт, сочетающий в себе высокую гибкость настройки с простотой использования.