Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Обзор методов прогнозирования 8
1.1. Множественная линейная регрессия 8
1.2. Регрессия опорных векторов 9
1.3. Случайный лес 12
1.4. Нейронные сети 13
Глава 2. Подготовка данных 15
2.1. Исторические данные 16
2.2. Календарные данные 16
2.3. Метеоданные 21
2.4. Удаление недель с выбросами 23
2.5. Кросс-валидация 23
Глава 3. Результаты 25
3.1. Разработка моделей 25
3.2. Анализ результатов прогнозирования 26
3.3. Визуализация прогноза 30
Выводы 33
Заключение 34
Список литературы 35
Приложение 39
На современном рынке электроэнергии между ее производителями и потребителями используются контракты. Эти контракты могут быть как долгосрочными, на несколько месяцев, и даже лет, так и краткосрочными с горизонтом в одни сутки. Отклонение фактического потребления электроэнергии от спрогнозированного объема влечет необходимость для предприятия продажи излишнего или закупки недостающего объема электроэнергии по заведомо невыгодным ценам. Поэтому задача планирования и прогнозирования энергопотребления является достаточно значимой в электроэнергетике, и повышение точности этого прогнозирования может существенно снизить затраты на покупку электроэнергии предприятием.
С развитием вычислительных технологий данная задача все чаще переходит от экспертных систем к системам автоматизированным, а новые методы и алгоритмы машинного обучения и статистические модели позволяют повышать точность этого прогноза, учитывать множество разных факторов и находить сложные нелинейные зависимости в данных.
Таким образом, имеющей большое практическое применение и актуальной научно-технической задачей является разработка методик прогнозирования потребления электрической энергии на основе исторических и других имеющихся данных.
В данной работе был проведен обзор и анализ методов, применяемых для краткосрочного прогнозирования потребления электроэнергии. Также, были реализованы модели на основе множественной линейной регрессии, регрессии опорных векторов, случайного леса и радиальных базисных нейронных сетей. Построенные модели были протестированы на основе имеющихся реальных данных почасового потребления электроэнергии предприятием. Был проведен анализ, визуализация и сравнение полученных результатов.
Для реализации программной части был использован язык программирования Python 3.6 и библиотеки NumPy для работы с массивами и математическими функциями, Pandas для представления и обработки данных в виде таблиц, Scikit Learn для реализации алгоритмов машинного обучения, Keras для реализации нейронных сетей и Matplotlib для визуализации данных.
Для улучшения полученного результата можно рассмотреть добавление дополнительных данных, таких как график работы предприятия и данные о внутренних процессах. Также можно рассмотреть комбинированные методы и разбиение данной задачи на несколько подзадач и построение отдельных моделей для каждой из этих подзадач, например, строить отдельный прогноз для базового электропотребления предприятия и электропотребления оборудования.