📄Работа №214941

Тема: Исследование и реализация гибридного алгоритма прогнозирования временных рядов

📝
Тип работы Дипломные работы, ВКР
📚
Предмет математика
📄
Объем: 49 листов
📅
Год: 2025
👁️
Просмотров: 4
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание


Введение 4
Глава 1 Постановка задачи исследования алгоритма 6
Глава 2 Обзор методов прогнозирования временных рядов 11
Глава 3 Методология исследования 23
Глава 4 Экспериментальная оценка 33
Заключение 39
Список используемой литературы 43
Приложение А Листинг (реализация программы) 46

📖 Введение

Настоящая работа посвящена разработке и исследованию гибридного подхода к прогнозированию временных рядов с использованием декомпозиции данных, статистических методов и алгоритмов машинного обучения.
Предложенный метод включает разделение временного ряда на тренд, сезонную компоненту и остатки с помощью метода STL, прогнозирование каждой компоненты отдельно и последующее объединение результатов.
Для тренда и сезонности применяются методы экспоненциального сглаживания (Holt и Holt-Winters), а для остатков - алгоритмы градиентного бустинга (XGBoost) и машины опорных векторов (SVR) с предварительным извлечением признаков.
Тестирование проводится на наборах данных NN3 и M4, содержащих месячные временные ряды с выраженной сезонностью и трендами.
Оценка качества прогнозов выполняется с использованием метрик sMAPE и MASE.
Объектом исследования являются временные ряды, представленные наборами данных NN3 и M4. Предмет исследования - гибридный алгоритм прогнозирования, объединяющий декомпозицию, статистические методы и машинное обучение.
Цель работы - разработка, реализация и тестирование гибридного алгоритма прогнозирования временных рядов, а также сравнение его эффективности с традиционными методами.
Для достижения цели необходимо решить следующие задачи:
- сформулировать постановку задачи исследования и
проанализировать методы прогнозирования временных рядов;
- изучить и проанализировать алгоритмы прогнозирования, включая статистические и комбинированные подходы;
- разработать и протестировать программу, реализующую предложенный алгоритм.
Методы исследования включают декомпозицию временных рядов, экспоненциальное сглаживание, алгоритмы машинного обучения, а также оценку качества с использованием метрик sMAPE и MASE. Реализация выполняется с применением языков программирования высокого уровня.
Практическая значимость работы заключается в создании программного обеспечения, которое позволяет эффективно прогнозировать временные ряды с учётом их сложной структуры, что может быть использовано в экономике, логистике и других областях.
Работа состоит из введения, трёх глав, заключения и списка литературы.
Первая глава посвящена постановке задачи и анализу методов прогнозирования.
Вторая глава включает обзор и анализ алгоритмов.
Третья глава описывает программную реализацию и тестирование алгоритма на наборах данных NN3 и M4.
В заключении представлены основные результаты исследования.
Бакалаврская работа содержит 48 страниц текста, 8 рисунков и 25 источников. В приложении представлены фрагменты кода.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Проведённое исследование посвящено разработке и тестированию гибридного подхода к прогнозированию временных рядов, основанного на декомпозиции данных и интеграции статистических методов с алгоритмами машинного обучения. Разработанная модель включает разделение временного ряда на тренд, сезонную компоненту и остатки с использованием метода STL, прогнозирование тренда и сезонности методами экспоненциального сглаживания (Holt и Winter), а также моделирование остатков с применением градиентного бустинга (XGBoost) и машин опорных векторов (SVR) после извлечения признаков.
Экспериментальная оценка проводилась на наборах данных NN3 и M4, что позволило получить следующие выводы.
Разработанный гибридный подход продемонстрировал высокую эффективность в сравнении с традиционными методами прогнозирования. Основные результаты включают:
- повышенная точность прогнозирования: на подмножестве из 11 рядов набора NN3 предложенная модель достигла значения sMAPE 14.17% и MASE 0.912, превосходя AutoARIMA (sMAPE 18.15%, MASE 0.906) и Holt-Winters (sMAPE 21.22%, MASE 1.495). На полном наборе из 111 рядов модель показала sMAPE 16.28% и MASE 1.300, оставаясь конкурентоспособной по сравнению с AutoARIMA (sMAPE 16.98%, MASE 1.228);
- эффективность декомпозиции: разделение временного ряда на компоненты позволило упростить задачу прогнозирования, обеспечив точное моделирование тренда и сезонности с помощью методов экспоненциального сглаживания. Это подтверждается низким стандартным отклонением ошибок, особенно на рядах с выраженной сезонностью;
- вклад машинного обучения: применение моделей XGBoost и SVR к остаткам после извлечения признаков с использованием библиотеки tsfresh позволило уловить нелинейные зависимости, что улучшило общую точность прогнозов. Сравнение с чистыми моделями машинного обучения (sMAPE 36.11% для XGBoost без декомпозиции) подчёркивает важность предварительной обработки данных;
- конкурентоспособность на больших наборах данных: на
подмножестве из 48 000 рядов набора M4 предложенная модель заняла третье место по метрике OWA (0.883), уступив AutoARIMA (0.789) и ETS (0.852), но опередив Holt-Winters (0.947). Это свидетельствует о масштабируемости подхода для обработки сложных данных.
Полученные результаты отвечают на сформулированные задачи исследования:
Гибридный подход превосходит традиционные статистические методы в задачах долгосрочного прогнозирования, особенно для рядов с выраженной сезонностью.
Интеграция методов машинного обучения в гибридную модель обеспечивает прирост точности за счёт моделирования остатков, что невозможно при использовании только статистических методов.
Декомпозиционный подход демонстрирует сопоставимую
производительность с другими комбинированными методами, сохраняя простоту реализации и интерпретируемость.
Несмотря на достигнутые результаты, предложенный подход имеет ряд ограничений, которые необходимо учитывать:
- ограниченная длина временных рядов: наборы данных NN3 и M4 содержат относительно короткие ряды (менее 150 наблюдений для NN3), что ограничивает возможности моделей машинного обучения, требующих большого объёма данных для эффективного обучения. Это проявилось в упрощённом прогнозировании остатков, где использовалось повторение последнего предсказания;
- положительные значения данных: оба набора данных включают только положительные значения, что ограничивает применимость модели к рядам с отрицательными значениями. Преобразование Бокса-Кокса дополнительно усиливает это ограничение, требуя корректировки данных перед обработкой;
- фокус на месячных данных: тестирование проводилось
исключительно на месячных временных рядах с сезонным периодом 12 месяцев. Производительность модели на дневных, недельных или годовых данных остаётся неизученной;
- отсутствие доменных знаний: модель не учитывает внешние факторы, такие как экономические события, праздники или другие контекстные переменные, которые могли бы повысить точность прогнозов;
- чувствительность к параметрам декомпозиции: метод STL
предполагает аддитивную структуру ряда после преобразования Бокса-Кокса, что может быть неоптимальным для мультипликативных рядов без соответствующей обработки;
- эти ограничения указывают на необходимость дальнейших исследований для расширения применимости модели и устранения выявленных недостатков.
На основе анализа результатов и ограничений исследования предлагаются следующие направления для дальнейшей работы:
- тестирование на разнообразных наборах данных: проведение экспериментов с временными рядами различной периодичности (дневные, недельные, годовые) позволит оценить универсальность предложенного подхода. Исследование рядов с отрицательными значениями или мультипликативной структурой также расширит область применения модели ;
- интеграция доменных признаков: включение внешних факторов, таких как календарные события, экономические показатели или отраслевые характеристики, может улучшить точность прогнозов, особенно для рядов с высокой зависимостью от контекста;
- динамическая настройка параметров: разработка алгоритмов для автоматической адаптации параметров декомпозиции STL и моделей машинного обучения (например, длины скользящего окна или гиперпараметров XGBoost) повысит устойчивость модели к различным типам данных;
- усовершенствование прогнозирования остатков: в текущей
реализации прогноз остатков упрощён из-за ограниченной длины рядов. Использование рекуррентных моделей или временных лагов для предсказания остатков на длительных горизонтах может повысить точность;...
Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976. - 756 с.
2. Бокс Дж., Дженкинс Г., Рейнсел Г. Анализ временных рядов: прогнозирование и управление. - М.: Мир, 1974. - 406 с.
3. Браун Р.Г. Методы сглаживания и прогнозирования. - М.: Статистика, 1964. - 286 с.
4. Броквелл П.Дж., Дэвис Р.А. Введение в анализ временных рядов и прогнозирование. - М.: Финансы и статистика, 2001. - 668 с.
5. Гаврилов Д.В. Прогнозирование временных рядов в задачах эконометрики и финансов. - М.: КНОРУС, 2020. - 272 с.
6. Гудвин П., Ло Д. Combining forecasts: A review and annotated bibliography // International Journal of Forecasting. - 2006. - Vol. 22, No. 4. - P. 637-645.
7. Дринкер Б. Support vector regression machines // Advances in Neural Information Processing Systems. - 1997. - Vol. 9. - P. 155-161.
8. Кендалл М., Стюарт А. Статистические выводы и связи. - М.: Наука, 1973. - 896 с.
9. Кутузов А.А., Орлова А.В. Временные ряды: от классики к нейросетям. - М.: URSS, 2023. - 366 с.
10. Лемке К., Габрис Б. Meta-learning for time series forecasting // Computational Statistics & Data Analysis. - 2010. - Vol. 54, No. 11. - P. 26322644.
11. Литвинова Г.Г., Зайченко Ю.П. Анализ и прогнозирование временных рядов с использованием нейросетевых моделей. - СПб.: БХВ- Петербург, 2011. - 304 с.
12. Макридакис С., Уилрайт С., Хайндман Р.Дж. Методы прогнозирования: количественные и качественные подходы. - М.: Статистика, 1989. - 312 с.
13. Мюллер А., Гвидо С. Введение в машинное обучение с Python: руководство для специалистов по анализу данных. - М.: ДМК Пресс, 2017. - 408 с.
14. Смил С. Deep learning for time series forecasting // IEEE Transactions on Neural Networks and Learning Systems. - 2019. - Vol. 30, No. 4. - P. 10031019.
15. Ткаченко П.А. Машинное обучение и анализ данных с использованием Scikit-Learn и TensorFlow. - М.: ДМК Пресс, 2021. - 512 с....25

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ