📄Работа №217215

Тема: Исследование и реализация алгоритма градиентного бустинга для прогнозирования данных

📝
Тип работы Бакалаврская работа
📚
Предмет Прикладная информатика
📄
Объем: 45 листов
📅
Год: 2025
👁️
Просмотров: 2
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Аннотация
Введение 5
Глава 1 Постановка задачи исследования алгоритма градиентного бу стинга для прогнозирования данных 7
1.1 Математическое описание задачи прогнозирования данных 7
1.2 Обзор и анализ методов прогнозирования данных 10
Глава 2 Обзор и анализ алгоритмов градиентного бустинга 18
2.1 Алгоритм XGBoost 18
2.2 Алгоритм CatBoost 20
2.3 Алгоритм LightGBM 22
Глава 3 Реализация и тестирование алгоритма градиентного бустинга для прогнозирования данных 27
3.1 Выбор средства разработки программы 27
3.2 Разработка и тестирование программы 31
Заключение 39
Список используемой литературы и используемых источников 41

📖 Введение

Прогнозирование - это метод, который использует исторические данные для принятия обоснованных решений о будущих событиях или условиях. Это не просто догадки. Являясь инструментом для предприятий и инвесторов, прогнозирование использует экспертный анализ и применяет сложные модели для распределения портфелей и бюджетов. Однако, как показывает практика, зачастую прогнозы не всегда надежны.
Тем не менее, прогнозирование данных занимает центральное место в современных инвестициях и деловых практиках. Компании нанимают и расширяются на основе прогнозирования показателей продаж, рыночного спроса или экономических показателей. Инвесторы торгуют акциями, вкладывают средства в фонды или поспешно выходят с рынка на основе прогнозов относительно цен на акции, процентных ставок или более широких движений рынка. Модели потребительских расходов, тенденции рынка труда и даже геополитические события - все это попадает в компетенцию прогнозистов.
Для повышения надежности прогнозов используются различные алгоритмы в том числе алгоритмы градиентного бустинга. Модели градиентного бустинга приобрели популярность в сообществе машинного обучения благодаря своей способности достигать превосходных результатов в широком диапазоне вариантов использования, включая как регрессию, так и классификацию. Хотя эти модели традиционно были менее распространены в прогнозировании, они могут быть весьма эффективными в этой области.
Таким образом, исследование и программная реализация алгоритмов градиентного бустинга представляет научный и практический интерес.
Объектом исследования бакалаврской работы является процесс прогнозирования данных.
Предметом исследования бакалаврской работы является алгоритм градиентного бустинга.
Цель бакалаврской работы - исследование и программная реализация алгоритма градиентного бустинга для прогнозирования данных.
Для достижения данной цели необходимо выполнить следующие задачи:
- выполнить постановку задачи исследования алгоритма градиентного бустинга для прогнозирования данных;
- проанализировать алгоритмы алгоритма градиентного бустинга для прогнозирования данных;
- выполнить программную реализацию и протестировать алгоритм градиентного бустинга для прогнозирования данных.
Методы исследования - методы и алгоритмы прогнозирования данных, методы и технологии разработки программного обеспечения.
Практическая значимость бакалаврской работы заключается в разработке программы, позволяющий формировать прогнозы с помощью алгоритма градиентного бустинга.
Данная работа состоит из введения, трех глав, заключения и списка используемой литературы и используемых источников.
Выпускная квалификационная работа состоит из 43 страниц текста, 17 рисунков, 3 таблиц и 25 источников.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Выполненные в рамках бакалаврской работы задачи представлены следующими основными результатами:
- произведена постановка задачи исследования алгоритма градиентного бустинга для прогнозирования данных. Как показал анализ, Методы ансамблевого прогнозирования сильно разрознены в разных дисциплинах и часто служат разным целям. Полный потенциал ансамблевого прогнозирования и многие из его преимуществ н еще не реализованы. Метод градиентного бустинга обладает рядом преимуществ, что подтверждает актуальность решения задачи исследования и реализации алгоритма градиентного бустинга для прогнозирования данных;
- дан обзор и произведен анализ алгоритмов градиентного бустинга для прогнозирования данных. Как показал анализ, градиентный бустинг - это мощный метод машинного обучения, который включает в себя несколько популярных реализаций, таких как XGBoost, CatBoost и LightGBM. Эти алгоритмы отличаются по скорости, точности и способам обработки данных. Выбор алгоритма градиентного бустинга зависит от конкретной задачи, объема данных и требований к производительности. Оба алгоритма имеют свои сильные и слабые стороны, и их использование может варьироваться в зависимости от контекста задачи;
- выполнены реализация и тестирование алгоритма градиентного бустинга для прогнозирования данных. Для реализации программ выбраны язык Python и среда Jupyter Notebook. Представлена работа градиентного бустинга на примере алгоритма XGBoost. XGBoost стал одним из самых популярных и широко используемых алгоритмов машинного обучения благодаря своей способности обрабатывать большие наборы данных и достижению передовой производительности во многих задачах машинного обучения, таких как классификация и регрессия. Понимание важности характеристик имеет решающее значение при работе с моделями XGBoost. Это помогает определить, какие характеристики оказывают наиболее существенное влияние на прогнозы модели В качестве входного набора данных использован свободно распространяемый датасет Cancer Patients Data в формате CSV. При разработке программы использована библиотека scikit-learn.
Тестирование подтвердило, что алгоритм XGBoost обеспечивает эффективное решение задачи прогнозирования данных на основе метода градиентного бустинга.
Результаты бакалаврской работы могут представлять интерес для разработчиков и специалистов, занимающимся исследованием и реализацией алгоритмов градиентного бустинга для прогнозирования данных .

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Библиотека Scikit-learn: как создать свой первый ML-проект
[Электронный ресурс]. URL: https://skillbox.ru/media/code/biblioteka-
scikitlearn-kak-sozdat-svoy-pervyy-mlproekt/ (дата обращения: 20.11.2024).
2. Доугерти К. Введение в эконометрику: Учебник. 3-е изд. / Пер. с англ. М.: ИНФРА-М, 2009. 445 с. (дата обращения: 20.11.2024).
3. Как использовать xgboost.plot_importance() [Электронный ресурс].
URL: https://xgboosting.com/how-to-use-xgboost.plot_importance/ дата
обращения: 20.11.2024).
4. Как разработать ансамбль Light Gradient Boosted Machine
(LightGBM) [Электронный ресурс]. URL:
https://habr.com/ru/companies/skillfactory/articles/530594/ (дата обращения:
20.11.2024) .
5. Методы сбора ансамблей алгоритмов машинного обучения: стекинг,
бэггинг, бустинг [Электронный ресурс]. URL:
https://habr.com/ru/articles/561732/ (дата обращения: 20.11.2024).
6. Сенько О.В. Задачи прогнозирования [Электронный ресурс]. URL:
http://www.machinelearning.ru/wiki/images/e/ed/MOTP14_1 .pdf (дата
обращения: 20.11.2024).
7. Сузи Р. А. Язык программирования Python : учебное пособие. Москва
: Интернет-Университет Информационных Технологий (ИНТУИТ), Ай Пи Ар Медиа, 2020. 350 c. URL: https://www.iprbookshop.ru/97589.html (дата
обращения: 12.11.2024).
8. Числовое кодирование категориальных переменных [Электронный ресурс]. URL: https://teletype.in/@dt_analytic/YLOUyQcqSAL (дата обращения:
20.11.2024) .
9. Caballar R., Stryker C. What is forecasting? [Электронный ресурс].
URL: https://www.ibm.com/think/topics/forecasting (дата обращения:
20.11.2024) .
10. Cancer Patients Data [Электронный ресурс]. URL: https://www.kaggle.com/datasets/rishidamarla/cancer-patients- data?resource=download (дата обращения: 20.11.2024).
11. CatBoost, XGBoost и выразительная способность решающих
деревьев [Электронный ресурс]. URL:
https://habr.com/ru/companies/ods/articles/645887/#4 (дата обращения:
20.11.2024) .
12. Ensemble Forecasting [Электронный ресурс]. URL:
https://www.sciencedirect.com/topics/earth-and-planetary-sciences/ensemble- forecasting (дата обращения: 20.11.2024).
13. Forecasting mathematics: How to apply and solve the mathematical
problems and equations of financial forecasting [Электронный ресурс]. URL: https://fastercapital.com/content/Forecasting-mathematics--How-to-apply-and- solve-the-mathematical-problems-and-equations-of-financial- forecasting.html#Introduction-to-F inancial-Forecasting (дата обращения:
20.11.2024) .
14. Gradient Boosting in ML [Электронный ресурс]. URL:
https://www.geeksforgeeks.org/ml-gradient-boosting/ (дата обращения:
20.11.2024) .
15. Guolin Ke et.al. LightGBM: A Highly Efficient Gradient Boosting Decision Tree, 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, CA, USA...25

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ