📄Работа №127419

Тема: ПРОГНОЗ БУДУЩИХ ДОХОДОВ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ

📝

Тип работы Магистерская диссертация

📚

Предмет База данных

📄

Объем: 43 листов

📅

Год: 2022

👁️

5500 руб.

🛒 Купить работу

Не подходит эта работа?
Закажите новую по вашим требованиям

Узнать цену на написание

ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить

📋 Содержание

ВВЕДЕНИЕ 3
ГЛАВА 1 ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ 9
1.1 Полиномиальная регрессия 9
1.2 Xgboost 10
1.3 Алгоритм LSTM 11
1.4 Алгоритм BPNN 12
ГЛАВА 2 ПОДГОТОВКА ДАННЫХ 14
2.1 Описание набора данных 14
2.2 Предварительная обработка данных 15
2.3 Feature Engineering 16
ГЛАВА 3 РЕЗУЛЬТАТЫ 17
3.1 Разработка модели 17
3.2 Анализ результатов прогнозирования 20
3.3 Визуализация прогноза 28
ВЫВОДЫ 34
ЗАКЛЮЧЕНИЕ 35
СПИСОК ЛИТЕРАТУРЫ 36
РАСПИСАНИЕ 39

📖 Введение

С быстрым развитием компьютерного оборудования и данных машинное обучение становится все более и более важным, и различные приложения машинного обучения стали повсеместными в нашей жизни.
Машинное обучение - это общий термин для класса алгоритмов, которые пытаются найти скрытые правила в большом количестве исторических данных и использовать их для прогнозирования или классификации. В частности, машинное обучение можно рассматривать как поиск функции, а входные данные sample data., на выходе есть желаемый результат, но эта функция слишком сложна для формального выражения. Важно отметить, что цель машинного обучения - заставить изученную функцию хорошо работать на «новых выборках», а не только на обучающих выборках. Способность изученной функции применять к новым образцам называется способностью к обобщению. Машинное обучение можно использовать в следующих областях:
1. Интеллектуальный анализ данных;
2. Компьютерное зрение;
3. Обработка естественного языка;
4. Распознавание (биометрия, распознавание речи и рукописного ввода);
5. Поисковые системы;
6. Медицинский диагноз;
7. Последовательность ДНК;
8. Такие области, как стратегические игры и робототехника.
Предиктивная аналитика в машинном обучении
Предиктивная аналитика — это категория аналитики данных, целью которой является прогнозирование будущих результатов на основе исторических данных и аналитических методов. Предиктивная аналитика использует различные статистические методы.(включает интеллектуальный анализ данных, машинное обучение и прогнозное моделирование) чтобы узнать, что произойдет в будущем.
Постановка задачи
Неравенство доходов — это показатель, измеряющий степень неравномерного распределения доходов отдельных лиц или домохозяйств. Детерминанты неравенства доходов уже давно являются предметом споров в экономическом сообществе, уходящих корнями в социальные и экономические издержки такого неравенства. Неравенство может отражать отсутствие мобильности доходов и возможностей, что может препятствовать инвестициям в образование и реальный капитал, что ведет к социальной нестабильности и замедлению экономического роста. Поэтому необходимо разработать и внедрить метод прогнозирования будущих доходов для изучения различных причин неравенства доходов. Этот метод будет сочетать классический алгоритм машинного обучения и алгоритм глубокого обучения для прогнозирования регрессии на данных.
Использование алгоритмов машинного обучения и нейронных сетей можно разделить на следующие подзадачи.
Машинное обучение:
1. Обработать набор данных:
Если в наборе данных есть пропущенные значения, использовать режим или метод медианы для заполнения.
2. Проверить среднеквадратичную ошибку результатов набора тестов (проверить способность алгоритма к обобщению).
3. Настроить параметры алгоритма, чтобы получить оптимальные параметры.
4. Применять алгоритмы машинного обучения для получения оптимальных результатов.
Нейронные сети:
Для нейронной сети существуют соответствующие веса и смещения, и процесс корректировки весов и смещений в соответствии с обучающими данными называется «обучением».
1. mini-batch
Часть данных выбирается случайным образом из обучающих данных, и эта часть данных называется mini-batch. Наша цель - уменьшить значение функции потерь mini-batch.
2. Рассчитать градиент
Чтобы уменьшить значение функции потерь mini-batch, необходимо получить градиент каждого весового параметра. Градиент представляет собой направление, в котором значение функции потерь уменьшается больше всего.
3. Обновить параметры
Сделать небольшое обновление параметра веса вдоль направления градиента.
4. Параметры оптимизации
Мы можем получить лучшие параметры и оптимизировать модель, повторив описанные выше шаги. Или использовать такие методы, как слияние моделей, чтобы получить оптимальные параметры. Например, алгоритм WOA-LSTM, используемый в этой статье, использует модель WOA для получения оптимальной скорости обучения и количества нейронов.
Актуальность исследования
В наши дни существует множество различных приложений задач машинного обучения, но, в конце концов, это приложения для регрессии и классификации.
Теперь рассмотрим задачу машинного обучения в регрессии - предсказание будущих доходов. Благодаря решению прогнозирования будущих доходов модель этой схемы также используется в других регрессионных задачах, таких как прогнозирование запасов, прогнозирование будущих продаж определенного продукта, прогнозирование транспортных потоков и т. д.
В настоящее время самым примитивным и наиболее часто используемым методом является метод субъективного эмпирического суждения - метод Дельфи (Delphi method). Проще говоря, это собрать вместе несколько знающих и опытных людей, чтобы провести встречу для обсуждения и определить результат, объединив мнения нескольких сторон. Преимущество метода Дельфи в том, что неважно, если один человек ошибается, после обсуждения результаты будут не так уж и плохи, но это только в простом бизнесе. В каком-то крупном бизнесе будет больше переменных, да и веяния времени тоже меняются. Если слепо полагаться на опыт в суждениях, то несомненно невозможно.
Следовательно, нам нужно использовать компьютер для создания процесса, который позволит каждому предсказывать будущие результаты на основе данных путем ввода необходимых данных, добавления или вычитания некоторых параметров, а затем выбора подходящей модели для прогнозирования результатов - правильное решение.
Обзор литературы
Поскольку популярности машинного обучения и нейронных сетей сегодня в академической литературе доступно множество ресурсов.
Источник [1] описывает основы машинного обучения, особенно для некоторых приложений классических алгоритмов.
Источник [2] дает соответствующую теорию для численного прогнозирования.
Источник [3] описывает связанную теорию с точки зрения прогнозирования с помощью моделей многомерной регрессии и моделей регрессии KNN.
Источник [4] описывает применение модели BPNN в прогнозировании продаж.
Источник [5] описывает фактическое использование WOA-LSTM, в основном с использованием модели WOA для поиска оптимальных параметров, а затем с использованием выходных данных глобального оптимального решения в качестве начальных параметров нейронной сети LSTM для обучения и прогнозирования выборок.
Источники [6][7][8][9] описывают применение нейронной сети LSTM, модели CNN-LSTM, модели PSO-LSTM и модели WOA-LSTM.
Источники [10][11] описывают влияние переменных в модели, а также возможные методы выбора переменных и методы анализа.
Источник [12] описывает развитие сверточных нейронных сетей и знакомит с основными операционными единицами сверточных нейронных сетей. И остановились на AlexNet, VGGNet, GoogleNet, ResNet и т. д. И обобщили используемые ими технологии.
Источники [13][14][15] описывают конкретные приложения и решения сверточных нейронных сетей в прогнозировании.
Источники [16][17] описывают проблемы моделей прогнозирования временных рядов в практических приложениях, в основном для данных временных рядов высокой сложности, простая декомпозиция данных и уменьшение шума не могут уменьшить информацию о помехах во временном ряду, препятствуя точности прогнозирования модель усовершенствована.
Обзор существующих решений
В настоящее время для отдельных методов прогнозирования алгоритм линейной регрессии обычно используется для создания модели взаимосвязи между каждым признаком и целевым значением, анализа влияния одной переменной признака на целевое значение и интерпретации его значения. Затем сравните производительность модели многомерной регрессии и модели KNN при прогнозировании целевого значения.
Основываясь на вышеуказанных методах, другие авторы также улучшат это, например: интеграция алгоритмов регрессии KNN и полиномиальной регрессии KNN для оптимизации.
Кроме того, для этой задачи также будет использоваться метод нейронной сети для прогнозирования. Такие как: предсказание на основе нейронной сети BP. Для решения этой проблемы нелинейность, сложность и неполнота входных данных нейронной сети используются для прогнозирования результатов за определенный период времени. Основываясь на неопределенности порога передачи нейронной сети BP, метод временных рядов используется для параллельного прогнозирования данных фактора, а затем результаты, полученные с помощью генетического алгоритма и нейронной сети BP, используются для вторичной оптимизации.

✅ Заключение

В данной работе для прогнозирования доходов используются методы регрессии. Также реализованы модели на основе полиномиальной регрессии, Xgboost, BPNN, LSTM, WOA-LSTM. Построенная модель тестируется на реальных данных о доходах. Полученные результаты анализируются, визуализируются и сравниваются.
Для реализации программной части мы использовали Python 3.6 и библиотеку Numpu для работы с массивами и математическими функциями, а также Pandas для представления и обработки данных в табличном виде. Scikit-Learn, tensorflow и Keras используются для реализации алгоритмов машинного обучения и нейронных сетей. Matplotlib используется для визуализации данных.

Нужна своя уникальная работа?

Срочная разработка под ваши требования

Рассчитать стоимость

ИЛИ

Поиск аналога

📕 Список литературы

1. Xu Hongxue, Sun Wanyou, Du Yingkui, Wang Anqi, Обзор классических алгоритмов машинного обучения и их приложений//Компьютерные знания и технологии, 2020, 16(33), с.17-19.
2. Qiao Yingying.Обзор алгоритмов машинного обучения на основе численного прогнозирования//Журнал Аньянского технологического института, 2017, 16(04), с.71-74. DOI: 10.19329/j.cnki.1673-2928.2017.04.020 .
3. Чжу Цзыцян, Исследования по прогнозированию и анализу доходов выпускников на основе машинного обучения, Цзилиньский университет, 2017 г.
4. Сунь Яньвэнь, Чжан Тяньмин, Исследование алгоритма прогнозирования продаж на основе оптимизированной нейронной сети ВР//Компьютерные технологии и развитие, 2022, 32(01), с.35-39.
5. Су Пэнфэй, Сюй Сунъи, Юй Сяолэй, Алгоритм прогнозирования задержки в сети для сети узкополосной связи на основе WOA-LSTMZ/Хэбэй, промышленная наука и технологии, 2022, 39(01), с.9-15.
6. Ба Синьюэ.Исследование модели раннего предупреждения о финансовых рисках зарегистрированных на бирже компаний недвижимости на основе WOA-LSTM, Университет финансов и экономики Цзянси, 2021. DOI: 10.27175/d.cnki.gjxcu. 2021. 000135.
7. Лю Либанг, Ян Сун, Ван Чжицзянь, Хэ Синьсинь, Чжао Вэньлей, Лю Шоуцзюнь, Ду Венгуан, Ми Цзе Прогноз качества кокса на основе улучшенного WOA-LSTMZ/Китайский журнал химической инженерии, 2022, 73 (03), с. 1291-1299.
8. Ван Цзюньцзе, Шан Хунтао. Оценка надежности распределительной сети на основе оптимизации WOA нейронной сети LSTMZ/Интеллектуальный компьютер и приложение, 2021, 11 (10), с. 107-112.
9. Zeng Rong, Huang Deqi, Wei Xia, Zhao Henghui. Улучшенная нейронная сеть LSTM, оптимизированная для WOA, для краткосрочного прогнозирования транспортных потоков/ZJournal of Xinjiang University (Natural Science Edition) (на китайском и английском языках), 2022, 39(02), с. 242-248. DOI:10.13568/j.cnki.651094.651316.2021.03.05.0001.
10. Ван Юань, Исследование влияния переменных в сложных моделях прогнозирования, Пекинский университет почты и телекоммуникаций, 2021г. DOI: 10.26969/d.cnki.gbydu.2021.002999.
11. Ван Синан, Ли Жуйпин, У Инцзе, Чжао Шуйся, Ван Сюцин Исследование модели инверсии влажности почвы на основе переменных окружающей среды и машинного обучения//Журнал сельскохозяйственной техники, 2022, 53(05), с. 332-341 .
12. Ли Бинчжэнь, Лю Кэ, Гу Цзяоцзяо, Цзян Вэньчжи. Обзор исследования сверточных нейронных сетей//Computer Age, 2021(04), с. 8-17. DOI:10.16644/j.cnki.cn33- 1094/ тп.2021.04.003.
13. Ся Ин, Лю Мин. Прогнозирование транспортных потоков на основе пространственно-временной сверточной нейронной сети//Журнал Юго-Западного университета Цзяотун: 1-8, 2022 (06), с. 01. http://kns.cnki.net /kcms/detail/51.1277.U.20220302.1858.010.html
14. Цзян Чжэньюй, Хуан Яньюн, Ли Тяньруй, Цай Фусю. Прогнозирование фондового индекса на основе сверточных нейронных сетей слияния частоты и времени//Журнал Университета Чжэнчжоу (научное издание), 2022, 54(02), с. 81-88. DOI: 10.13705/ j.issn.1671-6841.2021225.
15. Ли Ран, Ма Тао, Чжан Сяо, Хуэй Сюй, Лю Инпей, Инь Сяоган Краткосрочное прогнозирование ветровой энергии на основе сверточной нейронной сети с долговременной кратковременной памятью [J] Китайский журнал солнечной энергии, 2021, 42 (06), с. 304-311. DOI: 10.19912/j.0254-0096.tynxb.2019-0209.
...

🖼 Скриншоты

Содержание с началом введения

🛒 Оформить заказ

⚡ Работу высылаем в течении 5 минут после оплаты.

Имя

E-mail

Телефон

Дополнительная информация

Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.

Всегда отправляем файлы и чек на почту

Ник или номер телефона

Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

С условиями приобретения работы согласен

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить ⬆️

Оценка стоимости

Предмет *

Гуманитарные дисциплины

Педагогика и образование

Правовые дисциплины

Экономические дисциплины

Технические дисциплины

Биология и медицина

Другое

Естественные науки и экология

Иностранные языки

Математические дисциплины

Программирование и IT

Физика и астрофизика

Химия

Пожалуйста, выберите предмет работы.

Тип работы *

Написание учебных работ

Написание научных работ

Тесты, задачи и экзаменационные материалы

Отчеты по практике

Научные публикации

Эссе и творческие работы

Презентации и защита

Чертежи и графика

Переводы

Программирование и IT

Бизнес и маркетинг

Копирайтинг и работа с текстом

Анализ и исследования

Рецензии и отзывы

Оформление и доработка

Подготовка документов

Методические разработки

Консультации и онлайн-помощь

Прочее

Написание работ

Пожалуйста, выберите тип работы.

Объем работы * Пожалуйста, укажите объем работы.

Срок выполнения * Пожалуйста, укажите срок выполнения.

Это краткая форма заказа. После ее заполнения вы перейдете на полную форму заказа работы

Каталог работ (210724)

Статьи

»» Все статьи

Вход в личный кабинет