Тип работы:
Предмет:
Язык работы:


Применение технологий смешанного машинного обучения при решении задач регрессии

Работа №109535

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы44
Год сдачи2021
Стоимость4000 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
142
Не подходит работа?

Узнай цену на написание


Введение
Глава 1 Обзор ансамблевых технологий машинного обучения при решении задач регрессии
1.1Разновидности задач регрессии при анализе данных
1.2Обзор ансамблевых технологий машинного обучения
Глава 2 Разработка технологии смешанного использования алгоритмов машинного обучения
2.1Схема применения смешанного машинного обучения
2.2Данные для апробации смешанного машинного обучения
Глава 3 Программная реализация смешанного машинного обучения
3.1Описание программного кода
3.2Интерфейс программного обеспечения
3.3Результаты тестирования
Заключение
Список используемой литературы

Основой искусственного интеллекта с точки зрения математики и информатики являются алгоритмы машинного обучения. С помощью этих алгоритмов, с использованием обучающего набора данных, производится обучение прогнозных моделей, описывающих закономерности в данных.
Машинное обучение используется во многих научных отраслях: при создании диагностических производственных систем, при проектировании аналитических систем оценки рисков в экономике, при создании систем поддержки принятия решений в медицине, в системах обеспечения общественного порядка используемых правоохранительными органами и т.д.
Актуальной задачей для исследователей алгоритмов машинного обучения является повышение точности получаемых прогнозных моделей. Помимо разработки новых алгоритмов, исследователи из данной области разрабатывают новые способы применения существующих алгоритмов. Например, одно из современных достижений в данной области - методы ансамблевого использования существующих алгоритмов машинного обучения. Эти методы основаны на идее использования одного метода машинного обучения для настройки с его помощью нескольких прогнозных моделей, работающих (с целью повышения точности получаемых прогнозов) совместно. При этом результат прогнозирования формируется на основе совокупности выводов совместно работающих прогнозных моделей. Совместно работающие модели в этом случае называют ансамблями (ensemble methods).
К таким ансамблевым методам относятся Бэггинг (Bagging), Случайный лес (Random Forest), Бустинг (Boosting), Градиентный бустинг (Gradient Boosting), параллельная реализация градиентного бустинга (XGBoost).
Все ансамблевые методы объединяет то, что они работают на основе одного выбранного базового метода машинного обучения.
В данной бакалаврской работе делается предположение, что возможно развить ансамблевый подход до использования не одного базового метода, а сколь угодно большого числа базовых методов «смешивая» их в любых комбинациях на выбор пользователя. Очевидно, что чтобы доказать эффективность смешанного машинного обучения требуется провести большое количество вычислительных экспериментов, а для этого требуется программное обеспечение, реализующее данную технологию.
Поэтому, цель работы - разработка подхода смешанного машинного обучения и программного обучения для его тестирования.
Для достижения поставленной цели в работе решаются следующие задачи:
1.Анализ существующих подходов по совместному использованию методов машинного обучения.
2.Разработка подхода смешанного машинного обучения позволяющего совмещать различные алгоритмы машинного обучения в заданной пользователем комбинации.
3.Разработка программной обеспечения, позволяющего тестировать смешанное обучение на произвольно заданных данных.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения бакалаврской работы были получены следующие результаты:
-Было произведено сравнение подходов по использования алгоритмов машинного обучения для получения составных прогнозных моделей (ансамблей). При сравнении рассматривались такие ансамблевые методы, как бэггинг (Bagging), случайный лес (Random Forest), бустинг (Boosting), градиентный бустинг (Gradient Boosting), параллельный градиентный бустинг (XGBoost). По результатам сравнения была составлена схема, показывающая, как соотносятся скорости обучения ансамблевых методов и точности прогнозирования получаемых моделей.
-В ходе анализа ансамблевых методов установлено, что их использование основано на применении одно базового алгоритма, например, например алгоритма построения дерева принятия решения. Поэтому предложено разработать технология смешанного машинного обучения позволяющего использовать не один, а сразу несколько базовых алгоритмов при построении составных прогнозных моделей.
-Предложена технология смешанного машинного обучения для построения составных регрессионных моделей. Алгоритм обучения составных регрессионных моделей включает в себя следующие этапы: разделение исходных данных на тренировочную и тестовую выборку, использование тренировочной выборки данных для построения множества регрессионных моделей с использованием выбранного набора методов машинного обучения и настройка полученных моделей для совместной работы. При этом задача согласования совместной работы моделей сведена к задаче поиска коэффициентов линейной функции, связывающей выходное значение составной модели (У) с выходными значениями исходного набора регрессионных моделей (у1, y2, • • •, Ук)-
-На языке программирования Python разработано программное обеспечение, позволяющее тестировать технологию смешанного машинного обучения и сравнивать ее эффективность (точность работы по значению MAE) с классическими методами машинного обучения (Support Vector Regression, K-Neighbors Regressor, Descision Tree Regressor, Linear Regression). Разработанное программное обеспечение обладает графическим интерфейсом и средствами визуализация результатов вычислительных экспериментов посредством таблиц и столбчатых диаграмм.
-Было проведено более 20 вычислительных экспериментов на разных наборах данных. В 19 экспериментах наибольшую точность (наименьшее значение ошибки MAE) показали регрессионные модели, настроенные с использованием предложенной технологии смешанного машинного обучения. Это на практике доказывает эффективность предложенной технологии.


1.Андриенко М.П. Понимание повторяющихся нейронных сетей:
предпочтительная нейронная сеть для данных временных рядов / М.П. Андриенко, П.А. Юдин, Е.Ю. Вишневецкая // Актуальные вопросы современной науки и образования: сборник статей Международной научнопрактической конференции : в 2 ч.. 2020. - Издательство: Наука и
Просвещение (Пенза), 2020. - с. 96-98. - Текст : непосредственный.
2.Аусабаев, Д.М. Использование машинного обучения в поддержке принятия решений / Д.М. Аусабаев, О.П. Волобуев // Прикладная математика и информатика: современные исследования в области естественных и технических наук - материалы III научно-практической всероссийской конференции (школы-семинара) молодых ученых. Тольятти, 24-25 апреля 2017 года. - Издатель Качалин Александр Васильевич, 2017. - с. 43-47. - Текст : непосредственный.
3.Власов, А.В. Машинное обучение применительно к задаче
классификации семян зерновых культур в видеопотоке / А.В. Власов, А.С. Федеев // Молодежь и современные информационные технологии - сборник трудов XIV Международной научно-практической конференции студентов, аспирантов и молодых учёных, 07-11 ноября 2016. - Национальный
исследовательский Томский политехнический университет (Томск), 2016. - с. 133-135. - Текст : непосредственный.
4.Грушевская, А.Л. Сравнительный анализ решения одной задачи классификации четырьмя типами нейронных сетей / А.Л. Грушевская, А.Н. Покровский // Современные методы прикладной математики, теории управления и компьютерных технологий (ПМТУКТ-2013) : сборник трудов VI международной конференции, 10-16 сентября 2013 года. - Издательство: Воронежский государственный университет (Воронеж), 2013. - с. 83-84. - Текст : непосредственный.
5.Дорогов, А.Ю. Нейронные сети глубокого обучения с
управляемой коммутацией нейронных плоскостей / А.Ю. Дорогов // Дистанционные образовательные технологии: Материалы IV Всероссийской научно-практической конференции (с международным участием), 2019. - Издательство: Общество с ограниченной ответственностью «Издательство Типография «Ариал» (Симферополь), 2019. - с. 284-296. - Текст :
непосредственный.
6.Жуков, Д.А. Формирование контрольных выборок при технической диагностике объекта с применением машинного обучения / Д.А. Жуков, А.С. Хорева, Ю.Е. Кувайскова, В.Н. Клячкин // Математические методы и модели: теория, приложения и роль в образовании - международная научно-техническая конференция : сборник научных трудов, 28-30 апреля 2016 года. - Ульяновский государственный технический университет (Ульяновск), 2016. - с. 44-48. - Текст : непосредственный.
7.Ибрагимов Р.М. Влияние функций активации нейронных сетей на
скорость обучения на примере нейронной сети с обратным распространением ошибки / Р.М. Ибрагимов // Актуальные проблемы физической и функциональной электроники: материалы 21-й Всероссийской молодежной научной школы-семинара. 2018. - Издательство: Ульяновский
государственный технический университет (Ульяновск), 2018. - с. 125-126. - Текст : непосредственный.
8.Иванников Ю.Ю. Применение методов машинного обучения для выявления бот-трафика среди запросов к веб-приложению / Ю.Ю. Иванников, Е.Ю. Митрофанова // Сборник студенческих научных работ факультета компьютерных наук ВГУ, Факультет компьютерных наук, 2017. - ФГБОУ ВО «Воронежский государственный университет», 2017. - с. 119123. - Текст : непосредственный.
9.Клячин В.Н. Использование агрегированных классификаторов при технической диагностике на базе машинного обучения / В.Н. Клячин,
Ю.Е. Кувайскова, Д.А. Жуков // Информационные технологии и нанотехнологии (ИТНТ-2017) - сборник трудов III международной конференции и молодежной школы. Самарский национальный исследовательский университет имени академика С.П. Королева. 2017. - Предприятие "Новая техника" (Самара), 2017. - с. 1770-1773. - Текст : непосредственный.
10.Кононова, Н.В. Исследование подсистемы контентной
фильтрации с использованием методов машинного обучения / Н.В. Кононова, Ю.А. Андрусенко, Т.А. Самокаева // Студенческая наука для развития информационного общества - сборник материалов VI Всероссийской научно-технической конференции. 22-26 мая 2017. - Северо-Кавказский федеральный университет (Ставрополь), 2017. - с. 268-270. - Текст :
непосредственный.
11.Мелдебай, М.А. Анализ мнений покупателей на основе
машинного обучения / М.А. Мелдебай, А.К. Сарбасова // Прикладная математика и информатика: современные исследования в области
естественных и технических наук - материалы III научно-практической всероссийской конференции (школы-семинара) молодых ученых. 24-25 апреля 2017 года. - Издатель Качалин Александр Васильевич, 2017. - с. 360363. - Текст : непосредственный.
12.Осколков, В.М. Применение параллельных вычислений для прогнозирования на основе алгоритма машинного обучения Random Forest / В.М. Осколков, Н.И. Шаханов, И.А. Варфоломеев, О.В. Юдина, Л.Н. Виноградова, Е.В. Ершов // Сборник трудов конференции Оптикоэлектронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание, Курск, 16-19 мая 2017 года. - Юго-Западный государственный университет (Курск), 2017. - с. 267-269. - Текст : непосредственный.
13.Синягов, А.И. Реализация искусственной нейронной сети на базе нейронной сети Петри / А.И. Синягов, А.А. Суконщиков // Шаг в будущее: искусственный интеллект и цифровая экономика. Материалы 1-й
Международной научно-практической конференции. Государственный университет управления. 2017. - Издательство: Государственный
университет управления (Москва), 2017. - с. 130-135. - Текст :
непосредственный.
14.Урубкин, М.Ю. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных / М.Ю. Урубкин, А.В. Авакьянц // Совершенствование методологии познания в целях развития науки: сборник статей по итогам Международной научно-практической конференции: в 2 частях. 2017. - Издательство: Общество с ограниченной ответственностью "Агентство международных исследований" (Уфа), 2017. - с. 36-39. - Текст : непосредственный.
15.Федотов, И.А. Применение технологий машинного обучения для
прогнозирования ситуации на финансовых рынках / И.А. Федотов // Студенческая наука для развития информационного общества - сборник материалов VI Всероссийской научно-технической конференции. 22-26 мая 2017. - Северо-Кавказский федеральный университет (Ставрополь), 2017. -
с. 361-363. - Текст : непосредственный...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы

  • Системный анализ
    Ответы на вопросы, прочее. Язык работы: Русский. Цена: 1600 р. Год сдачи: 2022

©2025 Cервис помощи студентам в выполнении работ