Разработка математических моделей для оценки времени испытаний автомобильных сборок на примере компании Мерседес
|
АННОТАЦИЯ 2
ВВЕДЕНИЕ 5
1 ПРОЦЕСС ИСПЫТАНИЯ АВТОМОБИЛЬНЫХ СБОРОК 8
1.1 Виды испытаний 8
1.2 Длительность испытаний 8
1.3 Постановка задачи 11
1.4 Выводы по главе 1 12
2 ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ
РЕШЕНИЯ РЕГРЕССИОННЫХ ЗАДАЧ 13
2.1 Регрессионные методы используемые в машинном обучении 13
2.1.1 Линейная регрессия 15
2.1.2 Случайный лес (Random fore st) 17
2.1.3 Экстра-деревья (Extra-Tree) 18
2.1.4 Градиентный бустинг 19
2.2 Выводы по главе 2 21
3 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ
ПРОГНОЗИРОВАНИЯ ВРЕМЕНИ ИСПЫТАНИЙ АВТОМОБИЛЬНЫХ СБОРОК КОМПАНИИ МЕРСЕДЕС 22
3.1 Подготовка данных для подачи в модель машинного обучения 22
3.2 Метрика качества 28
3.4 Исследование эффективности построенной модели 30
3.5 Оптимизация гиперпараметров модели 35
3.5.1 Оптимизация параметров метода градиентного бустинга 35
3.5.2 Оптимизация параметров модели Экстра деревьев (Extra-Trees regresion) 38
3.6 Оптимизация взвешивания усреднения между моделями градиентного
бустинга и экстремальных деревьев 40
3.7 Выводы по главе 3 41
4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 43
4.1 Дорожная карта коммерциализации проекта 43
4.1.1 Планирование стратегии 44
4.1.2 Основные цели проекта 44
4.1.3 Источники доходов 45
4.1.4 Оценка использования Web-технологий в бизнесе 45
4.2 Создание сайта - эффективного инструмента маркетинга 47
4.2.1 Варианты доменного имени для сайта 47
4.2.2 Тип сайта для веб-представительства компании 49
4.2.3 Информационное наполнение сайта 50
4.3 Инструменты работы с аудиторией сайта 54
4.4 Мониторинг сайта 55
4.5 Продвижение и ценовая политика сайта 57
4.5.1 Медиаплан, ценовая политика 57
4.6 Выводы по главе 4 60
5 Заключение 61
6 БИБЛИОГРАФИЧЕСКИЙ СПИСОК 63
ВВЕДЕНИЕ 5
1 ПРОЦЕСС ИСПЫТАНИЯ АВТОМОБИЛЬНЫХ СБОРОК 8
1.1 Виды испытаний 8
1.2 Длительность испытаний 8
1.3 Постановка задачи 11
1.4 Выводы по главе 1 12
2 ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ
РЕШЕНИЯ РЕГРЕССИОННЫХ ЗАДАЧ 13
2.1 Регрессионные методы используемые в машинном обучении 13
2.1.1 Линейная регрессия 15
2.1.2 Случайный лес (Random fore st) 17
2.1.3 Экстра-деревья (Extra-Tree) 18
2.1.4 Градиентный бустинг 19
2.2 Выводы по главе 2 21
3 ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ
ПРОГНОЗИРОВАНИЯ ВРЕМЕНИ ИСПЫТАНИЙ АВТОМОБИЛЬНЫХ СБОРОК КОМПАНИИ МЕРСЕДЕС 22
3.1 Подготовка данных для подачи в модель машинного обучения 22
3.2 Метрика качества 28
3.4 Исследование эффективности построенной модели 30
3.5 Оптимизация гиперпараметров модели 35
3.5.1 Оптимизация параметров метода градиентного бустинга 35
3.5.2 Оптимизация параметров модели Экстра деревьев (Extra-Trees regresion) 38
3.6 Оптимизация взвешивания усреднения между моделями градиентного
бустинга и экстремальных деревьев 40
3.7 Выводы по главе 3 41
4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 43
4.1 Дорожная карта коммерциализации проекта 43
4.1.1 Планирование стратегии 44
4.1.2 Основные цели проекта 44
4.1.3 Источники доходов 45
4.1.4 Оценка использования Web-технологий в бизнесе 45
4.2 Создание сайта - эффективного инструмента маркетинга 47
4.2.1 Варианты доменного имени для сайта 47
4.2.2 Тип сайта для веб-представительства компании 49
4.2.3 Информационное наполнение сайта 50
4.3 Инструменты работы с аудиторией сайта 54
4.4 Мониторинг сайта 55
4.5 Продвижение и ценовая политика сайта 57
4.5.1 Медиаплан, ценовая политика 57
4.6 Выводы по главе 4 60
5 Заключение 61
6 БИБЛИОГРАФИЧЕСКИЙ СПИСОК 63
Актуальность темы
Безопасность и надежность - это решающий шаг в процессе производства автомобилей. Каждый новый дизайн автомобиля должен пройти тщательную оценку, прежде чем он войдет на потребительский рынок. Тестирование может занять много времени и потребовать больших затрат, так как полная проверка систем автомобиля требует подвергнуть автомобиль воздействию всех ситуаций, с которыми он столкнется в своем намеренном использовании. Прогнозирование общего времени прохождения испытания на испытания затруднено, потому что для каждой модели требуется другая конфигурация тестового стенда. Mercedes-Benz является первопроходцем многочисленных функций безопасности и технических характеристик транспортных средств и предлагает ряд индивидуальных вариантов для каждой модели. Каждая возможная комбинация транспортных средств должна проходить те же тщательные испытания, чтобы гарантировать, что автомобиль достаточно прочен, чтобы обеспечить безопасность пассажиров и выдерживать ежедневные нагрузки. Большой набор опций, предлагаемых Mercedes, - это большое количество тестов для инженеров компании. Увеличение количества тестов приводит к увеличению времени, затрачиваемого на стенд, увеличению затрат компании и производству углекислого газа, загрязняющего окружающую среду. Таким образом, компания довольно сильно заинтересована в решении данной проблемы, и работа является вполне актуальной на сегодняшний день.
В выпускной квалификационной работе описывается подход к решению проблемы испытания автомобильных сборок компании Мерседес. Минимизация издержек процесса без ущерба для качества очень важна для компании. На тестовом стенде автомобильные сборки проходят этап контроля качеста, очень важно на данном этапе выявить все недочеты, для гарантии безопастности и качества конечной продукции. Оптимальное время испытаний должно является уникальным для каждой автомобильной сборки. В случае отклонения от оптимального времени испытания в сторону уменьшения, появляется риск понижения точности испытаний, и как следствие снижения качества конечного продукта, в обратном же случае отклонения от оптимального времени испытания в сторону увеличения, увеличиваются издержки компании без повышения качества испытаний, что является недопустимым, а так же бесполезным. Исходя из этого, появилась потребность, в создании IT решения для оценки времени испытаний автомобильных сборок.
Мы представляем наши выводы из набора данных. Исследуем проблемы, с которыми сталкиваются из-за размера набора данных, типа записанных данных и алгоритмов машинного обучения, которые подходят для такого рода задач. В разделе I описан процесс испытания автомобильных сборок, факторы влияющие на время испытаний, в разделе II рассмотрены регрессионные методы используемые в машинном обучении, включая алгоритм линейная регрессия, случайный лес, экстра-деревьев, градиентный бустинг, а также метрика качества и процедура - кросс-валидация. В разделе III представлен набор данных и его предварительная обработка, исследование эффективности методов: линейная регрессия, случайный лес, экстра-деревьев, градиентный бустинг. В разделе IV будет рассмотрена коммерциализация проекта
Актуальность темы обусловлена необходимостью прогнозирования времени испытаний автомобильных сборок на примере компании Мерседес. Благодаря предоставленным данным, может быть построена более разумная система оценки времени испытаний, и сформирован более оптимальный план испытательных работ. Все это позволит снизить издержки в данном сегменте и увеличить прибыль
Основной целью работы является - Снижение затрат компании в области тестирования готовой продукции(автомобилей) без понижения качества испытаний.
Чтобы достичь поставленную цель, необходимо решить следующие задачи:
- проанализировать процесс испытания автомобильных сборок
- проанализировать виды испытаний, и зависимость длительности испытаний от всевозможных факторов
- проанализировать использование методов машинного обучения для решения регрессионных задач
- объяснить выбор использованных метрик качества и процедуры кроссвалидации;
- проанализировать предоставленный набор данных;
- провести предварительную обработку данных;
- исследовать эффективность методов машинного обучения для решения данной регрессионной задачи.
- спрогнозировать время испытаний автомобильных сборок на примере компании Мерседес
- разработать коммерциализацию проекта
Научной новизной является использование метода градиентного бустинга для прогнозирования времени испытаний автомобильных сборок
Практическая значимость - использование данного подхода позволяет снизить эксплуатационные расходы и увеличить прибыль производственных предприятий.
Безопасность и надежность - это решающий шаг в процессе производства автомобилей. Каждый новый дизайн автомобиля должен пройти тщательную оценку, прежде чем он войдет на потребительский рынок. Тестирование может занять много времени и потребовать больших затрат, так как полная проверка систем автомобиля требует подвергнуть автомобиль воздействию всех ситуаций, с которыми он столкнется в своем намеренном использовании. Прогнозирование общего времени прохождения испытания на испытания затруднено, потому что для каждой модели требуется другая конфигурация тестового стенда. Mercedes-Benz является первопроходцем многочисленных функций безопасности и технических характеристик транспортных средств и предлагает ряд индивидуальных вариантов для каждой модели. Каждая возможная комбинация транспортных средств должна проходить те же тщательные испытания, чтобы гарантировать, что автомобиль достаточно прочен, чтобы обеспечить безопасность пассажиров и выдерживать ежедневные нагрузки. Большой набор опций, предлагаемых Mercedes, - это большое количество тестов для инженеров компании. Увеличение количества тестов приводит к увеличению времени, затрачиваемого на стенд, увеличению затрат компании и производству углекислого газа, загрязняющего окружающую среду. Таким образом, компания довольно сильно заинтересована в решении данной проблемы, и работа является вполне актуальной на сегодняшний день.
В выпускной квалификационной работе описывается подход к решению проблемы испытания автомобильных сборок компании Мерседес. Минимизация издержек процесса без ущерба для качества очень важна для компании. На тестовом стенде автомобильные сборки проходят этап контроля качеста, очень важно на данном этапе выявить все недочеты, для гарантии безопастности и качества конечной продукции. Оптимальное время испытаний должно является уникальным для каждой автомобильной сборки. В случае отклонения от оптимального времени испытания в сторону уменьшения, появляется риск понижения точности испытаний, и как следствие снижения качества конечного продукта, в обратном же случае отклонения от оптимального времени испытания в сторону увеличения, увеличиваются издержки компании без повышения качества испытаний, что является недопустимым, а так же бесполезным. Исходя из этого, появилась потребность, в создании IT решения для оценки времени испытаний автомобильных сборок.
Мы представляем наши выводы из набора данных. Исследуем проблемы, с которыми сталкиваются из-за размера набора данных, типа записанных данных и алгоритмов машинного обучения, которые подходят для такого рода задач. В разделе I описан процесс испытания автомобильных сборок, факторы влияющие на время испытаний, в разделе II рассмотрены регрессионные методы используемые в машинном обучении, включая алгоритм линейная регрессия, случайный лес, экстра-деревьев, градиентный бустинг, а также метрика качества и процедура - кросс-валидация. В разделе III представлен набор данных и его предварительная обработка, исследование эффективности методов: линейная регрессия, случайный лес, экстра-деревьев, градиентный бустинг. В разделе IV будет рассмотрена коммерциализация проекта
Актуальность темы обусловлена необходимостью прогнозирования времени испытаний автомобильных сборок на примере компании Мерседес. Благодаря предоставленным данным, может быть построена более разумная система оценки времени испытаний, и сформирован более оптимальный план испытательных работ. Все это позволит снизить издержки в данном сегменте и увеличить прибыль
Основной целью работы является - Снижение затрат компании в области тестирования готовой продукции(автомобилей) без понижения качества испытаний.
Чтобы достичь поставленную цель, необходимо решить следующие задачи:
- проанализировать процесс испытания автомобильных сборок
- проанализировать виды испытаний, и зависимость длительности испытаний от всевозможных факторов
- проанализировать использование методов машинного обучения для решения регрессионных задач
- объяснить выбор использованных метрик качества и процедуры кроссвалидации;
- проанализировать предоставленный набор данных;
- провести предварительную обработку данных;
- исследовать эффективность методов машинного обучения для решения данной регрессионной задачи.
- спрогнозировать время испытаний автомобильных сборок на примере компании Мерседес
- разработать коммерциализацию проекта
Научной новизной является использование метода градиентного бустинга для прогнозирования времени испытаний автомобильных сборок
Практическая значимость - использование данного подхода позволяет снизить эксплуатационные расходы и увеличить прибыль производственных предприятий.
1. Мы рассмотрели процесс испытания автомобильных сборок. Это производственный процесс, в котором производится контроль качества выпускаемой продукции. Были рассмотрены факторы влияющие на время испытаний автомобильных сборок и методы снижения данного времени. Рассмотрены наиболее важные правила, которые необходимо учитывать при создании системы контроля качества. Исходя из исследования предметной области, мы пришли к выводу о том, что для решения задачи прогнозирования времени испытания автомобильных сборок эффективно использовать методы машинного обучения.
2. В выпускной квалификационной работе были изучены регрессионные методы прогнозирования времени испытания автомобильных сборок. Рассмотрены популярные алгоритмы, которые используются в машинном обучении для решения данных проблем, такие как линейная регрессия, случайный лес (Random forest), экстра-деревья (Extra-trees), градиентный бустинг (XGBoost). Проанализирована используемая метрика качества.
3. Была создана модель машинного обучения с использованием методов
- Экстремальных деревьев(Extra Tree)
- Градиентного бустинга (XGB)
Модель подошла к порогу конкурентной точности со значением коэфицента определения 0.55364.
4. Разработана коммерциализация проекта по этапам. Изначально была разработана дорожная карта коммерциализации данного проекта, которая подразумевает наглядное представление пошагового сценария развития, в которую входит - планирование стратегии, исходя из задач, для решения поставленной цели, описаны источники доходов по видам предоставляемых услуг и их стоимость в рублях. Проведена оценка потенциальных возможностей Интернета для бизнеса, в которой были рассмотрены: целевая аудитория, конкурентная среда и потенциальные партнеры. Также продемонстрирована таблица SWOT-анализа. По потенциальным возможностям Интернета было выбрано создать сайт по предоставлению услуги прогнозирования сбоев технологических линий другим компаниям. Для решения данной задачи первостепенным было принято решение выбора доменного имени для сайта, а также был выбран тип и информационное наполнение сайта. Следующим шагом был выбор инструментов для работы с аудиторией сайта. В табличном виде представлен мониторинг сайта. Описано продвижение и ценовая политика сайта. Разработан медиаплан, также продемонстрированный в табличном виде.
2. В выпускной квалификационной работе были изучены регрессионные методы прогнозирования времени испытания автомобильных сборок. Рассмотрены популярные алгоритмы, которые используются в машинном обучении для решения данных проблем, такие как линейная регрессия, случайный лес (Random forest), экстра-деревья (Extra-trees), градиентный бустинг (XGBoost). Проанализирована используемая метрика качества.
3. Была создана модель машинного обучения с использованием методов
- Экстремальных деревьев(Extra Tree)
- Градиентного бустинга (XGB)
Модель подошла к порогу конкурентной точности со значением коэфицента определения 0.55364.
4. Разработана коммерциализация проекта по этапам. Изначально была разработана дорожная карта коммерциализации данного проекта, которая подразумевает наглядное представление пошагового сценария развития, в которую входит - планирование стратегии, исходя из задач, для решения поставленной цели, описаны источники доходов по видам предоставляемых услуг и их стоимость в рублях. Проведена оценка потенциальных возможностей Интернета для бизнеса, в которой были рассмотрены: целевая аудитория, конкурентная среда и потенциальные партнеры. Также продемонстрирована таблица SWOT-анализа. По потенциальным возможностям Интернета было выбрано создать сайт по предоставлению услуги прогнозирования сбоев технологических линий другим компаниям. Для решения данной задачи первостепенным было принято решение выбора доменного имени для сайта, а также был выбран тип и информационное наполнение сайта. Следующим шагом был выбор инструментов для работы с аудиторией сайта. В табличном виде представлен мониторинг сайта. Описано продвижение и ценовая политика сайта. Разработан медиаплан, также продемонстрированный в табличном виде.





