🔍 Поиск готовых работ

🔍 Поиск работ

РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ СБОЕВ ТЕХНОЛОГИЧЕСКИХ ЛИНИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГРАДИЕНТНОГО БУСТИНГА НА ПРИМЕРЕ КОМПАНИИ BOSCH

Работа №202993

Тип работы

Дипломные работы, ВКР

Предмет

математические методы в экономике

Объем работы95
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
2
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 2
ВВЕДЕНИЕ 9
1. СБОИ, ВОЗНИКАЮЩИЕ ПРИ ПРОИЗВОДСТВЕ НА ТЕХНОЛОГИЧЕСКИХ ЛИНИЯХ 12
1.1 Архитектура производственных линий 12
1.1.1 Вариации в методологиях монтажной линии 14
1.2 Виды сбоев на производственных линиях 17
1.3 Мониторинг производства 20
1.4 Обзор работ 24
1.5 Постановка задачи 25
Выводы по главе 1 28
2. МЕТОДЫ КЛАССИФИКАЦИИ ПРОГНОЗИРОВАНИЯ СБОЕВ
ТЕХНОЛОГИЧЕСКИХ ЛИНИЙ 29
2.1 Методы классификации, используемые в машинном обучении .... 30
2.1.1 k Ближайших Соседей (k Nearest Neighbor) 32
2.1.2 Случайный лес (Random fore st) 33
2.1.3 Классификатор экстра-деревьев (Extra-Trees Classifier) 34
2.1.4 Градиентный бустинг (XGBoost) 35
2.1.5 Легкий градиентный бустинг (LightGBM) 37
2.2 Метрики качества 39
2.2.1 Метрика - ROC-AUC 39
2.2.2 Коэффициент корреляции Мэтьюса (MCC) 41
2.3 Процедура - Кросс-валидация 42
Выводы по главе 2 48
3. ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ КЛАССФИКАТОРОВ ДЛЯ ПРОГНОЗИРОВАНИЯ СБОЕВ ТЕХНОЛОГИЧЕСКИХ ЛИНИЙ НА ПРИМЕРЕ
ДАННЫХ КОМПАНИИ BOSCH 49
3.1 Набор данных 49
3.2 Предварительная обработка данных 51
3.3 Исследование эффективности методов машинного обучения 58
3.3.1 Исследование эффективности метода k Ближайших Соседей . ... 58
3.3.2 Исследование эффективности метода Случайных деревьев 60
3.3.3 Исследование эффективности метода Классификатор эктра-
деревьев 63
3.3.4 Исследование эффективности метода Градиентного бустинга .. 63
3.3.5 Исследование эффективности метода Легкого градиентного
бустинга 65
3.4 Обсуждение 67
Выводы по главе 3 75
4. КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 77
4.1 Дорожная карта коммерциализации проекта 77
4.1.1 Планирование стратегии: основные цели и источники доходов
проекта 77
4.1.2 Оценка потенциальных возможностей Интернета для бизнеса . 79
4.2 Создание сайта 81
4.3 Медиапланирование и ценовая политика сайта 90
Выводы по главе 4 93
ЗАКЛЮЧЕНИЕ 94
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 96


Машинное обучение является подполем искусственного интеллекта (ИИ). Цель машинного обучения, как правило, состоит в том, чтобы понять структуру данных и приспособить эти данные к моделям, которые могут быть поняты и использованы людьми. Хотя машинное обучение является областью компьютерных наук, оно отличается от традиционных вычислительных подходов. В традиционных вычислениях алгоритмы - это наборы явно запрограммированных инструкций, используемых компьютерами для вычисления или решения проблемы. Вместо этого алгоритмы машинного обучения позволяют компьютерам обучаться вводу данных и использовать статистический анализ для вывода значений, попадающих в определенный диапазон [17].
Машинное обучение - это постоянно развивающаяся область. В связи с этим необходимо учитывать некоторые соображения при работе с методиками или при анализе влияния процессов машинного обучения [49].
Умное производство рекламируется как следующая промышленная революция. Благодаря мониторингу производственных процессов в реальном времени для сохранения конкурентоспособности и повышения производительности, очевидным шагом, становится использование методов обработки больших данных.
Любой пользователь технологии, на сегодняшний день может извлечь выгоду из машинного обучения. Технология распознавания лиц позволяет правоохранительным органам оперативно распознавать и своевременно задерживать преступников. Автомобили с автоматическим управлением, которые полагаются на машинное обучение, могут вскоре стать доступными для потребителей. Также примером может послужить, компания оборонного производства Raytheon. Она внедрила MES (систему управления производством) на своем ракетном заводе в Хантсвилле, штат Алабама. Система позволяет собирать и анализировать данные о заводских цехах и позволяет определить с невероятной точностью, сколько раз необходимо ввернуть винт в критически важный компонент, чтобы этот компонент стал идеальным. Большие данные могут использоваться для прогнозирования частоты отказов оборудования, оптимизации управления запасами и определения приоритетов процессов. В 2012 году Intel сэкономила 3 миллиона долларов на производственных затратах за счет использования прогнозирующих аналитических методов для определения приоритетов проверок своих кремниевых чипов. Интеллектуальное производство - это следующая крупная разработка после хорошо отлаженных процессов бережливого производства и методологии Six Sigma. Следуя этой тенденции, Bosch записал свой набор данных, состоящий из анонимизированных записей измерений и испытаний, проведенных для каждого компонента на конвейере и предоставил возможность предсказать сбои деталей продукта, что позволило Bosch приносить качественные продукты по более низким ценам для конечного пользователя [2].
В выпускной квалификационной работе описывается подход к решению проблемы производительности технологической линии Bosch. Максимизация доходности производства лежит в основе обрабатывающей промышленности. На сборочной линии Bosch данные записываются для продуктов по мере их прохождения на каждом этапе. Методы обработки данных применяются к данному, огромному хранилищу данных, содержащему записи испытаний и измерений, выполненных для каждого компонента на конвейере для прогнозирования внутренних сбоев. Было обнаружено, что можно обучить модель, которая предсказывает, какие части, скорее всего, выйдут из строя [2].
Представляем выводы из набора данных. Исследуем проблемы, с которыми сталкиваются из-за размера набора данных, типа записанных данных и алгоритмов машинного обучения, которые подходят для такого рода задач. В разделе I описаны архитектура и сбои, возникающие при производстве на технологичских линиях, мониторинг производства, в разделе II рассмотрены методы классификации используемы в машинном обучении для прогнозирования сбоев технологических линий, включая алгоритм k ближайших соседей, случайный лес, классификатор экстра-деревьев, градиентный бустинг и легкий градиентный бустинг, а также метрики качества и процедура - кросс-валидация. В разделе III представлен набор данных и его предварительная обработка, исследование эффективности методов: k ближайших соседей, случайного леса, классификатора экстра-деревьев, градиентного бустинга и легкого градиентного бустинга. В обсуждение проводится подробный анализ прогнозирования сбоев технологических линий на примере данных компании BOSCH и подведены итоги в сравнении всех методов. В разделе IV будет рассмотрена коммерциализация проекта.
Актуальность темы обусловлена необходимостью прогнозирования сбоев технологических линий на примере данных компании Bosch. Благодаря предоставленным данным, может быть построена более разумная система обнаружения сбоев, и выделены части, помеченные с вероятностью выхода из строя. Все это позволит снизить эксплуатационные расходы и увеличить прибыль.
Основной целью работы является - снижение эксплуатационных расходов и увеличение прибыли предприятия на примере компании Bosch посредством прогнозирования сбоев технологических линий.
Чтобы достичь поставленную цель, необходимо решить следующие задачи:
- проанализировать архитектуру производственных линий;
- проанализировать виды сбоев, возникающих при производстве на технологических линиях;
- проанализировать методы классификации прогнозирования сбоев технологических линий;
- объяснить выбор использованных метрик качества и процедуры кроссвалидации;
- проанализировать предоставленный набор данных;
- провести предварительную обработку данных;
- исследовать эффективность классификаторов для прогнозирования сбоев технологических линий;
- спрогнозировать сбои, на примере данных компании Bosch и сравнить результаты;
- разработать коммерциализацию проекта.
Научной новизной является использование метода градиентного бустинга для прогнозирования сбоев технологических линий.
Практическая значимость - использование данного подхода позволяет снизить эксплуатационные расходы и увеличить прибыль производственных предприятий.
Апробации работы:
1. Лайко С.А., WEB-ресурс как способ продвижения предприятия / С.А. Лай- ко, А.А. Тютёва // Научные исследования: теория, методика и практика: материалы III Междунар. науч.-практ. конф. (Чебоксары, 19 нояб. 2017 г.). В 2 т. Т. 2 / редкол.: О.Н. Широков [и др.] - Чебоксары: ЦНС «Интерактив плюс», 2017. - С. 258-260. - ISBN 978-5-6040208-7-6;
2. Лайко С.А., Оценка эффективности технологических цепочек производственных предприятий / С.А. Лайко, А.А. Тютёва // Образование и наука в современных реалиях: материалы IV Междунар. науч.-практ. конф. (Чебоксары, 26 февр. 2018 г.) / редкол.: О.Н. Широков [и др.] - Чебоксары: ЦНС «Интерактив плюс», 2018. - С. 209-210. - ISBN 978-5-6040732-7-8;
3. Участие в международном конкурсе: SMS Data Challenge 2.0 Data Analytics - Improved Sticker Detection based on Fiber Optical Temperature Measurement. - 2017.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


1. В ходе исследования предметной области были изучена интеллектуальные производственные линии их архитектура, мониторинг производства и виды сбоев, возникающих при производстве. Которая предоставила возможность компании BOSCH реализовать сбор больших данных на своем производстве. Это позволило собрать и оценить данные для проверки качества в производстве при управлении технологической линией. Также в работе отмечена важность использования именно методов машинного обучения для прогнозирования сбоев, возникающих при производстве на технологической линии.
2. В выпускной квалификационной работе были изучены методы классификации прогнозирования сбоев технологических линий. Рассмотрены популярные алгоритмы, которые используются в машинном обучении для решения данных проблем, такие как k ближайших соседей (k Nearest Neighbor), случайный лес (Random forest), классификатор экстра-деревьев (Extra-trees classifier), градиентный бустинг (XGBoost) и легкий градиентный бустинг (LightGBM). Проанализированы используемые метрики качества и процедура кросс-валидации. Но для того чтобы понять в пользу какого алгоритма сделать выбор, который будет наилучшим для решения данной задачи, стоило разобраться в предоставленных данных и задачах, которые нужно решить.
3. Была раскрыта тема проекта и ее цель, которая подразумевает прогнозирование того, какие части не пройдут контроль качества (представленные в виде: «Ответ» = 1). Показано описание набора данных предоставленных компанией Bosch, продемонстрированных в виде табличных данных на рисунке. В связи с тем, что данных огромное количество необходимо было первостепенно произвести отчистку (предварительную обработку) данных. Все данные по итогу были разбиты на категориальные, числовые и особенности даты. Были проведены исследования эффективности методов машинного обучения: k ближайших соседей (k Nearest Neighbor), случайный лес (Random forest), классификатор экстрадеревьев (Extra-trees classifier), градиентный бустинг (XGBoost) и легкий градиентный бустинг (LightGBM). Исходя из исследований эффективности методов и набора данных, был сделан выбор в пользу метода градиентного бустинга XGBoost с описанием преимуществ, в сравнении с другими методами. Следующим шагом был выбор признаков и оптимизация параметров модели таких, как: ETA и MaxDepth. Также не маловажную роль в измерении производительности задачи классификации при различных настройках порогов является кривая AUC- ROC. При заданных параметрах был получен тренинг AUC 0,718 0,001, что является хорошей базовой моделью, но имеет еще возможности для улучшения.
4. Разработана коммерциализация проекта по этапам. Изначально была разработана дорожная карта коммерциализации данного проекта, которая подразумевает наглядное представление пошагового сценария развития, в которую входит - планирование стратегии, исходя из задач, для решения поставленной цели, описаны источники доходов по видам предоставляемых услуг и их стоимость в рублях. Проведена оценка потенциальных возможностей Интернета для бизнеса, в которой были рассмотрены: целевая аудитория, конкурентная среда и потенциальные партнеры. Также продемонстрирована таблица SWOT-анализа. По потенциальным возможностям Интернета было выбрано создать сайт по предоставлению услуги прогнозирования сбоев технологических линий другим компаниям. Для решения данной задачи первостепенным было принято решение выбора доменного имени для сайта, а также был выбран тип и информационное наполнение сайта. Следующим шагом был выбор инструментов для работы с аудиторией сайта. В табличном виде представлен мониторинг сайта. Описано продвижение и ценовая политика сайта. Разработан медиаплан, также продемонстрированный в табличном виде.



1. Abraham, A. and Grosan, C. 2005. Genetic programming approach for fault modeling of electronic hardware. In IEEE Proceedings Congress on Evolutionary Computation (CEC’05). Vol. 2. Edinburgh, UK, 1563-1569.
2. Aitchison, J. and Dunsmore, I. R. 1975. Statistical Prediction Analysis. Cambridge University Press.
3. Ankita Mangal, Elizabeth A. Holm, "Applied Machine Learning to Predict Stress Hotspots I: Face Centered Cubic Materials", International Journal of Plasticity, 2018.
4. Ankita Mangal, Elizabeth A. Holm, "Applied Machine Learning to Predict Stress Hotspots II: Hexagonal close packed materials", International Journal of Plasticity, 2018.
5. B. W. Matthews, “Comparison of the predicted and observed secondary structure of T4 phage lysozyme,” Biochimica et Biophysica Acta (BBA)-Protein Struc- ture, vol. 405, no. 2, pp. 442-451, 1975.
6. Basseville, M. and Nikiforov, I. 1993. Detection of abrupt changes: theory and application. Prentice Hall.
7. Blischke, W. R. and Murthy, D. N. P. 2000. Reliability: Modeling, Prediction, and Optimization. Probability and Statistics. John Wiley and Sons.
8. Cavafy, C. P. 1992. But the wise perceive things about to happen. In Collected Poems, G. Savidis, Ed. Princeton University Press.
9. Chen, T. and Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22Nd ACM SIGKDD International Conference on Knowl- edge Discovery and Data Mining, KDD ’16, pages 785-794, New York, NY, USA. ACM.
10. Cleveland, W. et al. 1979. Robust locally weighted regression and smoothing scatterplots. Journal of the American Statistical Association 74, 368, 829-836.
11. Coleman, D. and Thompson, C. 2005. Model Based Automation and Management for the Adaptive Enterprise. In Proceedings of the 12th Annual Workshop of HP OpenView University Association. 171-184.
Cover, T. Hart, P, “Nearest Neighbor Pattern Classification”, IEEE
Transaction on Information Theory, vol. 13, pp. 21-27, 1967.
13. Croci, F., M. Perona, and A. Pozzetti. "Work Force Management in Automated Assembly Systems." International Journal of Production Economics. 1 March 2000.
14. Crowell, J., Shereshevsky, M., and Cukic, B. 2002. Using fractal analysis to model software aging. Tech. rep., West Virginia University, Lane Department of CSEE, Morgantown, WV. May.
15. Denson, W. 1998. The history of reliability prediction. IEEE Transactions on Reliability 47, 3 (Sep.), 321-328...57


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ